local-llm-server/llm_server/llm/vllm/tokenize.py

import traceback

import requests
import tiktoken

from llm_server import opts

tokenizer = tiktoken.get_encoding("cl100k_base")


def tokenize(prompt: str) -> int:
    if not prompt:
        # The tokenizers have issues when the prompt is None.
        return 0
    try:
        r = requests.post(f'{opts.backend_url}/tokenize', json={'input': prompt}, verify=opts.verify_ssl, timeout=opts.backend_generate_request_timeout)
        j = r.json()
        return j['length']
    except:
        traceback.print_exc()
        return len(tokenizer.encode(prompt)) + 10
port to mysql, use vllm tokenizer endpoint 2023-09-20 20:30:31 -06:00			`import traceback`

			`import requests`
			`import tiktoken`

			`from llm_server import opts`

			`tokenizer = tiktoken.get_encoding("cl100k_base")`


			`def tokenize(prompt: str) -> int:`
update database, tokenizer handle null prompt, convert top_p to vllm on openai, actually validate prompt on streaming, 2023-09-25 22:32:48 -06:00			`if not prompt:`
			`# The tokenizers have issues when the prompt is None.`
			`return 0`
port to mysql, use vllm tokenizer endpoint 2023-09-20 20:30:31 -06:00			`try:`
			`r = requests.post(f'{opts.backend_url}/tokenize', json={'input': prompt}, verify=opts.verify_ssl, timeout=opts.backend_generate_request_timeout)`
			`j = r.json()`
			`return j['length']`
			`except:`
fix background log not doing anything 2023-09-25 18:18:29 -06:00			`traceback.print_exc()`
port to mysql, use vllm tokenizer endpoint 2023-09-20 20:30:31 -06:00			`return len(tokenizer.encode(prompt)) + 10`