local-llm-server/llm_server/llm/info.py

import requests

from llm_server import opts


def get_running_model(backend_url: str, mode: str):
    if mode == 'ooba':
        try:
            backend_response = requests.get(f'{backend_url}/api/v1/model', timeout=opts.backend_request_timeout, verify=opts.verify_ssl)
            r_json = backend_response.json()
            return r_json['result'], None
        except Exception as e:
            return False, e
    elif mode == 'vllm':
        try:
            backend_response = requests.get(f'{backend_url}/model', timeout=opts.backend_request_timeout, verify=opts.verify_ssl)
            r_json = backend_response.json()
            return r_json['model'], None
        except Exception as e:
            return False, e
    else:
        raise Exception


def get_info(backend_url: str, mode: str):
    if mode == 'ooba':
        return {}
        # raise NotImplementedError
    elif mode == 'vllm':
        try:
            r = requests.get(f'{backend_url}/info', verify=opts.verify_ssl, timeout=opts.backend_request_timeout)
            j = r.json()
        except Exception as e:
            return {}
        return j
    else:
        raise Exception
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`import requests`

			`from llm_server import opts`
actually we don't want to emulate openai 2023-09-12 01:04:11 -06:00
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`def get_running_model(backend_url: str, mode: str):`
			`if mode == 'ooba':`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`try:`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`backend_response = requests.get(f'{backend_url}/api/v1/model', timeout=opts.backend_request_timeout, verify=opts.verify_ssl)`
get working with ooba again, give up on dockerfile 2023-09-11 09:51:01 -06:00			`r_json = backend_response.json()`
			`return r_json['result'], None`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`except Exception as e:`
print fetch model error message 2023-08-23 16:02:57 -06:00			`return False, e`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`elif mode == 'vllm':`
implement vllm backend 2023-09-11 20:47:19 -06:00			`try:`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`backend_response = requests.get(f'{backend_url}/model', timeout=opts.backend_request_timeout, verify=opts.verify_ssl)`
implement vllm backend 2023-09-11 20:47:19 -06:00			`r_json = backend_response.json()`
actually we don't want to emulate openai 2023-09-12 01:04:11 -06:00			`return r_json['model'], None`
implement vllm backend 2023-09-11 20:47:19 -06:00			`except Exception as e:`
			`return False, e`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`else:`
			`raise Exception`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00

			`def get_info(backend_url: str, mode: str):`
			`if mode == 'ooba':`
			`return {}`
			`# raise NotImplementedError`
			`elif mode == 'vllm':`
			`try:`
			`r = requests.get(f'{backend_url}/info', verify=opts.verify_ssl, timeout=opts.backend_request_timeout)`
			`j = r.json()`
			`except Exception as e:`
			`return {}`
			`return j`
			`else:`
			`raise Exception`