local-llm-server/llm_server/llm/info.py

import requests

from llm_server import opts


def get_running_model():
    if opts.mode == 'oobabooga':
        try:
            backend_response = requests.get(f'{opts.backend_url}/api/v1/model', timeout=3)
        except Exception as e:
            return False, e
        try:
            r_json = backend_response.json()
            return r_json['result']
        except Exception as e:
            return False, e
    elif opts.mode == 'hf-textgen':
        try:
            backend_response = requests.get(f'{opts.backend_url}/info')
        except Exception as e:
            return False, e
        try:
            r_json = backend_response.json()
            return r_json['model_id'].replace('/', '_')
        except Exception as e:
            return False, e
    else:
        raise Exception
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`import requests`

			`from llm_server import opts`


			`def get_running_model():`
			`if opts.mode == 'oobabooga':`
			`try:`
model info timeout and additional info 2023-08-23 16:07:43 -06:00			`backend_response = requests.get(f'{opts.backend_url}/api/v1/model', timeout=3)`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`except Exception as e:`
print fetch model error message 2023-08-23 16:02:57 -06:00			`return False, e`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`try:`
			`r_json = backend_response.json()`
			`return r_json['result']`
			`except Exception as e:`
print fetch model error message 2023-08-23 16:02:57 -06:00			`return False, e`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`elif opts.mode == 'hf-textgen':`
			`try:`
			`backend_response = requests.get(f'{opts.backend_url}/info')`
			`except Exception as e:`
print fetch model error message 2023-08-23 16:02:57 -06:00			`return False, e`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`try:`
			`r_json = backend_response.json()`
			`return r_json['model_id'].replace('/', '_')`
			`except Exception as e:`
print fetch model error message 2023-08-23 16:02:57 -06:00			`return False, e`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`else:`
			`raise Exception`