local-llm-server/llm_server/routes/v1/info.py

import time

from flask import jsonify, request

from llm_server.custom_redis import flask_cache
from . import bp
from ... import opts
from ...cluster.backend import get_backends_from_model, is_valid_model
from ...cluster.cluster_config import cluster_config, get_a_cluster_backend


@bp.route('/v1/model', methods=['GET'])
@bp.route('/<model_name>/v1/model', methods=['GET'])
def get_model(model_name=None):
    # We will manage caching ourself since we don't want to cache
    # when the backend is down. Also, Cloudflare won't cache 500 errors.
    cache_key = 'model_cache::' + request.url
    cached_response = flask_cache.get(cache_key)

    if cached_response:
        return cached_response

    if not model_name:
        model_name = cluster_config.get_backend(get_a_cluster_backend()).get('model')

    if not is_valid_model(model_name):
        response = jsonify({
            'code': 400,
            'msg': 'Model does not exist.',
        }), 400
    else:
        num_backends = len(get_backends_from_model(model_name))
        response = jsonify({
            'result': opts.manual_model_name if opts.manual_model_name else model_name,
            'model_backend_count': num_backends,
            'timestamp': int(time.time())
        }), 200
        flask_cache.set(cache_key, response, timeout=60)

    return response
MVP 2023-08-21 21:28:52 -06:00			`import time`

do caching ourself on /model 2023-08-23 16:40:20 -06:00			`from flask import jsonify, request`
MVP 2023-08-21 21:28:52 -06:00
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`from llm_server.custom_redis import flask_cache`
MVP 2023-08-21 21:28:52 -06:00			`from . import bp`
fix invalid param error, add manual model name 2023-09-12 10:30:45 -06:00			`from ... import opts`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`from ...cluster.backend import get_backends_from_model, is_valid_model`
			`from ...cluster.cluster_config import cluster_config, get_a_cluster_backend`
MVP 2023-08-21 21:28:52 -06:00

Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`@bp.route('/v1/model', methods=['GET'])`
			`@bp.route('/<model_name>/v1/model', methods=['GET'])`
			`def get_model(model_name=None):`
do caching ourself on /model 2023-08-23 16:40:20 -06:00			`# We will manage caching ourself since we don't want to cache`
			`# when the backend is down. Also, Cloudflare won't cache 500 errors.`
			`cache_key = 'model_cache::' + request.url`
more work on openai endpoint 2023-09-26 22:09:11 -06:00			`cached_response = flask_cache.get(cache_key)`
do caching ourself on /model 2023-08-23 16:40:20 -06:00
			`if cached_response:`
			`return cached_response`

fix invalid param error, add manual model name 2023-09-12 10:30:45 -06:00			`if not model_name:`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`model_name = cluster_config.get_backend(get_a_cluster_backend()).get('model')`

			`if not is_valid_model(model_name):`
do caching ourself on /model 2023-08-23 16:40:20 -06:00			`response = jsonify({`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`'code': 400,`
			`'msg': 'Model does not exist.',`
			`}), 400`
minor adjustments 2023-08-21 22:49:44 -06:00			`else:`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`num_backends = len(get_backends_from_model(model_name))`
actually we don't want to emulate openai 2023-09-12 01:04:11 -06:00			`response = jsonify({`
fix invalid param error, add manual model name 2023-09-12 10:30:45 -06:00			`'result': opts.manual_model_name if opts.manual_model_name else model_name,`
Merge cluster to master (#3) Co-authored-by: Cyberes <cyberes@evulid.cc> Reviewed-on: https://git.evulid.cc/cyberes/local-llm-server/pulls/3 2023-10-27 19:19:22 -06:00			`'model_backend_count': num_backends,`
actually we don't want to emulate openai 2023-09-12 01:04:11 -06:00			`'timestamp': int(time.time())`
			`}), 200`
more work on openai endpoint 2023-09-26 22:09:11 -06:00			`flask_cache.set(cache_key, response, timeout=60)`
do caching ourself on /model 2023-08-23 16:40:20 -06:00
			`return response`