local-llm-server/llm_server/routes/v1/proxy.py

import time
from datetime import datetime

from flask import jsonify, request

from llm_server import opts
from llm_server.routes.v1.generate import concurrent_semaphore
from . import bp
from .. import stats
from ..cache import cache
from ..helpers.http import cache_control
from ..stats import SemaphoreCheckerThread
from ...llm.info import get_running_model


@bp.route('/stats', methods=['GET'])
@cache.cached(timeout=5, query_string=True)
def get_stats():
    model_list = get_running_model()  # will return False when the fetch fails
    if isinstance(model_list, bool):
        online = False
    else:
        online = True

    return jsonify({
        'stats': {
            'proompters_now': opts.concurrent_gens - concurrent_semaphore._value,
            'proompters_1_min': SemaphoreCheckerThread.proompters_1_min,
            'total_proompts': stats.get_count(),
            'uptime': int((datetime.now() - stats.start_time).total_seconds()),
        },
        'online': online,
        'mode': opts.mode,
        'model': get_running_model(),
        'endpoints': {
            'blocking': f'https://{request.headers.get("Host")}/{opts.frontend_api_client.strip("/")}',
        },
        'timestamp': int(time.time()),
        'openaiKeys': '∞',
        'anthropicKeys': '∞',
        'config': {
            'gatekeeper': 'none' if opts.auth_required is False else 'token',
            'context_size': opts.context_size,
        }
    }), 200
MVP 2023-08-21 21:28:52 -06:00			`import time`
			`from datetime import datetime`

more proxy stats 2023-08-22 16:50:49 -06:00			`from flask import jsonify, request`
MVP 2023-08-21 21:28:52 -06:00
			`from llm_server import opts`
stats: prompters 1 min 2023-08-21 23:48:06 -06:00			`from llm_server.routes.v1.generate import concurrent_semaphore`
MVP 2023-08-21 21:28:52 -06:00			`from . import bp`
			`from .. import stats`
cache again 2023-08-22 23:14:56 -06:00			`from ..cache import cache`
			`from ..helpers.http import cache_control`
fix proompters_1_min again 2023-08-22 23:01:09 -06:00			`from ..stats import SemaphoreCheckerThread`
prototype hf-textgen and adjust logging 2023-08-22 19:58:31 -06:00			`from ...llm.info import get_running_model`
MVP 2023-08-21 21:28:52 -06:00

			`@bp.route('/stats', methods=['GET'])`
cache again 2023-08-22 23:14:56 -06:00			`@cache.cached(timeout=5, query_string=True)`
MVP 2023-08-21 21:28:52 -06:00			`def get_stats():`
rename, more stats 2023-08-22 20:42:38 -06:00			`model_list = get_running_model() # will return False when the fetch fails`
concurrent gens setting, online status 2023-08-22 00:26:46 -06:00			`if isinstance(model_list, bool):`
			`online = False`
			`else:`
			`online = True`

MVP 2023-08-21 21:28:52 -06:00			`return jsonify({`
rename, more stats 2023-08-22 20:42:38 -06:00			`'stats': {`
			`'proompters_now': opts.concurrent_gens - concurrent_semaphore._value,`
fix proompters_1_min again 2023-08-22 23:01:09 -06:00			`'proompters_1_min': SemaphoreCheckerThread.proompters_1_min,`
fix stats for real 2023-08-23 01:14:19 -06:00			`'total_proompts': stats.get_count(),`
rename, more stats 2023-08-22 20:42:38 -06:00			`'uptime': int((datetime.now() - stats.start_time).total_seconds()),`
			`},`
concurrent gens setting, online status 2023-08-22 00:26:46 -06:00			`'online': online,`
add mode to stats 2023-08-22 16:41:55 -06:00			`'mode': opts.mode,`
more proxy stats 2023-08-22 16:50:49 -06:00			`'model': get_running_model(),`
rename, more stats 2023-08-22 20:42:38 -06:00			`'endpoints': {`
			`'blocking': f'https://{request.headers.get("Host")}/{opts.frontend_api_client.strip("/")}',`
			`},`
			`'timestamp': int(time.time()),`
			`'openaiKeys': '∞',`
			`'anthropicKeys': '∞',`
			`'config': {`
			`'gatekeeper': 'none' if opts.auth_required is False else 'token',`
			`'context_size': opts.context_size,`
			`}`
MVP 2023-08-21 21:28:52 -06:00			`}), 200`