local-llm-server/llm_server/workers/printer.py

import logging
import time

from llm_server.cluster.cluster_config import cluster_config
from llm_server.custom_redis import redis
from llm_server.routes.queue import priority_queue

logger = logging.getLogger('console_printer')
if not logger.handlers:
    handler = logging.StreamHandler()
    handler.setLevel(logging.INFO)
    logger.setLevel(logging.INFO)
    formatter = logging.Formatter("%(asctime)s: %(levelname)s:%(name)s - %(message)s")
    handler.setFormatter(formatter)
    logger.addHandler(handler)


def console_printer():
    time.sleep(3)
    while True:
        processing = redis.keys('active_gen_workers:http*')  # backends always start with http
        processing_count = 0
        if len(processing):
            for k in processing:
                processing_count += redis.get(k, default=0, dtype=int)
        backends = [k for k, v in cluster_config.all().items() if v['online']]
        activity = priority_queue.activity()

        # Active Workers and Processing should read the same. If not, that's an issue.
        logger.info(f'REQUEST QUEUE -> Active Workers: {len([i for i in activity if i[1]])} | Processing: {processing_count} | Queued: {len(priority_queue)} | Backends Online: {len(backends)}')
        time.sleep(2)
add ratelimiting to websocket streaming endpoint, fix queue not decrementing IP requests, add console printer 2023-09-27 21:15:54 -06:00			`import logging`
			`import time`

functional 2023-09-30 19:41:50 -06:00			`from llm_server.cluster.cluster_config import cluster_config`
set up cluster config and basic background workers 2023-09-28 18:40:24 -06:00			`from llm_server.custom_redis import redis`
rewrite redis usage 2023-09-28 03:44:30 -06:00			`from llm_server.routes.queue import priority_queue`
add ratelimiting to websocket streaming endpoint, fix queue not decrementing IP requests, add console printer 2023-09-27 21:15:54 -06:00
fix duplicate logging from console printer thread 2023-09-27 21:28:25 -06:00			`logger = logging.getLogger('console_printer')`
			`if not logger.handlers:`
add ratelimiting to websocket streaming endpoint, fix queue not decrementing IP requests, add console printer 2023-09-27 21:15:54 -06:00			`handler = logging.StreamHandler()`
			`handler.setLevel(logging.INFO)`
			`logger.setLevel(logging.INFO)`
			`formatter = logging.Formatter("%(asctime)s: %(levelname)s:%(name)s - %(message)s")`
			`handler.setFormatter(formatter)`
			`logger.addHandler(handler)`

fix duplicate logging from console printer thread 2023-09-27 21:28:25 -06:00
			`def console_printer():`
redo background processes, reorganize server.py 2023-09-27 23:36:44 -06:00			`time.sleep(3)`
fix duplicate logging from console printer thread 2023-09-27 21:28:25 -06:00			`while True:`
functional 2023-09-30 19:41:50 -06:00			`processing = redis.keys('active_gen_workers:http*') # backends always start with http`
rewrite redis usage 2023-09-28 03:44:30 -06:00			`processing_count = 0`
functional 2023-09-30 19:41:50 -06:00			`if len(processing):`
			`for k in processing:`
			`processing_count += redis.get(k, default=0, dtype=int)`
			`backends = [k for k, v in cluster_config.all().items() if v['online']]`
fix issues with queue and streaming 2023-10-15 20:45:01 -06:00			`activity = priority_queue.activity()`
remove debug print 2023-10-15 20:46:32 -06:00
remove timed-out items from queue 2023-10-17 11:46:39 -06:00			`# Active Workers and Processing should read the same. If not, that's an issue.`
fix issues with queue and streaming 2023-10-15 20:45:01 -06:00			`logger.info(f'REQUEST QUEUE -> Active Workers: {len([i for i in activity if i[1]])} \| Processing: {processing_count} \| Queued: {len(priority_queue)} \| Backends Online: {len(backends)}')`
refer to queue for tracking IP count rather than seperate value 2023-10-18 09:03:10 -06:00			`time.sleep(2)`