hf_text-generation-inference

History

OlivierDehaene 042180d88f fix(server): Only pad to multiple of 8 on GPUs		2022-12-08 19:37:37 +01:00
..
models	fix(server): Only pad to multiple of 8 on GPUs	2022-12-08 19:37:37 +01:00
pb	feat(server): Support all AutoModelForCausalLM on a best effort basis	2022-10-28 19:24:00 +02:00
__init__.py	feat(server): Support all AutoModelForCausalLM on a best effort basis	2022-10-28 19:24:00 +02:00
cache.py	feat(server): Support AutoModelForSeq2SeqLM	2022-11-04 18:03:04 +01:00
cli.py	feat(server): Support all AutoModelForCausalLM on a best effort basis	2022-10-28 19:24:00 +02:00
server.py	feat(server): Support AutoModelForSeq2SeqLM	2022-11-04 18:03:04 +01:00
utils.py	feat(server): Add model tests (#6 )	2022-12-08 18:49:33 +01:00