hf_text-generation-inference

mirror of https://github.com/huggingface/text-generation-inference.git

History

Mohit Sharma 8f66d323d0 Update vllm kernels for ROCM (#2826 ) * (vllm) updated vllm rocm kernels * revert silu * update partition size * remove grouped_topk * (nit) remove log * update moe-kernels commit		2024-12-18 12:44:42 +01:00
..
__init__.py	Update vllm kernels for ROCM (#2826 )	2024-12-18 12:44:42 +01:00
gptq_marlin.py	Add support for fused MoE Marlin for AWQ (#2616 )	2024-10-08 11:56:41 +02:00
unquantized.py	Update vllm kernels for ROCM (#2826 )	2024-12-18 12:44:42 +01:00