Simplify two ipex conditions (#2755)

2024-11-19 08:04:23 +01:00 · 2024-11-19 08:04:23 +01:00 · b4ec427ad0
parent 38cff84a3e
commit b4ec427ad0
2 changed files with 6 additions and 6 deletions
--- a/server/text_generation_server/layers/moe/unquantized.py
+++ b/server/text_generation_server/layers/moe/unquantized.py
@ -8,10 +8,10 @@ from text_generation_server.utils.weights import UnquantizedWeight, Weights
 if SYSTEM == "rocm":
    from vllm.model_executor.layers.fused_moe import fused_moe
-elif SYSTEM != "ipex":
+elif SYSTEM == "ipex":
    from moe_kernels.fused_moe import fused_moe
 else:
    from intel_extension_for_pytorch.llm.modules import GatedMLPMOE
 else:
    from moe_kernels.fused_moe import fused_moe
 class UnquantizedSparseMoELayer(nn.Module):
--- a/server/text_generation_server/models/custom_modeling/flash_dbrx_modeling.py
+++ b/server/text_generation_server/models/custom_modeling/flash_dbrx_modeling.py
@ -25,10 +25,10 @@ from text_generation_server.utils.import_utils import SYSTEM
 if SYSTEM == "rocm":
    from vllm.model_executor.layers.fused_moe import fused_moe
-elif SYSTEM != "ipex":
+elif SYSTEM == "ipex":
    from moe_kernels.fused_moe import fused_moe
 else:
    from intel_extension_for_pytorch.llm.modules import GatedMLPMOE
 else:
    from moe_kernels.fused_moe import fused_moe
 from text_generation_server.layers.attention import (
    paged_attention,