hf_text-generation-inference/server/text_generation_server/models/flash_mixtral.py

import torch

from typing import Optional

from text_generation_server.models.flash_mistral import BaseFlashMistral
from text_generation_server.models.custom_modeling.flash_mixtral_modeling import MixtralConfig, FlashMixtralForCausalLM


class FlashMixtral(BaseFlashMistral):
    def __init__(
            self,
            model_id: str,
            revision: Optional[str] = None,
            quantize: Optional[str] = None,
            dtype: Optional[torch.dtype] = None,
            trust_remote_code: bool = False,
    ):
        super(FlashMixtral, self).__init__(
            config_cls=MixtralConfig,
            model_cls=FlashMixtralForCausalLM,
            model_id=model_id,
            revision=revision,
            quantize=quantize,
            dtype=dtype,
            trust_remote_code=trust_remote_code
        )
feat: mixtral (#1328) 2023-12-11 06:43:40 -07:00			`import torch`

			`from typing import Optional`

			`from text_generation_server.models.flash_mistral import BaseFlashMistral`
			`from text_generation_server.models.custom_modeling.flash_mixtral_modeling import MixtralConfig, FlashMixtralForCausalLM`


			`class FlashMixtral(BaseFlashMistral):`
			`def __init__(`
			`self,`
			`model_id: str,`
			`revision: Optional[str] = None,`
			`quantize: Optional[str] = None,`
			`dtype: Optional[torch.dtype] = None,`
			`trust_remote_code: bool = False,`
			`):`
			`super(FlashMixtral, self).__init__(`
			`config_cls=MixtralConfig,`
			`model_cls=FlashMixtralForCausalLM,`
			`model_id=model_id,`
			`revision=revision,`
			`quantize=quantize,`
			`dtype=dtype,`
			`trust_remote_code=trust_remote_code`
			`)`