hf_text-generation-inference/server/text_generation/models/model.py

import torch

from abc import ABC, abstractmethod
from typing import List, Tuple, Optional, TypeVar, Type
from tokenizers import Tokenizer

from text_generation.models.types import Batch, GeneratedText

B = TypeVar("B", bound=Batch)


class Model(ABC):
    def __init__(self, tokenizer: Tokenizer, num_heads: int, device: torch.device):
        self.tokenizer = tokenizer
        self.num_heads = num_heads
        self.device = device

    @property
    @abstractmethod
    def batch_type(self) -> Type[B]:
        raise NotImplementedError

    @abstractmethod
    def generate_token(self, batch: B) -> Tuple[List[GeneratedText], Optional[B]]:
        raise NotImplementedError
feat(server): Support generic AutoModelForCausalLM 2022-11-04 07:22:47 -06:00			`import torch`

fix(models): Revert buggy support for AutoModel 2022-11-03 09:07:54 -06:00			`from abc import ABC, abstractmethod`
feat(server): Support AutoModelForSeq2SeqLM 2022-11-04 11:03:04 -06:00			`from typing import List, Tuple, Optional, TypeVar, Type`
feat(server): Support generic AutoModelForCausalLM 2022-11-04 07:22:47 -06:00			`from tokenizers import Tokenizer`
feat(server): Support all AutoModelForCausalLM on a best effort basis 2022-10-28 11:24:00 -06:00
			`from text_generation.models.types import Batch, GeneratedText`

feat(server): Support AutoModelForSeq2SeqLM 2022-11-04 11:03:04 -06:00			`B = TypeVar("B", bound=Batch)`

feat(server): Support all AutoModelForCausalLM on a best effort basis 2022-10-28 11:24:00 -06:00
fix(models): Revert buggy support for AutoModel 2022-11-03 09:07:54 -06:00			`class Model(ABC):`
feat(server): Support generic AutoModelForCausalLM 2022-11-04 07:22:47 -06:00			`def __init__(self, tokenizer: Tokenizer, num_heads: int, device: torch.device):`
			`self.tokenizer = tokenizer`
			`self.num_heads = num_heads`
			`self.device = device`

feat(server): Support AutoModelForSeq2SeqLM 2022-11-04 11:03:04 -06:00			`@property`
fix(models): Revert buggy support for AutoModel 2022-11-03 09:07:54 -06:00			`@abstractmethod`
feat(server): Support AutoModelForSeq2SeqLM 2022-11-04 11:03:04 -06:00			`def batch_type(self) -> Type[B]:`
fix(models): Revert buggy support for AutoModel 2022-11-03 09:07:54 -06:00			`raise NotImplementedError`
feat(server): Support all AutoModelForCausalLM on a best effort basis 2022-10-28 11:24:00 -06:00
feat(server): Support AutoModelForSeq2SeqLM 2022-11-04 11:03:04 -06:00			`@abstractmethod`
			`def generate_token(self, batch: B) -> Tuple[List[GeneratedText], Optional[B]]:`
			`raise NotImplementedError`