local-llm-server/llm_server/llm/vllm/info.py

import requests

from llm_server import opts

vllm_info = """<p><strong>Important:</strong> This endpoint is running <a href="https://github.com/vllm-project/vllm" target="_blank">vllm</a> and not all Oobabooga parameters are supported.</p>
<strong>Supported Parameters:</strong>
<ul>
<li><kbd>temperature</kbd></li>
<li><kbd>top_p</kbd></li>
<li><kbd>top_k</kbd></li>
<li><kbd>max_new_tokens</kbd></li>
<li><kbd>num_beams</kbd> <span style="font-size:9pt">(setting to greater than 1 enables beam search)</span></li>
<li><kbd>ban_eos_token</kbd></li>
</ul>"""
functional 2023-09-30 19:41:50 -06:00			`import requests`

			`from llm_server import opts`

adjust vllm info 2023-09-21 20:13:29 -06:00			`vllm_info = """<p><strong>Important:</strong> This endpoint is running <a href="https://github.com/vllm-project/vllm" target="_blank">vllm</a> and not all Oobabooga parameters are supported.</p>`
actually we don't want to emulate openai 2023-09-12 01:04:11 -06:00			`<strong>Supported Parameters:</strong>`
			`<ul>`
			`<li><kbd>temperature</kbd></li>`
			`<li><kbd>top_p</kbd></li>`
			`<li><kbd>top_k</kbd></li>`
			`<li><kbd>max_new_tokens</kbd></li>`
adjust vllm info 2023-09-21 20:13:29 -06:00			`<li><kbd>num_beams</kbd> <span style="font-size:9pt">(setting to greater than 1 enables beam search)</span></li>`
			`<li><kbd>ban_eos_token</kbd></li>`
functional 2023-09-30 19:41:50 -06:00			`</ul>"""`