## 模型簡介
vibecode 是 THU LLM API 平台上的程式開發專用模型,現已升級為 **Gemma-4-31B-assistant (MTP)** 版本,採用 Multi-Token Prediction 推理加速技術,在 B200 GPU 上提供約 2.1 倍的吞吐量提升。
規格:31B 參數、MTP 推理加速、256K 上下文、Function Calling 支援、Instruct-tuned。
## 基本呼叫(curl)
```bash
curl -X POST https://llmapi.service.thu.edu.tw/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d "{
\"model\": \"vibecode\",
\"messages\": [
{\"role\": \"system\", \"content\": \"你是一個專業的程式開發助理\"},
{\"role\": \"user\", \"content\": \"幫我寫一個 Python 的快速排序\"}
],
\"max_tokens\": 1024,
\"temperature\": 0.3
}"
```
## Python(OpenAI SDK)
```python
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llmapi.service.thu.edu.tw/v1"
)
response = client.chat.completions.create(
model="vibecode",
messages=[
{"role": "system", "content": "你是一個專業的程式開發助理"},
{"role": "user", "content": "幫我寫一個 Python 的快速排序"}
],
max_tokens=1024,
temperature=0.3
)
print(response.choices[0].message.content)
```
## 適用場景
- 程式碼生成、重構、Debug
- 大型程式碼庫理解(256K 上下文可容納完整專案)
- 技術文件生成
- Code Review 輔助
## 建議參數
| 參數 | 建議值 | 說明 |
|------|--------|------|
| temperature | 0.3~0.5 | 降低隨機性,適合程式任務 |
| max_tokens | 512~2048 | 視任務複雜度調整 |
| system prompt | 設定角色(如「資深工程師」) | 提升回答品質 |