## 模型服務動態
### 新增模型
- **DiffusionGemma-26B** 已部署上線(node211:8002)
- Google DiffusionGemma-26B-A4B-it,FP8 量化,262K 上下文
- 支援 Function Calling、並行工具呼叫
- 取代原 node211:8002 的 Gemma-4-E4B 容器(已停用超過 6 週)
### 路由變更
| 模型名稱 | 原後端 | 新後端 |
|---|---|---|
| `mistral-medium-35` | Mistral Medium 3.5 (128B, node211:8001) | Mistral Small 4 (119B, node214:8303) |
| `gpt-oss-120b` | Mistral Small 4 (node214:8303) | 維持不變(標註更新) |
- Mistral Medium 3.5 容器已從 node211 移除,`mistral-medium-35` 別名重新指向 Mistral Small 4 後端
- `gpt-oss-120b` 網站描述已更新,反映目前實際指向 Mistral Small 4
### 網站模型列表更新
- **新增** VibeVoice ASR 語音辨識服務(model_id: `vibevoice-asr`,id=34)
- **更新** mistral-medium-35 標籤:Mistral Medium 3.5 → Mistral Small 4
- **更新** gpt-oss-120b 描述:補充 Mistral Small 4 別名資訊
---
## 服務健康狀態
### 正常運作(17 端點)
| 模型 | 狀態 |
|---|---|
| vibecode (Gemma-4-31B-QAT, 負載均衡) | ✅ |
| coder (Gemma-4-31B-QAT) | ✅ |
| nemotron-3-ultra (550B) | ✅ |
| vibe / vibex (Nemotron-3-Super-120B) | ✅ |
| mistral-small-4 (119B) | ✅ |
| diffusiongemma-26b | ✅ |
| llama4scout (Llama-4-Scout-17B) | ✅ |
| heavycoder (GLM-5.1) | ✅ |
| bge-m3-embedding | ✅ (探針格式不相容,服務可用) |
| bge-m3-reranker | ✅ |
| whisper-1 / whisper-large-v3 | ✅ |
| vibevoice-asr | ✅ |
| azure-eu1-gpt-5 | ✅ |
### 離線 / 異常(3 端點)
| 模型 | 狀態 | 說明 |
|---|---|---|
| Gemma-4-E4B | ❌ | 容器已停用逾 6 週,已由 DiffusionGemma-26B 取代 |
| Gemma-4-12B | ❌ | 容器已移除(6/9) |
| bge-m3 (健康探針) | ⚠️ | TEI 不支援 /v1/models 端點,探針誤判;實際服務正常 |
---
## 認證服務
- API 金鑰總數:**387** 筆
- Redis 快取:301 筆
---
## 系統變動摘要
1. **DiffusionGemma-26B 新模型上線** — node211:8002,支援 262K 上下文及 Function Calling
2. **Mistral Medium 3.5 容器下線** — 原始容器已從 node211 移除,`mistral-medium-35` 別名重新指向 Mistral Small 4
3. **VibeVoice ASR 加入網站模型列表** — 中英文語音辨識服務
4. **網站模型資訊同步更新** — mistral-medium-35、gpt-oss-120b 標籤已修正
*THU LLM API 平台 · 管理助手 YUI · 2026-06-12*