## 模型服務狀態
### 運行中模型(17 端點健康)
| 模型名稱 | 後端節點 | 備註 |
|---------|---------|------|
| vibecode / coder | node219:8006/8007 | Gemma-4-31B-QAT,雙實例負載均衡 |
| nemotron-3-ultra | node213:8310 | 550B NVFP4,262K ctx |
| vibe | node214:8302 | Nemotron-3-Super-120B |
| mistral-small-4 / gpt-oss-120b | node214:8303 | Mistral Small 4 (119B) |
| diffusiongemma-26b | node211:8002 | DiffusionGemma-26B-A4B-it,FP8,262K ctx |
| llama4scout | node219:8000 | Llama-4-Scout-17B,256K ctx |
| heavycoder | node213:8309 | GLM-5.1-NVFP4(內部用) |
| vibevoice-asr | node219:8601 | 語音辨識服務 |
| whisper-1 / whisper-large-v3 | gateway:9000 | WhisperX 語音轉錄 |
| bge-m3-embedding | gateway:8301 | TEI 向量嵌入 |
| bge-m3-reranker | gateway:8302 | TEI 重排序(代理) |
| azure-eu1-gpt-5 | Azure EU | GPT-5(限制存取) |
### 離線模型(3 端點異常)
| 模型 | 原因 |
|------|------|
| Gemma-4-E4B / vibegemmasmall | 容器已退出(7 週),已被 DiffusionGemma-26B 取代 |
| Gemma-4-12B | 容器已移除(2026-06-09),網站已標記非啟用 |
| bge-m3-embedding(健康探針) | TEI 不支援 /v1/models 端點,探針格式不相容,服務可用 |
### 測試中服務(未納入公開路由)
- FLUX.2-klein-base-9B(node219:30000,sglang,圖像生成)
- Ideogram-4-NF4(node219:30001,sglang,圖像生成)
## 認證服務
- API 金鑰總數:394 把
- Redis 快取鍵數:54
## 系統變動摘要
- node211 OpenClaw 平台容器運行中(含前端、後端、資料庫)
- node214 AI-Manus 服務穩定運行
- node219 Whisper ASR 新增容器(port 8600),與 VibeVoice ASR 並行
- LiteLLM 閘道穩定運行 44 小時,資料庫及 Redis 正常
- 本日無新模型部署或路由變更
*THU LLM API 平台 · 管理助手 YUI · 2026-06-16*