## 模型服務動態
- **Step-3.7-Flash (NVFP4) 測試部署** — node211 新增 `step37-flash-nvfp4` 容器(port 8003,262K ctx),尚未納入 LiteLLM 路由,目前為測試階段
- **DiffusionGemma-26B 遷移確認** — 已確認運行於 node214:8002(非 node211),LiteLLM 路由已正確指向 214:8002
- **Mistral-Small-4 / DiffusionGemma-26B 重啟** — node214 兩個 LLM 容器於 6/17 14:00 UTC 重啟,目前穩定運行
## 服務健康狀態
**健康模型(16 端點)**
| 模型名稱 | 後端節點 | 狀態 |
|---|---|---|
| Nemotron-3-Ultra 550B | node213:8310 | ✅ 運行中 |
| DiffusionGemma-26B | node214:8002 | ✅ 運行中 |
| Mistral-Small-4 119B | node214:8303 | ✅ 運行中 |
| Gemma-4-31B-QAT (vibecode LB) | node219:8006 + 8007 | ✅ 運行中 |
| Gemma-4-31B-QAT (coder) | node219:8006 | ✅ 運行中 |
| Llama-4-Scout | node219:8000 | ✅ 運行中 |
| heavycoder (GLM-5.1) | node213:8309 | ✅ 運行中 |
| VibeVoice ASR | node219:8601 | ✅ 運行中 |
| WhisperX | gateway:9000 | ✅ 運行中 |
| BGE-M3 Embedding | gateway:8301 | ✅ 服務正常(探針格式不相容,顯示 unhealthy 為已知誤判) |
| BGE-M3 Reranker | gateway:8302 | ✅ 運行中 |
| Azure GPT-5 | Azure EU | ✅ 運行中 |
**離線端點(4 項)**
| 模型名稱 | 原因 |
|---|---|
| Nemotron-3-Super / vibex (node214:8302) | 容器 `nemotron-vibe` 已於 6/5 退出(Exit 137),未重新部署 |
| Gemma-4-E4B / vibegemmasmall (node211:8002) | 容器已由 DiffusionGemma-26B 取代,路由別名指向過時後端 |
| Gemma-4-12B (node219:8005) | 容器已於 6/9 移除,網站已標記為停用 |
| BGE-M3 Embedding (LiteLLM 探針) | TEI 不支援 `/v1/models`,探針誤判,實際服務正常 |
## 認證服務
- API 金鑰數量:**400** 筆(較昨日 +2)
- Redis 快取鍵數:547
## 系統變動摘要
- node211 新增 Step-3.7-Flash-NVFP4 測試容器(port 8003),後續將評估納入 LiteLLM 路由
- node214 LLM 容器重啟完成(Mistral-Small-4、DiffusionGemma-26B),服務已恢復
- `vibex` 路由別名仍指向已下線的 Nemotron-3-Super(node214:8302),需清理或重新指向
- `vibegemmasmall` 路由別名仍指向已下線的 Gemma-4-E4B(node211:8002),需清理
- node219 圖像生成容器(FLUX.2、Ideogram-4)仍為測試階段,未納入正式路由
- node219 Whisper ASR 容器(port 9001)運行中,未納入 LiteLLM 路由
---
*THU LLM API 平台 · 管理助手 YUI · 2026-06-18*