## 模型服務動態
- **Step-3.7-Flash (NVFP4) 測試中** — node211:8003 持續測試運行(已 43 小時),具備推理能力(reasoning 欄位),262K 上下文。尚未納入 LiteLLM 公開路由
- **所有正式模型穩定運行** — 16 個健康端點維持正常,無新部署或重啟
## 服務健康狀態
**健康模型(16 端點)**
| 模型名稱 | 後端節點 | 狀態 |
|---|---|---|
| Nemotron-3-Ultra 550B | node213:8310 | ✅ 運行中 |
| DiffusionGemma-26B | node214:8002 | ✅ 運行中 |
| Mistral-Small-4 119B | node214:8303 | ✅ 運行中 |
| Gemma-4-31B-QAT (vibecode LB) | node219:8006 + 8007 | ✅ 運行中 |
| Gemma-4-31B-QAT (coder) | node219:8006 | ✅ 運行中 |
| Llama-4-Scout | node219:8000 | ✅ 運行中 |
| heavycoder (GLM-5.1) | node213:8309 | ✅ 運行中 |
| VibeVoice ASR | node219:8601 | ✅ 運行中 |
| WhisperX | gateway:9000 | ✅ 運行中 |
| BGE-M3 Embedding | gateway:8301 | ✅ 服務正常(探針格式不相容,顯示 unhealthy 為已知誤判) |
| BGE-M3 Reranker | gateway:8302 | ✅ 運行中 |
| Azure GPT-5 | Azure EU | ✅ 運行中 |
**離線端點(4 項)**
| 模型名稱 | 原因 |
|---|---|
| Nemotron-3-Super / vibex (node214:8302) | 容器已於 6/5 退出(Exit 137),未重新部署 |
| Gemma-4-E4B / vibegemmasmall (node211:8002) | 容器已退出,路由別名指向過時後端 |
| Gemma-4-12B (node219:8005) | 容器已於 6/9 移除,網站已標記為停用 |
| BGE-M3 Embedding (LiteLLM 探針) | TEI 不支援 /v1/models,探針誤判,實際服務正常 |
## 認證服務
- API 金鑰數量:**400** 筆(與昨日持平)
- Redis 快取鍵數:125
- 過去 24 小時請求量:8,861 筆(Mistral-Small-4 路由最活躍)
## 系統變動摘要
- 無新模型部署或路由變更
- Step-3.7-Flash-NVFP4 測試容器持續運行,待評估正式上線
- `vibex` 及 `vibegemmasmall` 路由別名仍指向已下線後端,待清理
- node219 圖像生成容器(FLUX.2、Ideogram-4)仍為測試階段
- 今日 13:04-14:19 期間,gpt-oss-120b 別名有 3,587 筆請求因單一金鑰觸發速率限制而失敗,服務本身正常
---
*THU LLM API 平台 · 管理助手 YUI · 2026-06-19*