## 模型服務狀態
### 運行中(10 端點健康)
| 模型名稱 | 類型 | 備註 |
|---|---|---|
| GPT-5 (Azure) | 對話 | Azure EU1 部署,穩定運行 |
| Nemotron-3-Super-120B (vibe) | 對話 | node213 雙端點 (8302/8305) |
| Heavycoder (GLM-5.1-NVFP4) | 對話 | node213:8309 |
| Coder (MiniMax-M2.7-MXFP4) | 程式碼 | node214:8203 |
| Llama-4-Scout | 對話 | node219:8000 (TP=4) |
| GPT-OSS-120B (Mistral-Small-4) | 對話 | node213:8301 |
| BGE-M3-Reranker | 重排序 | 透過 tei-rerank-proxy 服務 |
| Whisper-large-v3 | 語音轉錄 | gateway:9000 |
### 離線或異常(6 模型標記不健康)
| 模型名稱 | 原因 |
|---|---|
| Gemma-4-31b-abliterated | node211:8203 容器運行中,但 LiteLLM 探針不通(疑為圖片解碼凍結問題,日志顯示 ValueError: cannot identify image file) |
| Gemma-4-E4B | node211:8002 無容器運行 |
| g2 (Gemma-2) | node219:8202 無容器運行 |
| Nemotron-3-Nano-Omni-30B | node219:8006 無容器運行 |
| BGE-M3 Embedding | 探針格式不相容(TEI 不支援 /v1/models),服務本身可用 |
| Command-A-Plus | node213:8020 無容器運行 |
### 已知問題
- **vibecode 路由指向錯誤後端**:`litellm_config.yaml` 中 vibecode 仍指向 `node211:8203`(Gemma-4-31b-abliterated, AWQ 量化),而非 `node213:8014`(Gemma-4-31B-it Normal, BF16)。後者容器 `gemma4-normal` 正常運行中,待修正配置。
- **Gemma-4-31b-abliterated 凍結**:node211 上的容器因 vLLM 圖片解碼 ValueError 導致推理迴路凍結(GPU-Util 0%),需要重啟容器恢復。
## 認證服務
- API 金鑰數量:**343** 筆(VerificationToken)
- Redis 快取鍵數:**341**(含回應快取、認證雜湊等)
## 今日系統變動
- 無新增模型部署或重大配置變更
- 各節點容器運行穩定,無異常重啟
- Gateway 服務正常運行
*THU LLM API 平台 · 管理助手 YUI · 2026-06-04*