## 模型服務動態
**GLM-5.1(heavycoder)容器自動重啟**:node213 上的 GLM-5.1-NVFP4 容器於今日約 10:13 重新啟動(已運行約 2 小時),目前服務正常回應。Nemotron-3-Ultra 同節點不受影響,持續穩定運行。
**測試中模型(未納入公開路由)**:
- **Step-3.7-Flash-NVFP4**(node211:8003)- 運行穩定 5 天,262K 上下文
- **Qwopus3.6-27B-Coder**(node214:8304)- llama.cpp 部署,運行 3 天
- **FLUX.2-klein-base-9B**(node219:30000)- sglang 圖像生成,測試中
- **Ideogram-4-NF4**(node219:30001)- sglang 圖像生成,測試中
## 服務健康狀態
| 狀態 | 端點數 | 說明 |
|------|--------|------|
| 正常 | 16 | Nemotron-3-Ultra、Mistral-Small-4、vibecode(雙節點 LB)、coder、llama4scout、DiffusionGemma-26B 等 |
| 異常 | 4 | 均為已知過時路由,非實際服務中斷 |
**異常端點**(已知過時,待清理):
- `Gemma-4-12B` - 容器已於 6/9 移除
- `Gemma-4-E4B` - 已由 DiffusionGemma-26B 取代
- `Nemotron-3-Super-120B` - 容器已退出(Exit 137)
- `bge-m3` - TEI 嵌入服務正常,探針格式不相容導致誤判
## 錯誤監控(24 小時)
| 模型 | 錯誤數 | 總請求數 | 原因 |
|------|--------|----------|------|
| nemotron-3-ultra | 284 | 2,847 | 單一 API Key 速率限制 + 不支援的 file 類型,非服務異常 |
| gpt-oss-120b | 40 | 40 | 單一 API Key 速率限制(429) |
| vibe | 13 | 13 | 過時路由(容器已退出) |
| gemma-4-31B-qat | 7 | 18 | 單一 Key 發送不支援的 file 內容類型 |
| diffusiongemma-26b | 2 | - | 單一 Key,非服務異常 |
| bge-m3-embedding | 2 | - | 單一 Key,非服務異常 |
所有錯誤均為速率限制或客戶端請求格式問題,無後端服務實際異常。
## 認證服務
- API 金鑰數量:408
- Redis 快取鍵數:77
## 系統變動摘要
- GLM-5.1(heavycoder)容器於今日自動重啟,已恢復正常
- Mistral-Small-4、DiffusionGemma-26B、llama4scout、vibecode/coder 等主力模型持續穩定
- LiteLLM 設定中 4 筆過時條目待清理(Gemma-4-12B、Gemma-4-E4B、Nemotron-3-Super、bge-m3 探針)
- 網站模型列表:mistral-medium-35 顯示名稱仍為 Mistral Small 4 (119B),需更新描述以反映目前路由狀態
- 今日總請求量:8,553 筆(24 小時)
*THU LLM API 平台 · 管理助手 YUI · 2026-06-22*