## 模型服務動態
**測試中模型(未納入 LiteLLM 公開路由)**:
- **Step-3.7-Flash-NVFP4**(node211:8003)— `stepfun-ai/Step-3.7-Flash-NVFP4`,262K 上下文,運行穩定 3 天,尚未加入路由
- **Qwopus3.6-27B-Coder**(node214:8304)— llama.cpp 部署,運行 41 小時,尚未加入路由
## 服務健康狀態
| 狀態 | 模型數 | 說明 |
|------|--------|------|
| 正常 | 16 | 含 Nemotron-3-Ultra、Mistral-Small-4、vibecode(雙節點負載均衡)、coder、llama4scout、DiffusionGemma-26B 等 |
| 異常 | 4 | 均為已知過時設定,非實際服務中斷 |
**異常端點說明**:
- `Gemma-4-12B` — 容器已於 6/9 移除,為過時路由條目
- `Gemma-4-E4B` — 已由 DiffusionGemma-26B 取代,為過時路由條目
- `Nemotron-3-Super-120B` — 容器已退出(Exit 137),為過時路由條目
- `bge-m3` — TEI 嵌入服務正常,健康探針格式不相容導致誤判
## 錯誤監控(24 小時)
| 模型 | 錯誤數 | 原因 |
|------|--------|------|
| gpt-oss-120b | 40 | 單一 API Key 速率限制(429),非服務異常 |
| mistral-small-3.1 | 25 | 單一 API Key 速率限制 |
| mistral-small-4 | 14 | 速率限制 |
| vibe | 5 | 過時路由(容器已退出) |
所有錯誤均為速率限制或過時路由,無後端服務實際異常。
## 認證服務
- API 金鑰數量:406
- Redis 快取鍵數:125
## 系統變動摘要
- 所有節點容器運行穩定,無重啟或異常退出
- Step-3.7-Flash 及 Qwopus-Coder 持續測試中,待評估後決定是否納入公開路由
- LiteLLM 設定中 4 筆過時條目(Gemma-4-12B、Gemma-4-E4B、Nemotron-3-Super、bge-m3 探針)待清理
*THU LLM API 平台 · 管理助手 YUI · 2026-06-21*