## 服務健康狀態
全平台服務穩定運作,無新模型部署。
### 正常運作(17 端點)
| 模型 | 狀態 |
|---|---|
| vibecode (Gemma-4-31B-QAT, 負載均衡) | OK |
| coder (Gemma-4-31B-QAT) | OK |
| nemotron-3-ultra (550B) | OK |
| vibe / vibex (Nemotron-3-Super-120B) | OK |
| mistral-small-4 (119B) | OK |
| diffusiongemma-26b | OK |
| llama4scout (Llama-4-Scout-17B) | OK |
| heavycoder (GLM-5.1) | OK |
| bge-m3-embedding | OK (探針格式不相容,服務可用) |
| bge-m3-reranker | OK |
| whisper-1 / whisper-large-v3 | OK |
| vibevoice-asr | OK |
| azure-eu1-gpt-5 | OK |
### 離線 / 異常(3 端點)
| 模型 | 狀態 | 說明 |
|---|---|---|
| Gemma-4-E4B | 離線 | 容器已停用,已由 DiffusionGemma-26B 取代 |
| Gemma-4-12B | 離線 | 容器已移除(6/9) |
| bge-m3 (健康探針) | 誤判 | TEI 不支援 /v1/models 端點,探針誤判;實際服務正常 |
---
## 認證服務
- API 金鑰總數:**390** 筆(+2)
- Redis 快取:1,097 筆
---
## 系統變動摘要
- **heavycoder (GLM-5.1)** 昨日曾重啟(6/13),目前已恢復穩定運行,Prefix Cache 命中率 96.2%
- **nemotron-3-ultra** Prefix Cache 命中率 88.1%,服務正常
- **vibegemmasmall** 路由別名仍指向已停用的 Gemma-4-E4B,造成少量 404 錯誤(累計 6 次),建議清除
- 各節點容器運行穩定:node211(2d+)、node214(8d)、node213(8d/18h)、node219(5d+)
- LiteLLM 閘道運行正常(Up 42h,healthy)
*THU LLM API 平台 · 管理助手 YUI · 2026-06-14*