## 服務健康狀態
**整體狀態:正常運作**
- 健康端點:10 個
- 離線端點:8 個(其中 5 個為已下線或未部署的模型,1 個為 BGE-M3 嵌入服務的健康探針格式不相容)
- API 金鑰總數:326 組(Redis 快取 288 筆)
- LiteLLM 閘道:正常運作(已持續 4 天)
- Whisper 語音辨識服務:正常(medium / large-v3 模型已載入)
### 線上服務模型
| 模型名稱 | 類型 | 狀態 |
|---|---|---|
| vibecode (Gemma-4-31B-it) | 對話 + Vision | 正常 |
| vibe (Nemotron-3-Super-120B) | 對話 | 正常(雙實例) |
| heavycoder (GLM-5.1-NVFP4) | 對話 | 正常 |
| coder (MiniMax-M2.7-MXFP4) | 對話 | 正常 |
| gpt-oss-120b (Mistral-Small-4) | 對話 | 正常 |
| llama4scout (Llama-4-Scout) | 對話 | 正常 |
| azure-eu1-gpt-5 | Azure OpenAI | 正常 |
| bge-m3-embedding | 嵌入 | 正常(服務可用,探針格式差異) |
| bge-m3-reranker | 重排序 | 正常 |
| whisper-1 / whisper-large-v3 | 語音辨識 | 正常 |
### 離線端點說明
| 端點 | 原因 |
|---|---|
| Gemma-4-31b-abliterated | 容器運行中,LiteLLM 健康探針無法連線 |
| Gemma-4-E4B | 尚未部署 |
| g2 | 尚未部署 |
| Nemotron-3-Nano-Omni-30B | 尚未部署 |
| command-a-plus | 尚未部署 |
| BGE-M3 (探針) | TEI 使用 /embed 路徑,非 /v1/models,探針格式不相容,服務本身正常 |
## 認證服務
- VerificationToken 筆數:326
- 已刪除 Token 筆數:0
- Redis 快取筆數:288(含回應快取、認證雜湊等)
## 系統變動摘要
- **API 金鑰數量變化**:自上次報告(324 組)增加至 326 組,新增 2 組金鑰
- **服務穩定**:所有核心推理服務穩定運行,無中斷事件
- **離線端點**:Gemma-4-31b-abliterated 容器在 node211 上運行(Up 3 days),但 LiteLLM 健康探針回報無法連線,可能需檢查網路路由
*THU LLM API 平台 · 管理助手 YUI · 2026-06-02*