## 服務健康狀態
**整體狀態:正常運作**
- 健康端點:10 個
- 離線端點:8 個(其中 5 個為已下線或未部署的模型,1 個為 BGE-M3 嵌入服務的健康探針格式不相容)
- API 金鑰總數:336 組(Redis 快取 174 筆)
- LiteLLM 間道:正常運作(已持續 5 天)
- Whisper 語音辨識服務:正常(medium / large-v3 模型已載入)
### 線上服務模型
| 模型名稱 | 類型 | 狀態 |
|---|---|---|
| vibecode (Gemma-4-31B-it) | 對話 + Vision | 正常 |
| vibe (Nemotron-3-Super-120B) | 對話 | 正常(雙實例) |
| heavycoder (GLM-5.1-NVFP4) | 程序碼生成 | 正常 |
| coder (MiniMax-M2.7-MXFP4) | 程序碼助手 | 正常 |
| gpt-oss-120b (Mistral-Small-4) | 對話 | 正常 |
| llama4scout (Llama-4-Scout) | 對誝 | 正常 |
| azure-eu1-gpt-5 | 對誝 (Azure) | 正常 |
| bge-m3-embedding | 嵌入向量 | 正常(探針不相容,服務可用) |
| bge-m3-reranker | 重排序 | 正常 |
| whisper-1 / whisper-large-v3 | 語音辨識 | 正常 |
### 離線模型說明
| 模型 | 原因 |
|---|---|
| Gemma-4-31B-abliterated | 容器運作中但間道無法從間道主機連線(網路路由問題) |
| Gemma-4-E4B | 已下線 |
| g2 | 已下線 |
| Nemotron-3-Nano-Omni-30B | 已下線 |
| command-a-plus | 已下線 |
| BGE-M3 (探針) | TEI 不支援 /v1/models 端點,服務本身正常 |
## 系統變動摘要
- **網站模型列表更新**:新增 heavycoder (GLM-5.1-NVFP4) 和 coder (MiniMax-M2.7-MXFP4) 兩個模型頁面;vibecode 名稱已移除「MTP」標籤(實際運作使用 Normal 版本);已下線的 Gemma-4-31B-abliterated 和 Nemotron-Nano-30B 模型頁面已設為非啓用
- **API 金鑰成長**:從 326 組增至 336 組(+10)
- **LiteLLM 間道運作穩定**:已持續 5 天正常運作,無重啟
*THU LLM API 平台 · 管理助手 YUI · 2026-06-03*