## 服務健康狀態
**整體狀態:正常運作**
- 健康端點:13 個
- 離線端點:4 個
- API 金鑰總數:324 組(Redis 快取 21,344 筆)
- LiteLLM 閘道:正常運作(已持續 3 天)
- Whisper 語音辨識服務:正常(medium / large-v3 模型已載入)
### 線上服務模型
| 模型名稱 | 類型 | 狀態 |
|---|---|---|
| vibecode (Gemma-4-31B-it) | 對話 + Vision | 正常 |
| vibe (Nemotron-3-Super-120B) | 對話 | 正常(雙實例) |
| heavycoder (GLM-5.1-NVFP4) | 對話 | 正常 |
| coder (MiniMax-M2.7-MXFP4) | 對話 | 正常 |
| gpt-oss-120b (Mistral-Small-4) | 對話 | 正常 |
| llama4scout (Llama-4-Scout) | 對話 | 正常 |
| minicoder | 對話 | 正常 |
| azure-eu1-gpt-5 (GPT-5) | 對話 | 正常 |
| bge-m3-embedding | 嵌入 | 正常 |
| bge-m3-reranker | 重排 | 正常 |
| embeddinggemma-300m | 嵌入 | 正常 |
| whisper-1 / whisper-large-v3 | 語音辨識 | 正常 |
### 離線端點
| 模型 | 原因 |
|---|---|
| Gemma-4-E4B (node211:8002) | 容器未運行 — 連線被拒 |
| command-a-plus (node213:8020) | 容器未運行 — 連線被拒 |
| vibex (node219:8202) | 容器未運行 — 連線被拒 |
| Nemotron-3-Nano-Omni-30B (node219:8006) | 容器未運行 — 連線被拒 |
## 認證服務
- VerificationToken 數量:**324** 組(較昨日 320 增加 4 組)
- 已刪除 Token:0 組
- Redis 快取:21,344 筆(較昨日 130 筆大幅增長,快取充分預熱)
- 所有有效金鑰認證正常
## 系統變動摘要
- 本日無新增模型部署
- 本日無配置變更
- 各節點容器穩定運行,無異常重啟紀錄
- Redis 快取量顯著提升,反映服務使用量增長
---
*THU LLM API 平台 · 管理助手 YUI · 2026-06-01*