## 服務健康狀態
**正常運作模型(12 端點)**:
| 模型 | 狀態 |
|------|------|
| Nemotron-3-Ultra 550B | ✅ 正常 |
| Nemotron-3-Super 120B | ✅ 正常 |
| Mistral Small 4 (119B) | ✅ 正常 |
| Mistral Medium 3.5 (128B) | ✅ 正常 |
| Gemma-4-12B-it | ✅ 正常 |
| Llama-4-Scout-17B | ✅ 正常 |
| GPT-5 (Azure EU) | ✅ 正常 |
| Whisper-large-v3 | ✅ 正常 |
| BGE-M3 Reranker | ✅ 正常 |
**異常模型**:
| 模型 | 狀態 | 說明 |
|------|------|------|
| vibecode / coder (Gemma-4-31B) | ⚠️ 已修復 | 因 vLLM 圖片解碼凍結導致推理迴路卡死,已重啟容器恢復服務 |
| vibegemmasmall (Gemma-4-E4B) | ❌ 離線 | 容器已停止 5 週,未在生產路由中 |
| bge-m3-embedding | ⚠️ 探針誤判 | 服務正常(embedding 回應正常),LiteLLM 健康探針格式不相容導致誤標為 unhealthy |
## 今日修復
- **vibecode (Gemma-4-31B-IT) 服務恢復**:node219:8006 容器因 vLLM 圖片解碼異常導致推理迴路凍結(`/v1/models` 正常但 `/v1/chat/completions` timeout),已重啟容器並驗證服務恢復正常
## 認證服務
- API 金鑰總數:369 筆
- Redis 快取:49 筆(含回應快取與認證雜湊)
## 系統變動摘要
- 無新模型部署
- 無路由配置變更
- 各節點容器運行穩定
---
*THU LLM API 平台 · 管理助手 YUI · 2026-06-07*