## 系統狀態摘要
### 閘道服務 ✅
LiteLLM 統一閘道服務運行正常,`/health` 端點回應正常。
### 模型服務(15 個模型上線)
| 模型 | 節點 | 說明 |
|------|------|------|
| gpt-oss-120b | node213 | GPT-OSS 120B 模型 |
| vibegemma | node211 | Gemma 小型模型 |
| vibe | node211 / node213 | Vibe 任務模型 |
| mistral-small-4 | node211 | Mistral Small 4 模型 |
| vibecode | node213 (B200, GPU 3) | Gemma-4-31B MTP 推論,262K 上下文 |
| coder | node213 (GPU 6-7) | 程式碼生成模型 |
| vibegemmasmall | node211 | Gemma 小型任務模型 |
| minicoder | node214 | MiniCoder 程式碼模型 |
| llama4scout | node219 (TP=4, GPU 0-3) | Llama 4 Scout 17B |
| vibex | node219 (TP=2, GPU 6-7) | Vibe X 任務模型 |
| nemotron-nano-30b | node219 (TP=2, GPU 8-9) | Nemotron Nano 30B |
| bge-m3-embedding | 本地 (port 8301) | BGE-M3 向量嵌入模型 |
| bge-m3-reranker | 本地 (port 8302) | BGE-M3 重排序模型 |
| whisper-1 | 本地 (port 9000) | Whisper ASR 模型 |
| whisper-large-v3 | 本地 (port 9000) | Whisper Large-v3 ASR 模型 |
### 認證服務 ✅
- API 金鑰總數:**207 筆**(含昨日還原之 198 筆 + 3 筆單筆新增 + 預存金鑰)
- Redis 快取:**350 筆**(已緩存有效金鑰)
- 所有有效金鑰驗證正常(200 OK,15 模型);已過期金鑰正確回應 400
### 計算節點狀態
| 節點 | IP | 狀態 | 主要服務 |
|------|-----|------|----------|
| node211 | 140.128.97.211 | ✅ 正常 | vLLM (mistral-small-4, vibegemma), qwen36, OpenClaw 用戶容器 |
| node213 | 140.128.97.213 | ⚠️ SSH 不穩 | gpt-oss-120b, vibecode (B200), coder, vibe |
| node214 | 140.128.97.214 | ✅ 正常 | minicoder, minimax-m2.7-h100 |
| node219 | 140.128.97.219 | ⚠️ SSH 不穩 | llama4scout, vibex, nemotron-nano-30b |
### 已知議題
- **node213 / node219 SSH 連線不穩定**:部分遠端節點 SSH 握手逾時,vLLM 容器可能仍在運行(需進一步排查網路與 SSH daemon 狀態)
- **FLUX.2 圖像生成**:待 vLLM 0.20+ 發布後部署(vLLM 0.19.1 尚未支援 Flux2ForConditionalGeneration)
---
*THU LLM API 平台 · 管理助手 YUI · 2026-05-07*