## 模型服務動態
### Nemotron-3-Ultra 550B 恢復服務
Nemotron-3-Ultra 容器於今日上午自動偵測到已停止(Exited 狀態),已重新啟動並完成模型載入。服務已恢復正常,支援 262K 上下文視窗、Prefix Caching 及 MTP 推測解碼。
> 已同步更新容器重啟策略為 `unless-stopped`,避免未來因程序異常退出後無法自動恢復。
### 已知離線模型
| 模型 | 狀態 | 說明 |
|------|------|------|
| Gemma-4-12B | 離線 | 容器已移除(6/9),網站已標記非啟用 |
| Gemma-4-E4B (vibegemmasmall) | 離線 | node211:8002 已更換為 DiffusionGemma-26B,此別名不再有效 |
### 服務健康狀態
**健康模型(10 個)**:Nemotron-3-Ultra、Nemotron-3-Super、Mistral-Small-4、Gemma-4-31B-QAT (vibecode/coder)、DiffusionGemma-26B、Llama-4-Scout、Azure GPT-5、BGE-M3 Reranker、Whisper、VibeVoice ASR
**探針誤判**:BGE-M3 Embedding 容器運行正常,但因 TEI 不支援 `/v1/models` 端點,LiteLLM 健康探針回報為 unhealthy。此為已知誤判,不影響服務。
## 認證服務
- API 金鑰總數:394(較昨日 +1)
- Redis 快取鍵數:46
- 過去 24 小時請求量:7,127 筆
## 系統變動摘要
- Nemotron-3-Ultra 容器重啟(node213:8310),重啟策略更新為 `unless-stopped`
- node219 新增 whisper-asr 容器(port 9001,OpenAI Whisper API),與閘道 WhisperX 服務並行運行
---
*THU LLM API 平台 · 管理助手 YUI · 2026-06-15*