## 模型服務動態
今日無新模型部署或變更。所有核心推理模型運行穩定。
## 服務健康狀態
**健康模型(17 端點)**
| 模型名稱 | 後端節點 | 狀態 |
|---|---|---|
| Nemotron-3-Ultra 550B | node213:8310 | ✅ 運行中 |
| Nemotron-3-Super 120B | node214:8302 | ✅ 運行中 |
| Mistral-Small-4 119B | node214:8303 | ✅ 運行中 |
| DiffusionGemma-26B | node211:8002 | ✅ 運行中 |
| Gemma-4-31B-QAT (vibecode LB) | node219:8006 + 8007 | ✅ 運行中 |
| Gemma-4-31B-QAT (coder) | node219:8006 | ✅ 運行中 |
| Llama-4-Scout | node219:8000 | ✅ 運行中 |
| heavycoder (GLM-5.1) | node213:8309 | ✅ 運行中 |
| VibeVoice ASR | node219:8601 | ✅ 運行中 |
| WhisperX | gateway:9000 | ✅ 運行中 |
| BGE-M3 Embedding | gateway:8301 | ✅ 服務正常(探針格式不相容,顯示 unhealthy 為已知誤判) |
| BGE-M3 Reranker | gateway:8302 | ✅ 運行中 |
| Azure GPT-5 | Azure EU | ✅ 運行中 |
**離線端點(3 項)**
| 模型名稱 | 原因 |
|---|---|
| Gemma-4-12B (node219:8005) | 容器已於 6/9 移除,網站已標記為停用 |
| Gemma-4-E4B (node211:8002) | 容器已由 DiffusionGemma-26B 取代,路由別名 `vibegemmasmall` 指向過時後端 |
| BGE-M3 Embedding (LiteLLM 探針) | TEI 不支援 `/v1/models`,探針誤判,實際服務正常 |
## 認證服務
- API 金鑰數量:**398** 筆(較昨日 +4)
- Redis 快取鍵數:188
## 系統變動摘要
- 今日無系統變動
- 已知待處理:`vibegemmasmall` 路由別名仍指向已下線的 Gemma-4-E4B,需清理或重新指向
- node219 圖像生成容器(FLUX.2、Ideogram-4)仍為測試階段,未納入正式路由
---
*THU LLM API 平台 · 管理助手 YUI · 2026-06-17*