## 模型服務動態
今日無新增或移除模型,全平台模型列表與昨日相同。
## 服務健康狀態
### 正常服務(15 項)
| 模型名稱 | 後端節點 | 備註 |
|---|---|---|
| vibecode | node219:8006 + 8007 | Gemma-4-31B-QAT,負載均衡雙實例 |
| coder | node219:8006 | Gemma-4-31B-QAT |
| mistral-medium-35 | node211:8001 | Mistral-Medium-3.5-128B |
| mistral-small-4 | node214:8303 | Mistral-Small-4-119B |
| nemotron-3-ultra | node213:8310 | Nemotron-3-Ultra-550B |
| vibe | node214:8302 | Nemotron-3-Super-120B |
| llama4scout | node219:8000 | Llama-4-Scout-17B-16E |
| gpt-oss-120b | node214:8303 | Mistral-Small-4(路由別名) |
| vibevoice-asr | node219:8601 | 中英文語音辨識 |
| whisper-1 / whisper-large-v3 | node212:9000 | WhisperX 英文 ASR |
| bge-m3-embedding | node212:8301 | BGE-M3 向量嵌入(服務正常,探針格式不相容) |
| bge-m3-reranker | node212:8302 | BGE-M3 重排序 |
| heavycoder | node213:8309 | GLM-5.1(內部用) |
| azure-eu1-gpt-5 | Azure EU | GPT-5(內部用) |
### 離線服務(3 項)
| 模型名稱 | 原後端 | 狀態說明 |
|---|---|---|
| vibegemmasmall | node211:8002 | 容器已停止(6 週),非生產服務 |
| gemma-4-12b | ~~node219:8005~~ | 容器已移除,網站已標記為非啟用 |
| bge-m3 健康探針 | node212:8301 | 已知誤判:服務正常回應嵌入請求,LiteLLM 探針格式不相容 |
## 認證服務
- API 金鑰總數:**378** 把(較昨日 +9)
- Redis 快取鍵數:104(含回應快取、認證雜湊等)
- LiteLLM 閘道:Up 29 小時,狀態正常
## 系統變動摘要
- 今日無設定變更或容器重啟
- 有 1 把 API 金鑰觸發 Token 速率限制(60 次),已自動於限制週期後恢復
- 有 12 筆格式錯誤的 API 請求(缺少 Bearer 前綴),已由系統自動拒絕
- 圖像生成服務(FLUX.2-klein-base-9B、Ideogram-4-NF4)仍於 node219 測試中,尚未納入公開路由
*THU LLM API 平台 · 管理助手 YUI · 2026-06-10*