## 模型服務動態
### vibecode 負載均衡啟用
vibecode (Gemma-4-31B-QAT) 新增第二個後端實例(port 8007),LiteLLM 路由已配置負載均衡,目前由 port 8006 及 8007 兩個 QAT 實例同時提供服務,可提升並行處理能力。
### Gemma-4-12B-it 服務暫停
node219 上的 Gemma-4-12B-it 容器已移除,網站模型列表已同步標記為非啟用狀態。此模型如需恢復,將另行公告。
### ASR 服務遷移
語音辨識服務由原先閘道端 FunASR 容器遷移至 node219 上的 vibevoice-asr 容器(port 8601),已透過 LiteLLM 路由 vibecodevoice-asr 提供服務。功能不變,仍支援中英文語音轉文字。
### 圖像生成服務測試中
node219 新增兩個圖像生成容器(FLUX.2-klein-base-9B 及 Ideogram-4-NF4),目前處於測試階段,尚未納入 LiteLLM 公開路由。
## 服務健康狀態
正常服務(12 項):
| 模型 | 狀態 |
|------|------|
| nemotron-3-ultra | 正常 |
| mistral-medium-35 | 正常 |
| mistral-small-4 / gpt-oss-120b | 正常 |
| vibe (Nemotron-3-Super) | 正常 |
| vibecode / coder (Gemma-4-31B-QAT) | 正常 |
| llama4scout | 正常 |
| heavycoder | 正常 |
| bge-m3-reranker | 正常 |
| whisper-1 / whisper-large-v3 | 正常 |
| azure-eu1-gpt-5 | 正常 |
| vibecodevoice-asr | 正常 |
離線 / 異常(4 項):
| 模型 | 狀態 | 說明 |
|------|------|------|
| gemma-4-12b | 離線 | 容器已移除,網站已標記非啟用 |
| vibegemmasmall (Gemma-4-E4B) | 離線 | node211:8002 容器已停止 |
| bge-m3-embedding | 探針誤判 | TEI 不支援 /v1/models,服務本身正常可用 |
| Gemma-4-26B | 離線 | node219 容器已停止(已由 QAT 接替) |
## 認證服務
- API 金鑰數量:376 組
- Redis 快取鍵數:111
## 系統變動摘要
1. vibecode 負載均衡:新增 port 8007 後端,雙實例並行服務
2. Gemma-4-12B-it 下線:容器移除,網站模型列表已更新
3. ASR 服務遷移:FunASR 從閘道遷移至 node219 vibevoice-asr 容器
4. 圖像生成服務:node219 新增 FLUX.2-klein 及 Ideogram-4 容器(測試中)
*THU LLM API 平台 · 管理助手 YUI · 2026-06-09*