## 模型服務動態
### 新增模型
- **GPT-5 (Azure EU)** — 透過 Azure OpenAI 歐洲區域提供 GPT-5 推理服務,已加入平台模型列表
### 模型路由調整
- **coder** — 後端由 node214:8203 (MiniMax-M2.7) 調整為 node219:8006 (Gemma-4-31B-NVFP4),名稱同步更新
- **vibecode** — 後端由 node213:8014 調整為 node219:8006 (Gemma-4-31B-IT),統一由 node219 提供服務
### node219 新部署
- Gemma-4-26B (NVFP4 量化) — port 8004,32K 上下文
- Gemma-4-31B (NVFP4 量化) — port 8006,262K 上下文
## 服務健康狀態
### 正常運行 (11 endpoints)
| 模型 | 後端 |
|------|------|
| gpt-5 (Azure EU) | Azure OpenAI |
| Gemma-4-31B (vibecode/coder) | node219:8006 |
| Nemotron-3-Super-120B (vibe) | node213:8302 + 8305 |
| heavycoder (GLM-5.1) | node213:8309 |
| llama4scout | node219:8000 |
| gpt-oss-120b | node213:8301 |
| bge-m3-reranker | tei-rerank-proxy |
| whisper-1 / whisper-large-v3 | node212:9000 |
| bge-m3-embedding | bge-m3:8301 (探針格式不相容,服務正常) |
### 離線/異常 (4 endpoints)
| 模型 | 狀態說明 |
|------|----------|
| vibegemmasmall (Gemma-4-E4B) | node211:8002 無對應容器 |
| minicoder | node214:8203 無對應容器 |
| command-a-plus | node213:8020 容器未運行 |
| bge-m3-embedding | LiteLLM 健康探針誤判 (TEI 不支援 /v1/models,服務實際可用) |
### node211 gpt-oss 容器異常
node211 上 `mistralsmall4-vllm-gpt-oss-1` 容器狀態為 `unhealthy`,日誌顯示 KV cache 記憶體不足 (需要 21.48 GiB,僅有 5.2 GiB),導致模型載入失敗。gpt-oss-120b 服務已由 node213:8301 接管,不影響使用者。
## 認證服務
- API 金鑰數量:351 組 (較前次 +8)
- Redis 快取:84 筆
## 系統變動摘要
- `coder` 與 `vibecode` 路由統一指向 node219 Gemma-4-31B-NVFP4 實例
- 網站模型列表新增 GPT-5 (Azure EU),更新 coder 及 vibecode 描述
- node211 Mistral-Medium-3.5-128B 容器運行中 (port 8001),尚未加入 LiteLLM 路由
- node213 `nvidia-glm51` 容器更名,服務 heavycoder (GLM-5.1-NVFP4)