報告

每日服務摘要 2026-06-05

YUI | 2026-06-05 18:02

## 模型服務動態 ### 新增模型 - **GPT-5 (Azure EU)** — 透過 Azure OpenAI 歐洲區域提供 GPT-5 推理服務，已加入平台模型列表 ### 模型路由調整 - **coder** — 後端由 node214:8203 (MiniMax-M2.7) 調整為 node219:8006 (Gemma-4-31B-NVFP4)，名稱同步更新 - **vibecode** — 後端由 node213:8014 調整為 node219:8006 (Gemma-4-31B-IT)，統一由 node219 提供服務 ### node219 新部署 - Gemma-4-26B (NVFP4 量化) — port 8004，32K 上下文 - Gemma-4-31B (NVFP4 量化) — port 8006，262K 上下文 ## 服務健康狀態 ### 正常運行 (11 endpoints) | 模型 | 後端 | |------|------| | gpt-5 (Azure EU) | Azure OpenAI | | Gemma-4-31B (vibecode/coder) | node219:8006 | | Nemotron-3-Super-120B (vibe) | node213:8302 + 8305 | | heavycoder (GLM-5.1) | node213:8309 | | llama4scout | node219:8000 | | gpt-oss-120b | node213:8301 | | bge-m3-reranker | tei-rerank-proxy | | whisper-1 / whisper-large-v3 | node212:9000 | | bge-m3-embedding | bge-m3:8301 (探針格式不相容，服務正常) | ### 離線/異常 (4 endpoints) | 模型 | 狀態說明 | |------|----------| | vibegemmasmall (Gemma-4-E4B) | node211:8002 無對應容器 | | minicoder | node214:8203 無對應容器 | | command-a-plus | node213:8020 容器未運行 | | bge-m3-embedding | LiteLLM 健康探針誤判 (TEI 不支援 /v1/models，服務實際可用) | ### node211 gpt-oss 容器異常 node211 上 `mistralsmall4-vllm-gpt-oss-1` 容器狀態為 `unhealthy`，日誌顯示 KV cache 記憶體不足 (需要 21.48 GiB，僅有 5.2 GiB)，導致模型載入失敗。gpt-oss-120b 服務已由 node213:8301 接管，不影響使用者。 ## 認證服務 - API 金鑰數量：351 組 (較前次 +8) - Redis 快取：84 筆 ## 系統變動摘要 - `coder` 與 `vibecode` 路由統一指向 node219 Gemma-4-31B-NVFP4 實例 - 網站模型列表新增 GPT-5 (Azure EU)，更新 coder 及 vibecode 描述 - node211 Mistral-Medium-3.5-128B 容器運行中 (port 8001)，尚未加入 LiteLLM 路由 - node213 `nvidia-glm51` 容器更名，服務 heavycoder (GLM-5.1-NVFP4)

咚咚妞 API

每日服務摘要 2026-06-05

其他公告