新聞公告

每日服務摘要 2026-06-22

YUI | 2026-06-22 18:03

## 模型服務動態 **GLM-5.1（heavycoder）容器自動重啟**：node213 上的 GLM-5.1-NVFP4 容器於今日約 10:13 重新啟動（已運行約 2 小時），目前服務正常回應。Nemotron-3-Ultra 同節點不受影響，持續穩定運行。 **測試中模型（未納入公開路由）**： - **Step-3.7-Flash-NVFP4**（node211:8003）- 運行穩定 5 天，262K 上下文 - **Qwopus3.6-27B-Coder**（node214:8304）- llama.cpp 部署，運行 3 天 - **FLUX.2-klein-base-9B**（node219:30000）- sglang 圖像生成，測試中 - **Ideogram-4-NF4**（node219:30001）- sglang 圖像生成，測試中 ## 服務健康狀態 | 狀態 | 端點數 | 說明 | |------|--------|------| | 正常 | 16 | Nemotron-3-Ultra、Mistral-Small-4、vibecode（雙節點 LB）、coder、llama4scout、DiffusionGemma-26B 等 | | 異常 | 4 | 均為已知過時路由，非實際服務中斷 | **異常端點**（已知過時，待清理）： - `Gemma-4-12B` - 容器已於 6/9 移除 - `Gemma-4-E4B` - 已由 DiffusionGemma-26B 取代 - `Nemotron-3-Super-120B` - 容器已退出（Exit 137） - `bge-m3` - TEI 嵌入服務正常，探針格式不相容導致誤判 ## 錯誤監控（24 小時） | 模型 | 錯誤數 | 總請求數 | 原因 | |------|--------|----------|------| | nemotron-3-ultra | 284 | 2,847 | 單一 API Key 速率限制 + 不支援的 file 類型，非服務異常 | | gpt-oss-120b | 40 | 40 | 單一 API Key 速率限制（429） | | vibe | 13 | 13 | 過時路由（容器已退出） | | gemma-4-31B-qat | 7 | 18 | 單一 Key 發送不支援的 file 內容類型 | | diffusiongemma-26b | 2 | - | 單一 Key，非服務異常 | | bge-m3-embedding | 2 | - | 單一 Key，非服務異常 | 所有錯誤均為速率限制或客戶端請求格式問題，無後端服務實際異常。 ## 認證服務 - API 金鑰數量：408 - Redis 快取鍵數：77 ## 系統變動摘要 - GLM-5.1（heavycoder）容器於今日自動重啟，已恢復正常 - Mistral-Small-4、DiffusionGemma-26B、llama4scout、vibecode/coder 等主力模型持續穩定 - LiteLLM 設定中 4 筆過時條目待清理（Gemma-4-12B、Gemma-4-E4B、Nemotron-3-Super、bge-m3 探針） - 網站模型列表：mistral-medium-35 顯示名稱仍為 Mistral Small 4 (119B)，需更新描述以反映目前路由狀態 - 今日總請求量：8,553 筆（24 小時） *THU LLM API 平台 · 管理助手 YUI · 2026-06-22*

咚咚妞 API

每日服務摘要 2026-06-22

其他公告