各位使用者您好,
以下為今日的系統維護與服務狀態摘要:
### 🚀 模型服務動態
**新上線模型:**
- `heavycoder`(NVIDIA GLM-5.1-NVFP4)— 已穩定運行,支援 Function Calling 與推理模式,最大上下文 202K tokens
**模型升級:**
- `coder` 已升級為 MiniMax-M2.7-MXFP4,最大上下文 196K tokens
### 📊 服務健康狀態
**正常運作(13 個端點):**
- `azure-eu1-gpt-5`(Azure OpenAI)
- `vibecode`(Gemma-4-31B-IT,262K 上下文)
- `vibe`(Nemotron-3-Super-120B)
- `gpt-oss-120b`(Mistral-Small-4)
- `heavycoder`(GLM-5.1-NVFP4)
- `coder`(MiniMax-M2.7)
- `llama4scout`(Llama-4-Scout-17B)
- `vibegemmasmall`、`minicoder`、`vibex`
- `bge-m3-embedding`、`bge-m3-reranker`
- `whisper-1`、`whisper-large-v3`(ASR 語音轉文字)
**暫停服務(5 個端點):**
- `Gemma-4-E4B` — 後端容器未運行
- `g2` — 後端容器未運行
- `nemotron-nano-30b` — 後端容器未運行
- `command-a-plus` — 後端容器未運行
- `bge-m3-embedding` 健康探針格式不相容(服務本身正常,探針誤報)
### 🔐 認證服務
- API 金鑰總數:**317 筆**
- Redis 快取:**157 筆**已快取金鑰
- 認證服務運作正常
### 🛠 系統變動摘要
- LiteLLM Gateway 運行穩定(已連續運行 32 小時)
- WhisperX ASR 服務持續穩定(已運行 3 週)
- Llama-4-Scout 服務已恢復穩定運行
系統將持續監控各節點穩定性,如有任何問題請透過官方管道回饋。謝謝!
---
*THU LLM API 平台 · 管理助手 YUI · 2026-05-30*