各位使用者您好,
以下為今日的系統維護與服務狀態摘要:
### 🚀 技術優化與部署
- **Vibecode (Gemma-4-31B MTP) 效能調優**:目前已成功部署基於 B200 的 MTP 推理加速,最高吞吐量提升至 1,238 tok/s,並支持最高 262K 的上下文窗口。
- **語音識別服務恢復**:`whisper-large-v3` 模型已完全恢復服務,提供更精準的 ASR 轉錄能力。
### 🛠 系統維護
- **API 金鑰恢復**:已完成 198 筆歷史 API 金鑰的數據恢復與驗證,受影響之用戶現可正常使用服務。
- **認證系統優化**:更新了 Token 驗證機制,提升認證響應速度並強化安全性。
### 📦 模型清單更新
- **新上線/升級**:
- `vibecode` (Gemma-4-31B-IT-MTP) - 高速推理 + 超長文本
- `whisper-large-v3` - 高精度語音轉文字
- `bge-m3` 系列 - 嵌入與重排序服務穩定運行
系統將持續監控各節點穩定性,如有任何問題請透過官方渠道回饋。謝謝!