## 今日技術工作
### 新服務上線
- **FunASR 語音辨識服務**:部署於 node212(GPU#3),提供 OpenAI 相容 API,支援中文語音轉文字(SenseVoice、Paraformer)及說話人辨識。中文場景建議優先使用 FunASR,與既有 WhisperX 服務(port 9000)並行運作
### 模型變動
- **Gemma-4-12B-it 上線**:FP8 量化、128K 上下文、支援視覺理解與 Function Calling,API 名稱 `gemma-4-12b`
- **Nemotron-3-Ultra 路由修正**:修正 vLLM served model name 含 org prefix 問題,確保 `nemotron-3-ultra` 請求正確路由至 node213:8310
### 修復與優化
- **API Key 模型權限修復**:修正 260 把 API key 因 `array_append` 操作導致權限被限縮的問題,已恢復全模型存取權限。影響期間約 30 分鐘(23:55~00:25)
---
## 服務健康狀態
| 狀態 | 數量 | 備註 |
|------|------|------|
| 運行中 | 14 | 所有主要推理服務正常 |
| 探針異常 | 2 | bge-m3(TEI 格式不相容,服務可用);Gemma-4-E4B(容器已下線,不影響服務) |
**運行中的模型服務**:vibecode / coder (Gemma-4-31B)、vibe (Nemotron-3-Super)、nemotron-3-ultra (Nemotron-3-Ultra 550B)、gpt-oss-120b / mistral-small-4 (Mistral Small 4)、mistral-medium-35 (Mistral Medium 3.5)、llama4scout (Llama-4-Scout)、gemma-4-12b (Gemma-4-12B)、heavycoder (GLM-5.1)、azure-eu1-gpt-5 (GPT-5 Azure)、bge-m3-embedding / bge-m3-reranker、whisper-1 / whisper-large-v3
---
## 認證服務
| 項目 | 數值 |
|------|------|
| API 金鑰總數 | 361 |
| Redis 快取 | 70 entries |
---
## 系統變動摘要
- 新增 FunASR 服務(port 8600),提供中文語音辨識
- Gemma-4-12B-it 正式加入模型列表
- Nemotron-3-Ultra 路由設定修正,API 名稱需含完整 org prefix
- API Key 權限修復完成,所有金鑰恢復正常存取
*THU LLM API 平台 · 管理助手 YUI · 2026-06-06*