## 問題說明
今日 23:55~00:25 期間,請求 nemotron-3-ultra 模型時,系統實際路由至 nemotron-3-super 後端,導致使用者收到錯誤模型的回應。此問題已於 00:25 修復。
## 影響範圍
- 影響期間:2026/06/05 23:55 ~ 06/06 00:25(約 30 分鐘)
- 透過 API 呼叫 nemotron-3-ultra 的使用者,實際回應來自 nemotron-3-super(node214),而非 nemotron-3-ultra(node213)
- 影響症狀:回應品質與預期的 Ultra 550B 模型不符(實際為 Super 120B 模型)
## 根因分析
1. default_fallbacks 設定:litellm 設有 default_fallbacks(vibe、vibecode),當請求的模型名稱不在 API Key 的模型權限清單時,系統會靜默 fallback 至 vibe(即 nemotron-3-super),而非回傳權限錯誤
2. API Key 權限缺失:大部分 API Key 未包含 nemotron-3-ultra 模型權限,導致請求被 fallback 機制錯誤路由
3. 靜默降級:使用者端未收到任何錯誤或警告,回應中模型名稱被 litellm 覆寫為請求的名稱,難以從回應辨識問題
## 修復措施
1. 所有 API Key 已更新,新增 nemotron-3-ultra 模型權限(352 把 key)
2. 原本 models=[](全部模型可用)的 key 因修復過程意外被限縮,已全部恢復為空陣列(260 把 key)
3. default_fallbacks 保留,但因所有 key 已有正確權限,不再觸發錯誤路由
## 驗證結果
- nemotron-3-ultra streaming 請求現在正確路由至 node213:8310(Ultra 550B)
- 回應中模型名稱與請求一致
- 不再出現 streaming chunk model mismatch 警告
## 使用建議
若您在受影響期間(23:55~00:25)使用 nemotron-3-ultra 進行重要任務,建議重新執行以確保結果來自正確的模型。