咚咚妞 API

中文 EN

登入

首頁
簡易教學
開發者文件
VS Code：Cline
模型
基準測試
新聞公告

跳到主內容

新聞公告
新聞公告
[修復] Nemotron-3-Ultra 路由異常修復 & API Key 模型權限更新

新聞公告

[修復] Nemotron-3-Ultra 路由異常修復 & API Key 模型權限更新

YUI | 2026-06-06 00:26

## 問題說明今日 23:55~00:25 期間，請求 nemotron-3-ultra 模型時，系統實際路由至 nemotron-3-super 後端，導致使用者收到錯誤模型的回應。此問題已於 00:25 修復。 ## 影響範圍 - 影響期間：2026/06/05 23:55 ~ 06/06 00:25（約 30 分鐘） - 透過 API 呼叫 nemotron-3-ultra 的使用者，實際回應來自 nemotron-3-super（node214），而非 nemotron-3-ultra（node213） - 影響症狀：回應品質與預期的 Ultra 550B 模型不符（實際為 Super 120B 模型） ## 根因分析 1. default_fallbacks 設定：litellm 設有 default_fallbacks（vibe、vibecode），當請求的模型名稱不在 API Key 的模型權限清單時，系統會靜默 fallback 至 vibe（即 nemotron-3-super），而非回傳權限錯誤 2. API Key 權限缺失：大部分 API Key 未包含 nemotron-3-ultra 模型權限，導致請求被 fallback 機制錯誤路由 3. 靜默降級：使用者端未收到任何錯誤或警告，回應中模型名稱被 litellm 覆寫為請求的名稱，難以從回應辨識問題 ## 修復措施 1. 所有 API Key 已更新，新增 nemotron-3-ultra 模型權限（352 把 key） 2. 原本 models=[]（全部模型可用）的 key 因修復過程意外被限縮，已全部恢復為空陣列（260 把 key） 3. default_fallbacks 保留，但因所有 key 已有正確權限，不再觸發錯誤路由 ## 驗證結果 - nemotron-3-ultra streaming 請求現在正確路由至 node213:8310（Ultra 550B） - 回應中模型名稱與請求一致 - 不再出現 streaming chunk model mismatch 警告 ## 使用建議若您在受影響期間（23:55~00:25）使用 nemotron-3-ultra 進行重要任務，建議重新執行以確保結果來自正確的模型。

其他公告

每日服務摘要 2026-06-13

每日服務摘要 2026-06-12

DiffusionGemma-26B 模型上線

DiffusionGemma-26B 模型基準測試報告

每日服務摘要 2026-06-11

開始使用

立即申請 API 金鑰，開始使用 LLM 服務。

申請 API 金鑰

Copyright © 2025 - 2026 東海大學. All rights reserved.