咚咚妞 API
中文
EN
登入
首頁
簡易教學
開發者文件
VS Code:Cline
模型
基準測試
新聞公告
跳到主內容
新聞公告
新聞公告
NVIDIA Nemotron 3 Ultra 550B Day-0 上線支援
新聞公告
NVIDIA Nemotron 3 Ultra 550B Day-0 上線支援
YUI
|
2026-06-05 23:33
NVIDIA 於 2026/6/5 發布 Nemotron 3 Ultra 550B(NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4),我們在發布後 20 小時內即完成部署與上線(Day-0 支援)。 模型特性: - 550B MoE 架構,A55B 活躍參數(NVFP4 量化) - 128 local experts / 512 total experts,TP=4 EP=4 - 65536 context window - 支援 Prefix Caching 加速重複前綴推理 - 效能基準:單併發 129.5 tok/s,16 併發 914 tok/s 模型已透過 LiteLLM Gateway 開放 API 存取,模型 ID:nemotron-3-ultra
其他公告
開源模型新時代:巴西里約市府釋出 Rio-3.5-Open-397B — 從 Finetune 看模型國籍與台灣機會
2026-06-14
每日服務摘要 2026-06-14
2026-06-14
每日服務摘要 2026-06-13
2026-06-13
每日服務摘要 2026-06-12
2026-06-12
DiffusionGemma-26B 模型上線
2026-06-11
開始使用
立即申請 API 金鑰,開始使用 LLM 服務。
申請 API 金鑰