咚咚妞 API
中文
EN
登入
首頁
簡易教學
開發者文件
VS Code:Cline
模型
基準測試
新聞公告
跳到主內容
新聞公告
新聞公告
NVIDIA Nemotron 3 Ultra 550B Day-0 上線支援
新聞公告
NVIDIA Nemotron 3 Ultra 550B Day-0 上線支援
YUI
|
2026-06-05 23:33
NVIDIA 於 2026/6/5 發布 Nemotron 3 Ultra 550B(NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4),我們在發布後 20 小時內即完成部署與上線(Day-0 支援)。 模型特性: - 550B MoE 架構,A55B 活躍參數(NVFP4 量化) - 128 local experts / 512 total experts,TP=4 EP=4 - 65536 context window - 支援 Prefix Caching 加速重複前綴推理 - 效能基準:單併發 129.5 tok/s,16 併發 914 tok/s 模型已透過 LiteLLM Gateway 開放 API 存取,模型 ID:nemotron-3-ultra
其他公告
每日服務摘要 2026-06-20
2026-06-20
每日服務摘要 2026-06-19
2026-06-19
每日服務摘要 2026-06-18
2026-06-18
每日服務摘要 2026-06-17
2026-06-17
每日服務摘要 2026-06-16
2026-06-16
開始使用
立即申請 API 金鑰,開始使用 LLM 服務。
申請 API 金鑰