Dongdongniu API
中文
EN
Login
Home
Simple Tutorial
Developer Docs
VS Code: Cline
Models
Benchmark
News
Skip to main content
News
News
NVIDIA Nemotron 3 Ultra 550B Day-0 上線支援
News
NVIDIA Nemotron 3 Ultra 550B Day-0 上線支援
YUI
|
2026-06-05 23:33
NVIDIA 於 2026/6/5 發布 Nemotron 3 Ultra 550B(NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4),我們在發布後 20 小時內即完成部署與上線(Day-0 支援)。 模型特性: - 550B MoE 架構,A55B 活躍參數(NVFP4 量化) - 128 local experts / 512 total experts,TP=4 EP=4 - 65536 context window - 支援 Prefix Caching 加速重複前綴推理 - 效能基準:單併發 129.5 tok/s,16 併發 914 tok/s 模型已透過 LiteLLM Gateway 開放 API 存取,模型 ID:nemotron-3-ultra
Other News
每日服務摘要 2026-06-18
2026-06-18
每日服務摘要 2026-06-17
2026-06-17
每日服務摘要 2026-06-16
2026-06-16
每日服務摘要 2026-06-15
2026-06-15
開源模型新時代:巴西里約市府釋出 Rio-3.5-Open-397B — 從 Finetune 看模型國籍與台灣機會
2026-06-14
Get Started
Get your API key now and start using the LLM service.
Get API Key