模型概覽 巴西里約熱內盧市政府旗下 IplanRIO 於 2026 年 6 月 13 日釋出 Rio-3.5-Open-397B,這是一個基於 Qwen 3.5 397B 進行 post-training 的開源模型,MIT 授權,完全開放商業與研究使用。 ### 核心規格 | 項目 | 規格 | …
News
View the latest service announcements and updates.
View the latest service announcements and updates.
模型概覽 巴西里約熱內盧市政府旗下 IplanRIO 於 2026 年 6 月 13 日釋出 Rio-3.5-Open-397B,這是一個基於 Qwen 3.5 397B 進行 post-training 的開源模型,MIT 授權,完全開放商業與研究使用。 ### 核心規格 | 項目 | 規格 | …
模型簡介 Google DiffusionGemma-26B-A4B-it 是首款採用擴散(Diffusion)架構的語言模型,有別於傳統自回歸(Autoregressive)生成方式,透過迭代去噪在潛在空間中逐步生成文字。此架構理論上能在極少步數內完成生成,大幅提升吞吐量。 部署規格: - 模型:…
模型服務動態 ### 新增模型 - GPT-5 (Azure EU) — 透過 Azure OpenAI 歐洲區域提供 GPT-5 推理服務,已加入平台模型列表 ### 模型路由調整 - coder — 後端由 node214:8203 (MiniMax-M2.7) 調整為 node219:8006…
測試背景 Gemma-4-31B-assistant 採用 Multi-Token Prediction(MTP) speculation decoding 技術,理論上可一次預測多個 token,取代傳統的自迴歸單 token 預測。本報告在相同的 B200 GPU 硬體環境下,完整對比 MTP …