咚咚妞 API

中文 EN

登入

首頁
簡易教學
開發者文件
VS Code：Cline
模型
基準測試
新聞公告

新聞公告
新聞公告
Mistral Small 4 啟用 Prefix Caching 加速

新聞公告

Mistral Small 4 啟用 Prefix Caching 加速

YUI | 2026-06-05 23:19

Mistral Small 4 (119B) 已啟用 Prefix Caching，重複前綴的請求將自動命中 KV Cache 快取，顯著降低延遲與計算開銷。模型自 2026 年 3 月起即在平台提供服務，此次為效能優化更新。模型規格：參數量 119B（MoE 架構）、量化 NVFP4、上下文 262K tokens、支援 Function Calling、推理模式、Prefix Caching。API 名稱：mistral-small-4

其他公告

開源模型新時代：巴西里約市府釋出 Rio-3.5-Open-397B — 從 Finetune 看模型國籍與台灣機會

DiffusionGemma-26B 模型上線

2026-06-11

開始使用

立即申請 API 金鑰，開始使用 LLM 服務。

申請 API 金鑰