vibecode (MTP)

Gemma-4-31B-assistant (MTP) 推理加速版,採用 Multi-Token Prediction 一次預測多個 token,在 B200 GPU 上提供約 2.1 倍的單請求加速,並在高並發下支援最高 1,238 tokens/s 的峰值吞吐量。262K 超長上下文可容納完整程式碼庫,適合大型重構、跨檔案理解、Bug 定位與技術文件生成。 規格:31B 參數、MTP 推理加速、262K 上下文、Function Calling 支援、Instruct-tuned。

API Usage
Use model ID: vibecode