## 更新內容
vibecode 模型已完成硬體與設定優化,上下文窗口從 32K 大幅提升至 **262,144 tokens**(256K 等效),單卡 B200 即可支援。
## 實測結果
在 node213 B200 GPU 上進行不同並發階測試,結果如下:
| 並發數 | 吞吐量(tokens/s) |
|--------|-------------------|
| 1 | 200 |
| 2 | 258 |
| 4 | 694 |
| 8 | **1,238**(峰值) |
| 16 | 1,198 |
單一請求加速比(vs 非 MTP 版本):約 2.1 倍
高並發峰值吞吐量:最高 **1,238 tokens/s**
## 適用場景
- 256K 上下文可容納完整中大型程式碼庫
- 大型重構、跨檔案理解、Bug 定位
- 長文件分析與總結
- 多輪對話保持完整上下文
---
更新時間:2026-05-07