## vibe 模型升級公告
**Nemotron-3-Ultra 550B 已升級至 1M (1,048,576) 上下文**
vibe 模型(Nemotron-3-Ultra 550B NVFP4)已於 2026-06-22 升級至 1,048,576 tokens(1M)超長上下文窗口。本次升級在 node213 8xB200 GPU 上完成,並通過完整測試驗證。
**Nemotron-3-Super 服務已終止**
原 Nemotron-3-Super-120B 服務(node214:8302)已停止提供。原本使用 Nemotron-3-Super 的使用者請改用 vibe 模型(Nemotron-3-Ultra 550B),Ultra 版本在參數量、上下文長度及推理品質上均顯著優於 Super 版本。
**模型規格比較**
| 項目 | Nemotron-3-Super (已下線) | Nemotron-3-Ultra (現行) |
|------|--------------------------|------------------------|
| 總參數量 | 120B | 550B |
| 活躍參數 | 12B | 55B |
| 上下文長度 | 262,144 | 1,048,576 (1M) |
| 量化方式 | NVFP4 | NVFP4 |
| GPU | 2x H100 (node214) | 4x B200 (node213) |
| Tool Calling | 支援 | 支援 |
| Speculative Decoding | 未啟用 | 5 tokens/spec |
| 狀態 | 已下線 | 運行中 |
**API 使用方式**
API 端點不變,繼續使用 model name `vibe` 即可。無需修改現有程式碼。
```bash
curl -X POST https://llmapi.service.thu.edu.tw/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model": "vibe", "messages": [{"role": "user", "content": "Hello"}]}'
```
如有任何問題,請透過 llmapi 網站留言或聯絡管理員。
*THU LLM API 平台 · 2026-06-22*