vibe

高效能通用對話模型,以 NVIDIA Nemotron-3-Super-120B 為骨幹,採用 NVFP4 量化在保持品質的同時最大化 throughput。適合大量文字生成、客服機器人、內容摘要與多輪對話。 規格:120B 參數、NVFP4 量化、吞吐量約 150 tokens/s、多語言支援。

API Usage
Use model ID: vibe