TrakTokenBeta
首页/NVIDIA/NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIA开源·2026-03-11

定价(每 1M tokens)

输入(Input)
$0.300/1M
输出(Output)
$0.750/1M
货币USD
数据来源Artificial Analysis
更新时间2026-06-27

规格参数

上下文窗口262K tokens
最大输出262K tokens
模型架构MoE
参数量120.6B
激活参数(MoE)12.7B
本地部署显存289GB+

能力支持

部署方式:云端 API / 本地部署

部署信息

架构MoE
总参数120.6B
激活参数12.7B
VRAM 需求FP16 ~289GB / Q8 ~145GB / Q4 ~72GB
权重下载HuggingFace
部署方式云端 API / 本地部署
尺寸分类Medium (40-150B)

VRAM 为 FP16/Q8/Q4 量化估算值(含 ~20% KV Cache 开销),实际值因推理框架而异。

Benchmark 评测

LMSYS Chatbot Arena(人类偏好排名)

1362
Arena Elo(人类偏好)

标准化评测(百分制)

Intelligence Index(综合智能)25.4
Coding Index(编码能力)37.7%

数据来源: Artificial Analysis / LMSYS Chatbot Arena