TrakTokenBeta

开源模型选型指南

327 个开源模型,覆盖主流厂商。按参数规模、架构类型、VRAM 需求筛选, 找到最适合你硬件条件的开源模型。

Large
93
Medium
62
Small
135
Tiny
36

智能指数 vs VRAM 需求 (Q4)

气泡大小 = 参数量,右下 = 高智能低显存 (部署性价比),近 18 个月模型,共 265 个数据点 · 更新于 2026/06/27

TrakToken
https://www.traktoken.com
共 327 个开源模型
排序:

GLM-5.2 (max)

Z AI (智谱 AI)CN
1 周前
IQ51.1
|753BMoE
fp161.8TB
q8904GB
q4452GB
上下文 1M
HF

MiniMax-M3

MiniMaxCN
3 周前
IQ44.4
|427BMoE
fp161.0TB
q8512GB
q4256GB
上下文 1M
HF

DeepSeek V4 Pro (Reasoning, Max Effort)

DeepSeekCN
2 个月前
IQ44.3
|1.6T / 49BMoE
fp163.8TB
q81.9TB
q4960GB
上下文 1M
HF

Kimi K2.6

月之暗面CN
2 个月前
IQ42.8
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

MiMo-V2.5-Pro

小米CN
2 个月前
IQ42.2
|1T / 42BMoE
fp162.4TB
q81.2TB
q4600GB
上下文 1M
HF

Kimi K2.7 Code

月之暗面CN
2 周前
IQ41.9
|1.1TMoE
fp162.5TB
q81.3TB
q4636GB
HF

Nex-N2-Pro

Nex AGI
3 周前
IQ41.0
|397BMoE
fp16953GB
q8476GB
q4238GB
HF

DeepSeek V4 Pro (Reasoning, High Effort)

DeepSeekCN
2 个月前
IQ40.8
|1.6T / 49BMoE
fp163.8TB
q81.9TB
q4960GB
上下文 1M
HF

DeepSeek V4 Flash (Reasoning, Max Effort)

DeepSeekCN
2 个月前
IQ40.3
|284B / 13BMoE
fp16682GB
q8341GB
q4170GB
上下文 1M
HF

GLM-5.1 (Reasoning)

Z AI (智谱 AI)CN
2 个月前
IQ40.2
|744B / 40BMoE
fp161.8TB
q8893GB
q4446GB
上下文 203K
HF

MiMo-V2.5

小米CN
2 个月前
IQ40.1
|310B / 15BMoE
fp16744GB
q8372GB
q4186GB
上下文 1M
HF

GLM-5 (Reasoning)

Z AI (智谱 AI)CN
4 个月前
IQ39.5
|744B / 40BMoE
fp161.8TB
q8893GB
q4446GB
上下文 203K
HF

MiniMax-M2.7

MiniMaxCN
3 个月前
IQ38.1
|230B / 10BMoE
fp16552GB
q8276GB
q4138GB
上下文 205K
HF

Kimi K2.5 (Reasoning)

月之暗面CN
5 个月前
IQ38.1
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

Nemotron 3 Ultra 550B A55B (Reasoning)

NVIDIA
3 周前
IQ37.8
|550B / 55BMoE
fp161.3TB
q8660GB
q4330GB

DeepSeek V4 Flash (Reasoning, High Effort)

DeepSeekCN
2 个月前
IQ37.4
|284B / 13BMoE
fp16682GB
q8341GB
q4170GB
上下文 1M
HF

Qwen3.6 27B (Reasoning)

阿里云CN
2 个月前
IQ37.1
|27.8BDense
fp1667GB
q833GB
q417GB
上下文 262K
HF

GLM-5.1 (Non-reasoning)

Z AI (智谱 AI)CN
2 个月前
IQ35.4
|744B / 40BMoE
fp161.8TB
q8893GB
q4446GB
上下文 203K
HF

Kimi K2.6 (Non-reasoning)

月之暗面CN
2 个月前
IQ34.6
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

Qwen3.5 27B (Reasoning)

阿里云CN
4 个月前
IQ33.8
|27.8BDense
fp1667GB
q833GB
q417GB
上下文 262K
HF

GLM-4.7 (Reasoning)

Z AI (智谱 AI)CN
6 个月前
IQ33.8
|357B / 32BMoE
fp16857GB
q8428GB
q4214GB
上下文 203K
HF

Qwen3.5 397B A17B (Reasoning)

阿里云CN
4 个月前
IQ33.7
|397B / 17BMoE
fp16953GB
q8476GB
q4238GB
上下文 256K
HF

MiniMax-M2.5

MiniMaxCN
4 个月前
IQ33.7
|230B / 10BMoE
fp16552GB
q8276GB
q4138GB
上下文 205K
HF

Hy3-preview (Reasoning)

腾讯云CN
2 个月前
IQ33.6
|295B / 21BMoE
fp16708GB
q8354GB
q4177GB
上下文 262K
HF

VRAM 兼容性检查器

选择你的显卡和量化级别,查看可运行的开源模型列表

x
NVIDIA RTX 4090x 1 =24GB总显存(Q4 量化)
可运行 166 个开源模型
IQ 37.117GB
IQ 33.817GB
IQ 31.622GB
IQ 29.418GB
IQ 29.317GB
IQ 29.322GB
IQ 29.317GB
IQ 25.715GB
IQ 25.06GB
IQ 24.222GB
IQ 23.422GB
EXAONE 4.5 33B
IQ 23.021GB
GLM-4.7-Flash (Reasoning)MoE
IQ 22.919GB
IQ 22.07GB
IQ 21.319GB
IQ 21.29GB
IQ 20.59GB
IQ 20.36GB
IQ 20.13GB
IQ 18.322GB
IQ 17.920GB
IQ 16.03GB
IQ 15.818GB
IQ 15.519GB
IQ 14.913GB
IQ 14.313GB
ZAYA1-8BMoE
IQ 14.15GB
IQ 13.618GB
IQ 13.613GB
QwQ 32B
IQ 13.420GB
IQ 13.318GB
IQ 13.114GB
IQ 12.55GB
Tri-21B-Think
IQ 12.413GB
IQ 12.02GB
IQ 12.01GB
IQ 11.914GB
IQ 11.814GB
IQ 11.120GB
Ministral 3 14B
IQ 11.18GB
IQ 11.019GB
IQ 10.714GB
IQ 10.65GB
IQ 10.619GB
IQ 10.520GB
IQ 10.45GB
IQ 10.21GB
IQ 10.19GB
IQ 10.12GB
IQ 10.018GB
IQ 9.84GB
IQ 9.621GB
Step3 VL 10B
IQ 9.56GB
IQ 9.318GB
IQ 9.33GB
IQ 9.314GB
IQ 9.220GB
IQ 9.118GB
IQ 9.114GB
Ministral 3 8B
IQ 9.05GB
IQ 8.95GB
IQ 8.918GB
IQ 8.81GB
IQ 8.620GB
IQ 8.614GB
IQ 8.42GB
IQ 8.45GB
Olmo 3.1 32B Think
IQ 8.119GB
IQ 7.93GB
IQ 7.519GB
IQ 7.45GB
IQ 7.119GB
IQ 7.12GB
IQ 7.09GB
Mistral Small 3
IQ 6.914GB
IQ 6.818GB
IQ 6.82GB
Ministral 3 3B
IQ 6.82GB
IQ 6.75GB
IQ 6.619GB
Olmo 3.1 32B Instruct
IQ 6.519GB
Olmo 3 32B Think
IQ 6.419GB
IQ 6.43GB
Solar Mini
IQ 6.26GB
IQ 6.019GB
IQ 5.219GB
IQ 5.15GB
IQ 5.121GB
OLMo 2 32B
IQ 5.019GB
IQ 5.01GB
Phi-4
IQ 4.98GB
LFM2 24B A2BMoE
IQ 4.914GB
IQ 4.816GB
IQ 4.713GB
IQ 4.62GB
IQ 4.55GB
IQ 4.53GB
IQ 4.34GB
IQ 4.21GB
IQ 4.12GB
IQ 4.13GB
IQ 4.113GB
Olmo 3 7B Think
IQ 4.04GB
OLMo 2 7B
IQ 3.94GB
Molmo 7B-D
IQ 3.85GB
Ling-mini-2.0MoE
IQ 3.810GB
IQ 3.47GB
IQ 3.22GB
IQ 3.110GB
Phi-4 Mini Instruct
IQ 3.02GB
IQ 3.08GB
IQ 3.04GB
IQ 3.014GB
IQ 2.91GB
Olmo 3 7B Instruct
IQ 2.84GB
IQ 2.81GB
IQ 2.71GB
LFM2 2.6B
IQ 2.72GB
IQ 2.71GB
IQ 2.71GB
IQ 2.61GB
IQ 2.42GB
Qwen Chat 14B
IQ 2.18GB
IQ 2.121GB
IQ 2.11GB
IQ 2.14GB
Molmo2-8B
IQ 2.05GB
LFM2 8B A1BMoE
IQ 1.85GB
IQ 1.51GB
IQ 1.25GB
IQ 1.25GB
IQ 1.13GB
LFM2 1.2B
IQ 1.11GB
IQ 1.02GB
IQ 1.01GB
IQ 1.04GB
IQ 1.01GB
Apertus 8B Instruct
IQ 1.05GB

VRAM 需求为估算值(含 ~20% KV Cache 开销),实际值因推理框架(vLLM / llama.cpp / TGI)而异。 MoE 模型需全量加载权重,推理时仅激活部分参数。