开源模型选型指南
327 个开源模型,覆盖主流厂商。按参数规模、架构类型、VRAM 需求筛选, 找到最适合你硬件条件的开源模型。
Large
93
Medium
62
Small
135
Tiny
36
智能指数 vs VRAM 需求 (Q4)
气泡大小 = 参数量,右下 = 高智能低显存 (部署性价比),近 18 个月模型,共 265 个数据点 · 更新于 2026/06/27
TrakToken
https://www.traktoken.com
共 327 个开源模型
排序:
GLM-5.2 (max)
Z AI (智谱 AI)CN
1 周前
IQ51.1
|753BMoEfp161.8TB
q8904GB
q4452GB
上下文 1M
HFMiniMax-M3
MiniMaxCN
3 周前
IQ44.4
|427BMoEfp161.0TB
q8512GB
q4256GB
上下文 1M
HFDeepSeek V4 Pro (Reasoning, Max Effort)
DeepSeekCN
2 个月前
IQ44.3
|1.6T / 49BMoEfp163.8TB
q81.9TB
q4960GB
上下文 1M
HFKimi K2.6
月之暗面CN
2 个月前
IQ42.8
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
MiMo-V2.5-Pro
小米CN
2 个月前
IQ42.2
|1T / 42BMoEfp162.4TB
q81.2TB
q4600GB
上下文 1M
HFKimi K2.7 Code
月之暗面CN
2 周前
IQ41.9
|1.1TMoEfp162.5TB
q81.3TB
q4636GB
HF
Nex-N2-Pro
Nex AGI
3 周前
IQ41.0
|397BMoEfp16953GB
q8476GB
q4238GB
HF
DeepSeek V4 Pro (Reasoning, High Effort)
DeepSeekCN
2 个月前
IQ40.8
|1.6T / 49BMoEfp163.8TB
q81.9TB
q4960GB
上下文 1M
HFDeepSeek V4 Flash (Reasoning, Max Effort)
DeepSeekCN
2 个月前
IQ40.3
|284B / 13BMoEfp16682GB
q8341GB
q4170GB
上下文 1M
HFGLM-5.1 (Reasoning)
Z AI (智谱 AI)CN
2 个月前
IQ40.2
|744B / 40BMoEfp161.8TB
q8893GB
q4446GB
上下文 203K
HFMiMo-V2.5
小米CN
2 个月前
IQ40.1
|310B / 15BMoEfp16744GB
q8372GB
q4186GB
上下文 1M
HFGLM-5 (Reasoning)
Z AI (智谱 AI)CN
4 个月前
IQ39.5
|744B / 40BMoEfp161.8TB
q8893GB
q4446GB
上下文 203K
HFMiniMax-M2.7
MiniMaxCN
3 个月前
IQ38.1
|230B / 10BMoEfp16552GB
q8276GB
q4138GB
上下文 205K
HFKimi K2.5 (Reasoning)
月之暗面CN
5 个月前
IQ38.1
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
Nemotron 3 Ultra 550B A55B (Reasoning)
NVIDIA
3 周前
IQ37.8
|550B / 55BMoEfp161.3TB
q8660GB
q4330GB
DeepSeek V4 Flash (Reasoning, High Effort)
DeepSeekCN
2 个月前
IQ37.4
|284B / 13BMoEfp16682GB
q8341GB
q4170GB
上下文 1M
HFQwen3.6 27B (Reasoning)
阿里云CN
2 个月前
IQ37.1
|27.8BDensefp1667GB
q833GB
q417GB
上下文 262K
HFGLM-5.1 (Non-reasoning)
Z AI (智谱 AI)CN
2 个月前
IQ35.4
|744B / 40BMoEfp161.8TB
q8893GB
q4446GB
上下文 203K
HFKimi K2.6 (Non-reasoning)
月之暗面CN
2 个月前
IQ34.6
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
Qwen3.5 27B (Reasoning)
阿里云CN
4 个月前
IQ33.8
|27.8BDensefp1667GB
q833GB
q417GB
上下文 262K
HFGLM-4.7 (Reasoning)
Z AI (智谱 AI)CN
6 个月前
IQ33.8
|357B / 32BMoEfp16857GB
q8428GB
q4214GB
上下文 203K
HFQwen3.5 397B A17B (Reasoning)
阿里云CN
4 个月前
IQ33.7
|397B / 17BMoEfp16953GB
q8476GB
q4238GB
上下文 256K
HFMiniMax-M2.5
MiniMaxCN
4 个月前
IQ33.7
|230B / 10BMoEfp16552GB
q8276GB
q4138GB
上下文 205K
HFHy3-preview (Reasoning)
腾讯云CN
2 个月前
IQ33.6
|295B / 21BMoEfp16708GB
q8354GB
q4177GB
上下文 262K
HFVRAM 兼容性检查器
选择你的显卡和量化级别,查看可运行的开源模型列表
x
NVIDIA RTX 4090x 1 =24GB总显存(Q4 量化)
可运行 166 个开源模型
IQ 37.117GB
IQ 33.817GB
IQ 31.622GB
IQ 29.418GB
IQ 29.317GB
IQ 29.322GB
IQ 29.317GB
IQ 25.715GB
IQ 25.06GB
IQ 24.818GB
IQ 24.222GB
IQ 23.422GB
IQ 23.021GB
IQ 22.919GB
IQ 22.07GB
IQ 21.319GB
IQ 21.29GB
IQ 20.59GB
IQ 20.36GB
IQ 20.13GB
IQ 20.115GB
IQ 18.322GB
IQ 17.920GB
IQ 17.019GB
IQ 16.03GB
IQ 15.818GB
IQ 15.519GB
IQ 14.918GB
IQ 14.913GB
IQ 14.313GB
IQ 14.219GB
ZAYA1-8BMoE
IQ 14.15GB
IQ 13.618GB
IQ 13.613GB
IQ 13.420GB
IQ 13.318GB
IQ 13.27GB
IQ 13.114GB
IQ 12.55GB
IQ 12.413GB
IQ 12.02GB
IQ 12.01GB
IQ 11.914GB
IQ 11.814GB
IQ 11.71GB
IQ 11.120GB
IQ 11.18GB
IQ 11.019GB
IQ 10.714GB
IQ 10.65GB
IQ 10.619GB
IQ 10.520GB
IQ 10.45GB
IQ 10.21GB
IQ 10.19GB
IQ 10.12GB
IQ 10.018GB
IQ 9.88GB
IQ 9.84GB
IQ 9.621GB
IQ 9.56GB
IQ 9.318GB
IQ 9.33GB
IQ 9.314GB
IQ 9.220GB
IQ 9.118GB
IQ 9.114GB
IQ 9.05GB
IQ 8.95GB
IQ 8.918GB
IQ 8.81GB
IQ 8.82GB
IQ 8.620GB
IQ 8.614GB
IQ 8.42GB
IQ 8.45GB
IQ 8.119GB
IQ 7.93GB
IQ 7.519GB
IQ 7.45GB
IQ 7.419GB
IQ 7.119GB
IQ 7.12GB
IQ 7.09GB
IQ 6.914GB
IQ 6.818GB
IQ 6.82GB
IQ 6.82GB
IQ 6.75GB
IQ 6.619GB
IQ 6.519GB
IQ 6.419GB
IQ 6.45GB
IQ 6.43GB
IQ 6.26GB
IQ 6.15GB
IQ 6.019GB
IQ 5.219GB
IQ 5.15GB
IQ 5.121GB
IQ 5.019GB
IQ 5.01GB
IQ 4.98GB
LFM2 24B A2BMoE
IQ 4.914GB
IQ 4.816GB
IQ 4.713GB
IQ 4.62GB
IQ 4.65GB
IQ 4.55GB
IQ 4.53GB
IQ 4.41GB
IQ 4.34GB
IQ 4.22GB
IQ 4.21GB
IQ 4.12GB
IQ 4.13GB
IQ 4.113GB
IQ 4.04GB
IQ 3.94GB
IQ 3.85GB
IQ 3.810GB
IQ 3.71GB
IQ 3.47GB
IQ 3.37GB
IQ 3.22GB
IQ 3.110GB
IQ 3.02GB
IQ 3.04GB
IQ 3.08GB
IQ 3.04GB
IQ 3.014GB
IQ 2.91GB
IQ 2.84GB
IQ 2.81GB
IQ 2.71GB
IQ 2.72GB
IQ 2.71GB
IQ 2.71GB
IQ 2.61GB
IQ 2.42GB
IQ 2.18GB
IQ 2.121GB
IQ 2.11GB
IQ 2.14GB
IQ 2.05GB
IQ 1.85GB
LFM2 8B A1BMoE
IQ 1.85GB
IQ 1.51GB
IQ 1.25GB
IQ 1.25GB
IQ 1.13GB
IQ 1.11GB
IQ 1.11GB
IQ 1.02GB
IQ 1.01GB
IQ 1.04GB
IQ 1.01GB
IQ 1.05GB
VRAM 需求为估算值(含 ~20% KV Cache 开销),实际值因推理框架(vLLM / llama.cpp / TGI)而异。 MoE 模型需全量加载权重,推理时仅激活部分参数。