大模型价格

大模型的价格供参考#

罗列部分大模型的价格供参考

更新时间：2026-02-08
(单位统一为元 / 1M Tokens)

数据来源：百度智能云千帆大模型平台

模型名称	输入价格 (元 / 1M Tokens)	输出价格 (元 / 1M Tokens)	说明
ERNIE 5.0
(Thinking-Preview/Latest/Exp)	6 (≤32k)
10 (>32k)	24 (≤32k)
40 (>32k)
ERNIE 4.5 Turbo VL
(Preview/Latest/32K)	3	9	输入缓存命中: 0.75
ERNIE 4.5
(ERNIE-4.5-8K)	4	16	搜索增强: 0.004 元 / 次
ERNIE 4.5
(VL-28B-A3B)	1	4
ERNIE 4.5
(21B-A3B / Thinking)	0.5	2
ERNIE 4.5
(0.3B)	0.1	0.4
ERNIE 4.5 Turbo
(128K Preview/Latest)	0.8	3.2	输入缓存命中: 0.2
搜索增强: 0.004 元 / 次
ERNIE 4.5 Turbo
(32K)	0.8	3.2	输入缓存命中: 0.2

数据来源：阿里云百炼模型价格 | 上下文缓存说明

数据来源：智谱 AI 开放平台

数据来源： DeepSeek API Docs

模型名称	输入价格 (元 / 1M Tokens)	输出价格 (元 / 1M Tokens)	说明
DeepSeek-V3.2
(deepseek-chat/deepseek-reasoner)	2	3	输入缓存命中: 0.2

数据来源：火山方舟大模型服务平台

数据来源： MiniMax 开放平台

模型名称	输入价格 (元 / 1M Tokens)	输出价格 (元 / 1M Tokens)	说明
MiniMax-M2.1	2.1	8.4	输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M2.1-lightning	2.1	16.8	输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M2	2.1	8.4	输入缓存命中: 0.21
缓存写入: 2.625
M2-her	2.1	8.4

数据来源： Moonshot AI 开放平台

模型名称	输入价格 (元 / 1M Tokens)	输出价格 (元 / 1M Tokens)	说明
kimi-k2.5	4	21	缓存命中: 0.7
kimi-k2
(0905/0711/thinking)	4	16	缓存命中: 1
kimi-k2-turbo
(turbo/thinking-turbo)	8	58	缓存命中: 1
moonshot-v1-8k	2	10
moonshot-v1-32k	5	20
moonshot-v1-128k	10	30

更新时间：2026-02-08
(单位统一为美元 / 1M Tokens)

数据来源： OpenAI Pricing (Standard)

模型名称	输入价格 ($/1M Tokens)	输出价格 ($/1M Tokens)	说明
gpt-5.2	1.75	14.00	缓存命中: 0.175
gpt-5.2-chat-latest	1.75	14.00	缓存命中: 0.175
gpt-5.2-codex	1.75	14.00	缓存命中: 0.175
gpt-5.2-pro	21.00	168.00
gpt-5.1-chat-latest	1.25	10.00	缓存命中: 0.125
gpt-5.1-codex-max	1.25	10.00	缓存命中: 0.125
gpt-5-chat-latest	1.25	10.00	缓存命中: 0.125
gpt-4o	2.50	10.00	缓存命中: 1.25

数据来源： Claude Pricing

模型名称	输入价格 ($/1M Tokens)	输出价格 ($/1M Tokens)	说明
Claude Opus 4.6	5.00	25.00	缓存写入: 6.25 (5m) / 10.00 (1h)
输入缓存命中: 0.50
Claude Sonnet 4.5	3.00	15.00	缓存写入: 3.75 (5m) / 6.00 (1h)
输入缓存命中: 0.30
Claude Haiku 4.5	1.00	5.00	缓存写入: 1.25 (5m) / 2.00 (1h)
输入缓存命中: 0.10

数据来源： Gemini API Pricing

模型名称	输入价格 ($/1M Tokens)	输出价格 ($/1M Tokens)	说明
Gemini 3 Pro
(preview)	2.00 (≤200k)
4.00 (>200k)	12.00 (≤200k)
18.00 (>200k)	输入缓存命中: 0.20 (≤200k) / 0.40 (>200k)
缓存存储: $4.50/1M / 小时
Gemini 3 Pro Image
(preview)	2.00	12.00 (文字 / 思考)
120.00 (图片)	图片输出的费用为每 100 万个 token 120 美元。输出 1024x1024 像素 (1K) 到 2048x2048 像素 (2K) 的图片会消耗 1,120 个 token，相当于每张图片 0.134 美元。输出尺寸最大为 4096x4096 像素 (4K) 的图片会消耗 2,000 个 token，相当于每张图片 0.24 美元。

Gemini 3 Flash
(preview)	0.50	3.00	音频输入: $1.00
输入缓存命中: 0.05 (文本 / 图片 / 视频) / 0.10 (音频)
缓存存储: $1.00/1M / 小时
Gemini 2.5 Pro	1.25 (≤128k)
2.50 (>128k)	5.00 (≤128k)
10.00 (>128k)	输入缓存命中: 0.31 (≤128k) / 0.63 (>128k)
缓存存储: $3.50/1M / 小时
Gemini 2.5 Flash	0.10 (≤128k)
0.20 (>128k)	0.40 (≤128k)
0.80 (>128k)	输入缓存命中: 0.025 (≤128k) / 0.05 (>128k)
缓存存储: $0.70/1M / 小时