大模型的价格供参考#

国内大模型#

罗列部分大模型的价格供参考

国内大模型#

更新时间:2026-02-08
(单位统一为元 / 1M Tokens)

百度 (Baidu)#

数据来源: 百度智能云千帆大模型平台

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
ERNIE 5.0
(Thinking-Preview/Latest/Exp)6 (≤32k)
10 (>32k)24 (≤32k)
40 (>32k)
ERNIE 4.5 Turbo VL
(Preview/Latest/32K)39输入缓存命中: 0.75
ERNIE 4.5
(ERNIE-4.5-8K)416搜索增强: 0.004 元 / 次
ERNIE 4.5
(VL-28B-A3B)14
ERNIE 4.5
(21B-A3B / Thinking)0.52
ERNIE 4.5
(0.3B)0.10.4
ERNIE 4.5 Turbo
(128K Preview/Latest)0.83.2输入缓存命中: 0.2
搜索增强: 0.004 元 / 次
ERNIE 4.5 Turbo
(32K)0.83.2输入缓存命中: 0.2

阿里云 (Aliyun)#

数据来源: 阿里云百炼模型价格 | 上下文缓存说明

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
Qwen-Max
(qwen3-max)2.5 (≤32k)
4 (≤128k)
7 (≤252k)10 (≤32k)
16 (≤128k)
28 (≤252k)Batch 调用半价
输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Max
(qwen-max-latest)2.49.6Batch 调用半价
输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Plus
(qwen-plus-latest)0.8 (≤128k)
2.4 (≤256k)
4.8 (≤1M)2 (≤128k)
20 (≤256k)
48 (≤1M)Batch 调用半价
输入缓存命中: 20%(隐式)/10%(显式)

智谱 AI (ZhipuAI)#

数据来源: 智谱 AI 开放平台

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
GLM-4.72 (≤32k, 短输出)
3 (≤32k, 长输出)
4 (>32k)8 (≤32k, 短输出)
14 (≤32k, 长输出)
16 (>32k)短输出: <0.2k
长输出: ≥0.2k
输入缓存命中: 0.4/0.6/0.8
GLM-4.62 (≤32k, 短输出)
3 (≤32k, 长输出)
4 (>32k)8 (≤32k, 短输出)
14 (≤32k, 长输出)
16 (>32k)短输出: <0.2k
长输出: ≥0.2k
输入缓存命中: 0.4/0.6/0.8
GLM-4.6V1 (≤32k)
2 (32k-128k)3 (≤32k)
6 (32k-128k)输入缓存命中: 0.2/0.4
GLM-4.7-FlashX0.53输入缓存命中: 0.1
GLM-4.7-Flash免费免费输入缓存命中:免费

DeepSeek#

数据来源: DeepSeek API Docs

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
DeepSeek-V3.2
(deepseek-chat/deepseek-reasoner)23输入缓存命中: 0.2

火山引擎 (Volcengine)#

数据来源: 火山方舟大模型服务平台

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
doubao-seed-1.80.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]2 (≤32k, 短输出)
8 (≤32k, 长输出)
16 (32k-128k]
24 (128k-256k]短输出: ≤0.2k
长输出: >0.2k
输入缓存命中: 0.16
缓存存储: 0.017 元 / 1M / 小时
doubao-seed-code1.2 (≤32k)
1.4 (32k-128k]
2.8 (128k-256k]8 (≤32k)
12 (32k-128k]
16 (128k-256k]输入缓存命中: 0.24
缓存存储: 0.017 元 / 1M / 小时
doubao-seed-1.60.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]2 (≤32k, 短输出)
8 (≤32k, 长输出)
16 (32k-128k]
24 (128k-256k]短输出: ≤0.2k
长输出: >0.2k
输入缓存命中: 0.16
缓存存储: 0.017 元 / 1M / 小时
doubao-seed-1.6-lite0.3 (≤32k)
0.6 (32k-128k]
1.2 (128k-256k]0.6 (≤32k, 短输出)
2.4 (≤32k, 长输出)
4 (32k-128k]
12 (128k-256k]短输出: ≤0.2k
长输出: >0.2k
输入缓存命中: 0.06
缓存存储: 0.017 元 / 1M / 小时
doubao-seed-1.6-flash0.15 (≤32k)
0.3 (32k-128k]
0.6 (128k-256k]1.5 (≤32k)
3 (32k-128k]
6 (128k-256k]输入缓存命中: 0.03
缓存存储: 0.017 元 / 1M / 小时
doubao-seed-1.6-vision0.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]8 (≤32k)
16 (32k-128k]
24 (128k-256k]输入缓存命中: 0.16
缓存存储: 0.017 元 / 1M / 小时
doubao-seed-1.6-thinking0.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]8 (≤32k)
16 (32k-128k]
24 (128k-256k]缓存命中: 0.16
缓存存储: 0.017 元 / 1M / 小时

MiniMax#

数据来源: MiniMax 开放平台

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
MiniMax-M2.12.18.4输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M2.1-lightning2.116.8输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M22.18.4输入缓存命中: 0.21
缓存写入: 2.625
M2-her2.18.4

月之暗面 (Moonshot AI)#

数据来源: Moonshot AI 开放平台

模型名称输入价格 (元 / 1M Tokens)输出价格 (元 / 1M Tokens)说明
kimi-k2.5421缓存命中: 0.7
kimi-k2
(0905/0711/thinking)416缓存命中: 1
kimi-k2-turbo
(turbo/thinking-turbo)858缓存命中: 1
moonshot-v1-8k210
moonshot-v1-32k520
moonshot-v1-128k1030

国外大模型#

更新时间:2026-02-08
(单位统一为美元 / 1M Tokens)

OpenAI#

数据来源: OpenAI Pricing (Standard)

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
gpt-5.21.7514.00缓存命中: 0.175
gpt-5.2-chat-latest1.7514.00缓存命中: 0.175
gpt-5.2-codex1.7514.00缓存命中: 0.175
gpt-5.2-pro21.00168.00
gpt-5.1-chat-latest1.2510.00缓存命中: 0.125
gpt-5.1-codex-max1.2510.00缓存命中: 0.125
gpt-5-chat-latest1.2510.00缓存命中: 0.125
gpt-4o2.5010.00缓存命中: 1.25

Anthropic (Claude)#

数据来源: Claude Pricing

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
Claude Opus 4.65.0025.00缓存写入: 6.25 (5m) / 10.00 (1h)
输入缓存命中: 0.50
Claude Sonnet 4.53.0015.00缓存写入: 3.75 (5m) / 6.00 (1h)
输入缓存命中: 0.30
Claude Haiku 4.51.005.00缓存写入: 1.25 (5m) / 2.00 (1h)
输入缓存命中: 0.10

Google (Gemini)#

数据来源: Gemini API Pricing

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
Gemini 3 Pro
(preview)2.00 (≤200k)
4.00 (>200k)12.00 (≤200k)
18.00 (>200k)输入缓存命中: 0.20 (≤200k) / 0.40 (>200k)
缓存存储: $4.50/1M / 小时
Gemini 3 Pro Image
(preview)2.0012.00 (文字 / 思考)
120.00 (图片)图片输出的费用为每 100 万个 token 120 美元。输出 1024x1024 像素 (1K) 到 2048x2048 像素 (2K) 的图片会消耗 1,120 个 token,相当于每张图片 0.134 美元。输出尺寸最大为 4096x4096 像素 (4K) 的图片会消耗 2,000 个 token,相当于每张图片 0.24 美元。
Gemini 3 Flash
(preview)0.503.00音频输入: $1.00
输入缓存命中: 0.05 (文本 / 图片 / 视频) / 0.10 (音频)
缓存存储: $1.00/1M / 小时
Gemini 2.5 Pro1.25 (≤128k)
2.50 (>128k)5.00 (≤128k)
10.00 (>128k)输入缓存命中: 0.31 (≤128k) / 0.63 (>128k)
缓存存储: $3.50/1M / 小时
Gemini 2.5 Flash0.10 (≤128k)
0.20 (>128k)0.40 (≤128k)
0.80 (>128k)输入缓存命中: 0.025 (≤128k) / 0.05 (>128k)
缓存存储: $0.70/1M / 小时