大模型的价格供参考#
国内大模型#
罗列部分大模型的价格供参考
国内大模型#
更新时间:2026-02-08
(单位统一为元 / 1M Tokens)
百度 (Baidu)#
数据来源: 百度智能云千帆大模型平台
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| ERNIE 5.0 | |||
| (Thinking-Preview/Latest/Exp) | 6 (≤32k) | ||
| 10 (>32k) | 24 (≤32k) | ||
| 40 (>32k) | |||
| ERNIE 4.5 Turbo VL | |||
| (Preview/Latest/32K) | 3 | 9 | 输入缓存命中: 0.75 |
| ERNIE 4.5 | |||
| (ERNIE-4.5-8K) | 4 | 16 | 搜索增强: 0.004 元 / 次 |
| ERNIE 4.5 | |||
| (VL-28B-A3B) | 1 | 4 | |
| ERNIE 4.5 | |||
| (21B-A3B / Thinking) | 0.5 | 2 | |
| ERNIE 4.5 | |||
| (0.3B) | 0.1 | 0.4 | |
| ERNIE 4.5 Turbo | |||
| (128K Preview/Latest) | 0.8 | 3.2 | 输入缓存命中: 0.2 |
| 搜索增强: 0.004 元 / 次 | |||
| ERNIE 4.5 Turbo | |||
| (32K) | 0.8 | 3.2 | 输入缓存命中: 0.2 |
阿里云 (Aliyun)#
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| Qwen-Max | |||
| (qwen3-max) | 2.5 (≤32k) | ||
| 4 (≤128k) | |||
| 7 (≤252k) | 10 (≤32k) | ||
| 16 (≤128k) | |||
| 28 (≤252k) | Batch 调用半价 | ||
| 输入缓存命中: 20%(隐式)/10%(显式) | |||
| Qwen-Max | |||
| (qwen-max-latest) | 2.4 | 9.6 | Batch 调用半价 |
| 输入缓存命中: 20%(隐式)/10%(显式) | |||
| Qwen-Plus | |||
| (qwen-plus-latest) | 0.8 (≤128k) | ||
| 2.4 (≤256k) | |||
| 4.8 (≤1M) | 2 (≤128k) | ||
| 20 (≤256k) | |||
| 48 (≤1M) | Batch 调用半价 | ||
| 输入缓存命中: 20%(隐式)/10%(显式) |
智谱 AI (ZhipuAI)#
数据来源: 智谱 AI 开放平台
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| GLM-4.7 | 2 (≤32k, 短输出) | ||
| 3 (≤32k, 长输出) | |||
| 4 (>32k) | 8 (≤32k, 短输出) | ||
| 14 (≤32k, 长输出) | |||
| 16 (>32k) | 短输出: <0.2k | ||
| 长输出: ≥0.2k | |||
| 输入缓存命中: 0.4/0.6/0.8 | |||
| GLM-4.6 | 2 (≤32k, 短输出) | ||
| 3 (≤32k, 长输出) | |||
| 4 (>32k) | 8 (≤32k, 短输出) | ||
| 14 (≤32k, 长输出) | |||
| 16 (>32k) | 短输出: <0.2k | ||
| 长输出: ≥0.2k | |||
| 输入缓存命中: 0.4/0.6/0.8 | |||
| GLM-4.6V | 1 (≤32k) | ||
| 2 (32k-128k) | 3 (≤32k) | ||
| 6 (32k-128k) | 输入缓存命中: 0.2/0.4 | ||
| GLM-4.7-FlashX | 0.5 | 3 | 输入缓存命中: 0.1 |
| GLM-4.7-Flash | 免费 | 免费 | 输入缓存命中:免费 |
DeepSeek#
数据来源: DeepSeek API Docs
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| DeepSeek-V3.2 | |||
| (deepseek-chat/deepseek-reasoner) | 2 | 3 | 输入缓存命中: 0.2 |
火山引擎 (Volcengine)#
数据来源: 火山方舟大模型服务平台
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| doubao-seed-1.8 | 0.8 (≤32k) | ||
| 1.2 (32k-128k] | |||
| 2.4 (128k-256k] | 2 (≤32k, 短输出) | ||
| 8 (≤32k, 长输出) | |||
| 16 (32k-128k] | |||
| 24 (128k-256k] | 短输出: ≤0.2k | ||
| 长输出: >0.2k | |||
| 输入缓存命中: 0.16 | |||
| 缓存存储: 0.017 元 / 1M / 小时 | |||
| doubao-seed-code | 1.2 (≤32k) | ||
| 1.4 (32k-128k] | |||
| 2.8 (128k-256k] | 8 (≤32k) | ||
| 12 (32k-128k] | |||
| 16 (128k-256k] | 输入缓存命中: 0.24 | ||
| 缓存存储: 0.017 元 / 1M / 小时 | |||
| doubao-seed-1.6 | 0.8 (≤32k) | ||
| 1.2 (32k-128k] | |||
| 2.4 (128k-256k] | 2 (≤32k, 短输出) | ||
| 8 (≤32k, 长输出) | |||
| 16 (32k-128k] | |||
| 24 (128k-256k] | 短输出: ≤0.2k | ||
| 长输出: >0.2k | |||
| 输入缓存命中: 0.16 | |||
| 缓存存储: 0.017 元 / 1M / 小时 | |||
| doubao-seed-1.6-lite | 0.3 (≤32k) | ||
| 0.6 (32k-128k] | |||
| 1.2 (128k-256k] | 0.6 (≤32k, 短输出) | ||
| 2.4 (≤32k, 长输出) | |||
| 4 (32k-128k] | |||
| 12 (128k-256k] | 短输出: ≤0.2k | ||
| 长输出: >0.2k | |||
| 输入缓存命中: 0.06 | |||
| 缓存存储: 0.017 元 / 1M / 小时 | |||
| doubao-seed-1.6-flash | 0.15 (≤32k) | ||
| 0.3 (32k-128k] | |||
| 0.6 (128k-256k] | 1.5 (≤32k) | ||
| 3 (32k-128k] | |||
| 6 (128k-256k] | 输入缓存命中: 0.03 | ||
| 缓存存储: 0.017 元 / 1M / 小时 | |||
| doubao-seed-1.6-vision | 0.8 (≤32k) | ||
| 1.2 (32k-128k] | |||
| 2.4 (128k-256k] | 8 (≤32k) | ||
| 16 (32k-128k] | |||
| 24 (128k-256k] | 输入缓存命中: 0.16 | ||
| 缓存存储: 0.017 元 / 1M / 小时 | |||
| doubao-seed-1.6-thinking | 0.8 (≤32k) | ||
| 1.2 (32k-128k] | |||
| 2.4 (128k-256k] | 8 (≤32k) | ||
| 16 (32k-128k] | |||
| 24 (128k-256k] | 缓存命中: 0.16 | ||
| 缓存存储: 0.017 元 / 1M / 小时 |
MiniMax#
数据来源: MiniMax 开放平台
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| MiniMax-M2.1 | 2.1 | 8.4 | 输入缓存命中: 0.21 |
| 缓存写入: 2.625 | |||
| MiniMax-M2.1-lightning | 2.1 | 16.8 | 输入缓存命中: 0.21 |
| 缓存写入: 2.625 | |||
| MiniMax-M2 | 2.1 | 8.4 | 输入缓存命中: 0.21 |
| 缓存写入: 2.625 | |||
| M2-her | 2.1 | 8.4 |
月之暗面 (Moonshot AI)#
数据来源: Moonshot AI 开放平台
| 模型名称 | 输入价格 (元 / 1M Tokens) | 输出价格 (元 / 1M Tokens) | 说明 |
|---|---|---|---|
| kimi-k2.5 | 4 | 21 | 缓存命中: 0.7 |
| kimi-k2 | |||
| (0905/0711/thinking) | 4 | 16 | 缓存命中: 1 |
| kimi-k2-turbo | |||
| (turbo/thinking-turbo) | 8 | 58 | 缓存命中: 1 |
| moonshot-v1-8k | 2 | 10 | |
| moonshot-v1-32k | 5 | 20 | |
| moonshot-v1-128k | 10 | 30 |
国外大模型#
更新时间:2026-02-08
(单位统一为美元 / 1M Tokens)
OpenAI#
| 模型名称 | 输入价格 ($/1M Tokens) | 输出价格 ($/1M Tokens) | 说明 |
|---|---|---|---|
| gpt-5.2 | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2-chat-latest | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2-codex | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2-pro | 21.00 | 168.00 | |
| gpt-5.1-chat-latest | 1.25 | 10.00 | 缓存命中: 0.125 |
| gpt-5.1-codex-max | 1.25 | 10.00 | 缓存命中: 0.125 |
| gpt-5-chat-latest | 1.25 | 10.00 | 缓存命中: 0.125 |
| gpt-4o | 2.50 | 10.00 | 缓存命中: 1.25 |
Anthropic (Claude)#
数据来源: Claude Pricing
| 模型名称 | 输入价格 ($/1M Tokens) | 输出价格 ($/1M Tokens) | 说明 |
|---|---|---|---|
| Claude Opus 4.6 | 5.00 | 25.00 | 缓存写入: 6.25 (5m) / 10.00 (1h) |
| 输入缓存命中: 0.50 | |||
| Claude Sonnet 4.5 | 3.00 | 15.00 | 缓存写入: 3.75 (5m) / 6.00 (1h) |
| 输入缓存命中: 0.30 | |||
| Claude Haiku 4.5 | 1.00 | 5.00 | 缓存写入: 1.25 (5m) / 2.00 (1h) |
| 输入缓存命中: 0.10 |
Google (Gemini)#
数据来源: Gemini API Pricing
| 模型名称 | 输入价格 ($/1M Tokens) | 输出价格 ($/1M Tokens) | 说明 |
|---|---|---|---|
| Gemini 3 Pro | |||
| (preview) | 2.00 (≤200k) | ||
| 4.00 (>200k) | 12.00 (≤200k) | ||
| 18.00 (>200k) | 输入缓存命中: 0.20 (≤200k) / 0.40 (>200k) | ||
| 缓存存储: $4.50/1M / 小时 | |||
| Gemini 3 Pro Image | |||
| (preview) | 2.00 | 12.00 (文字 / 思考) | |
| 120.00 (图片) | 图片输出的费用为每 100 万个 token 120 美元。输出 1024x1024 像素 (1K) 到 2048x2048 像素 (2K) 的图片会消耗 1,120 个 token,相当于每张图片 0.134 美元。输出尺寸最大为 4096x4096 像素 (4K) 的图片会消耗 2,000 个 token,相当于每张图片 0.24 美元。 | ||
| Gemini 3 Flash | |||
| (preview) | 0.50 | 3.00 | 音频输入: $1.00 |
| 输入缓存命中: 0.05 (文本 / 图片 / 视频) / 0.10 (音频) | |||
| 缓存存储: $1.00/1M / 小时 | |||
| Gemini 2.5 Pro | 1.25 (≤128k) | ||
| 2.50 (>128k) | 5.00 (≤128k) | ||
| 10.00 (>128k) | 输入缓存命中: 0.31 (≤128k) / 0.63 (>128k) | ||
| 缓存存储: $3.50/1M / 小时 | |||
| Gemini 2.5 Flash | 0.10 (≤128k) | ||
| 0.20 (>128k) | 0.40 (≤128k) | ||
| 0.80 (>128k) | 输入缓存命中: 0.025 (≤128k) / 0.05 (>128k) | ||
| 缓存存储: $0.70/1M / 小时 |