1142 字
6 分钟

大模型价格列表

2026-02-08

汇总了一些国内外大语言模型(LLM)的 API 定价信息。仅供参考:

国内大模型#

更新时间:2026-02-12 (单位统一为元/1M Tokens)

百度 (Baidu)#

数据来源:百度智能云千帆大模型平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
ERNIE 5.0
(Thinking-Preview/Latest/Exp)
6 (≤32k)
10 (>32k)
24 (≤32k)
40 (>32k)
ERNIE 4.5 Turbo VL
(Preview/Latest/32K)
39输入缓存命中: 0.75
ERNIE 4.5
(ERNIE-4.5-8K)
416搜索增强: 0.004元/次
ERNIE 4.5
(VL-28B-A3B)
14
ERNIE 4.5
(21B-A3B / Thinking)
0.52
ERNIE 4.5
(0.3B)
0.10.4
ERNIE 4.5 Turbo
(128K Preview/Latest)
0.83.2输入缓存命中: 0.2
搜索增强: 0.004元/次
ERNIE 4.5 Turbo
(32K)
0.83.2输入缓存命中: 0.2

阿里云 (Aliyun)#

数据来源:阿里云百炼模型价格 | 上下文缓存说明

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
Qwen-Max
(qwen3-max)
2.5 (≤32k)
4 (≤128k)
7 (≤252k)
10 (≤32k)
16 (≤128k)
28 (≤252k)
Batch调用半价
输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Max
(qwen-max-latest)
2.49.6Batch调用半价
输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Plus
(qwen-plus-latest)
0.8 (≤128k)
2.4 (≤256k)
4.8 (≤1M)
2 (≤128k)
20 (≤256k)
48 (≤1M)
Batch调用半价
输入缓存命中: 20%(隐式)/10%(显式)

智谱AI (ZhipuAI)#

数据来源:智谱AI开放平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
GLM-54 (≤32k)
6 (>32k)
18 (≤32k)
22 (>32k)
输入缓存命中: 1 / 1.5
GLM-5-Code6 (≤32k)
8 (>32k)
28 (≤32k)
32 (>32k)
输入缓存命中: 1.5 / 2
GLM-4.72 (≤32k, 短输出)
3 (≤32k, 长输出)
4 (>32k)
8 (≤32k, 短输出)
14 (≤32k, 长输出)
16 (>32k)
短输出: <0.2k
长输出: ≥0.2k
输入缓存命中: 0.4/0.6/0.8
GLM-4.62 (≤32k, 短输出)
3 (≤32k, 长输出)
4 (>32k)
8 (≤32k, 短输出)
14 (≤32k, 长输出)
16 (>32k)
短输出: <0.2k
长输出: ≥0.2k
输入缓存命中: 0.4/0.6/0.8
GLM-4.6V1 (≤32k)
2 (32k-128k)
3 (≤32k)
6 (32k-128k)
输入缓存命中: 0.2/0.4
GLM-4.7-FlashX0.53输入缓存命中: 0.1
GLM-4.7-Flash免费免费输入缓存命中: 免费

DeepSeek#

数据来源:DeepSeek API Docs

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
DeepSeek-V3.2
(deepseek-chat/deepseek-reasoner)
23输入缓存命中: 0.2

火山引擎 (Volcengine)#

数据来源:火山方舟大模型服务平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
doubao-seed-1.80.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]
2 (≤32k, 短输出)
8 (≤32k, 长输出)
16 (32k-128k]
24 (128k-256k]
短输出: ≤0.2k
长输出: >0.2k
输入缓存命中: 0.16
缓存存储: 0.017元/1M/小时
doubao-seed-code1.2 (≤32k)
1.4 (32k-128k]
2.8 (128k-256k]
8 (≤32k)
12 (32k-128k]
16 (128k-256k]
输入缓存命中: 0.24
缓存存储: 0.017元/1M/小时
doubao-seed-1.60.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]
2 (≤32k, 短输出)
8 (≤32k, 长输出)
16 (32k-128k]
24 (128k-256k]
短输出: ≤0.2k
长输出: >0.2k
输入缓存命中: 0.16
缓存存储: 0.017元/1M/小时
doubao-seed-1.6-lite0.3 (≤32k)
0.6 (32k-128k]
1.2 (128k-256k]
0.6 (≤32k, 短输出)
2.4 (≤32k, 长输出)
4 (32k-128k]
12 (128k-256k]
短输出: ≤0.2k
长输出: >0.2k
输入缓存命中: 0.06
缓存存储: 0.017元/1M/小时
doubao-seed-1.6-flash0.15 (≤32k)
0.3 (32k-128k]
0.6 (128k-256k]
1.5 (≤32k)
3 (32k-128k]
6 (128k-256k]
输入缓存命中: 0.03
缓存存储: 0.017元/1M/小时
doubao-seed-1.6-vision0.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]
8 (≤32k)
16 (32k-128k]
24 (128k-256k]
输入缓存命中: 0.16
缓存存储: 0.017元/1M/小时
doubao-seed-1.6-thinking0.8 (≤32k)
1.2 (32k-128k]
2.4 (128k-256k]
8 (≤32k)
16 (32k-128k]
24 (128k-256k]
缓存命中: 0.16
缓存存储: 0.017元/1M/小时

MiniMax#

数据来源:MiniMax 开放平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
MiniMax-M2.12.18.4输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M2.1-lightning2.116.8输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M22.18.4输入缓存命中: 0.21
缓存写入: 2.625
M2-her2.18.4

月之暗面 (Moonshot AI)#

数据来源:Moonshot AI 开放平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
kimi-k2.5421缓存命中: 0.7
kimi-k2
(0905/0711/thinking)
416缓存命中: 1
kimi-k2-turbo
(turbo/thinking-turbo)
858缓存命中: 1
moonshot-v1-8k210
moonshot-v1-32k520
moonshot-v1-128k1030

国外大模型#

更新时间:2026-02-08 (单位统一为美元/1M Tokens)

OpenAI#

数据来源:OpenAI Pricing (Standard)

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
gpt-5.21.7514.00缓存命中: 0.175
gpt-5.2-chat-latest1.7514.00缓存命中: 0.175
gpt-5.2-codex1.7514.00缓存命中: 0.175
gpt-5.2-pro21.00168.00
gpt-5.1-chat-latest1.2510.00缓存命中: 0.125
gpt-5.1-codex-max1.2510.00缓存命中: 0.125
gpt-5-chat-latest1.2510.00缓存命中: 0.125
gpt-4o2.5010.00缓存命中: 1.25

Anthropic (Claude)#

数据来源:Claude Pricing

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
Claude Opus 4.65.0025.00缓存写入: 6.25 (5m) / 10.00 (1h)
输入缓存命中: 0.50
Claude Sonnet 4.53.0015.00缓存写入: 3.75 (5m) / 6.00 (1h)
输入缓存命中: 0.30
Claude Haiku 4.51.005.00缓存写入: 1.25 (5m) / 2.00 (1h)
输入缓存命中: 0.10

Google (Gemini)#

数据来源:Gemini API Pricing

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
Gemini 3 Pro
(preview)
2.00 (≤200k)
4.00 (>200k)
12.00 (≤200k)
18.00 (>200k)
输入缓存命中: 0.20 (≤200k) / 0.40 (>200k)
缓存存储: $4.50/1M/小时
Gemini 3 Pro Image
(preview)
2.0012.00 (文字/思考)
120.00 (图片)
图片输入: $0.0011/张
图片输出: $0.134(1k/2k) / $0.24(4k)
Gemini 3 Flash
(preview)
0.503.00音频输入: $1.00
输入缓存命中: 0.05 (文本/图片/视频) / 0.10 (音频)
缓存存储: $1.00/1M/小时
Gemini 2.5 Pro1.25 (≤128k)
2.50 (>128k)
5.00 (≤128k)
10.00 (>128k)
输入缓存命中: 0.31 (≤128k) / 0.63 (>128k)
缓存存储: $3.50/1M/小时
Gemini 2.5 Flash0.10 (≤128k)
0.20 (>128k)
0.40 (≤128k)
0.80 (>128k)
输入缓存命中: 0.025 (≤128k) / 0.05 (>128k)
缓存存储: $0.70/1M/小时
大模型价格列表
https://xtower.site/posts/llm-cost/
作者
Xtower
发布于
2026-02-08
许可协议
CC BY-NC-SA 4.0
最后更新于 2026-02-08,距今已过 3 天

部分内容可能已过时

目录