大模型价格列表

汇总了一些国内外大语言模型（LLM）的 API 定价信息。仅供参考：

国内大模型#

更新时间：2026-02-12 (单位统一为元/1M Tokens)

百度 (Baidu)#

数据来源：百度智能云千帆大模型平台

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
ERNIE 5.0 (Thinking-Preview/Latest/Exp)	6 (≤32k) 10 (>32k)	24 (≤32k) 40 (>32k)
ERNIE 4.5 Turbo VL (Preview/Latest/32K)	3	9	输入缓存命中: 0.75
ERNIE 4.5 (ERNIE-4.5-8K)	4	16	搜索增强: 0.004元/次
ERNIE 4.5 (VL-28B-A3B)	1	4
ERNIE 4.5 (21B-A3B / Thinking)	0.5	2
ERNIE 4.5 (0.3B)	0.1	0.4
ERNIE 4.5 Turbo (128K Preview/Latest)	0.8	3.2	输入缓存命中: 0.2 搜索增强: 0.004元/次
ERNIE 4.5 Turbo (32K)	0.8	3.2	输入缓存命中: 0.2

阿里云 (Aliyun)#

数据来源：阿里云百炼模型价格 | 上下文缓存说明

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
Qwen-Max (qwen3-max)	2.5 (≤32k) 4 (≤128k) 7 (≤252k)	10 (≤32k) 16 (≤128k) 28 (≤252k)	Batch调用半价输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Max (qwen-max-latest)	2.4	9.6	Batch调用半价输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Plus (qwen-plus-latest)	0.8 (≤128k) 2.4 (≤256k) 4.8 (≤1M)	2 (≤128k) 20 (≤256k) 48 (≤1M)	Batch调用半价输入缓存命中: 20%(隐式)/10%(显式)

智谱AI (ZhipuAI)#

数据来源：智谱AI开放平台

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
GLM-5	4 (≤32k) 6 (>32k)	18 (≤32k) 22 (>32k)	输入缓存命中: 1 / 1.5
GLM-5-Code	6 (≤32k) 8 (>32k)	28 (≤32k) 32 (>32k)	输入缓存命中: 1.5 / 2
GLM-4.7	2 (≤32k, 短输出) 3 (≤32k, 长输出) 4 (>32k)	8 (≤32k, 短输出) 14 (≤32k, 长输出) 16 (>32k)	短输出: <0.2k 长输出: ≥0.2k 输入缓存命中: 0.4/0.6/0.8
GLM-4.6	2 (≤32k, 短输出) 3 (≤32k, 长输出) 4 (>32k)	8 (≤32k, 短输出) 14 (≤32k, 长输出) 16 (>32k)	短输出: <0.2k 长输出: ≥0.2k 输入缓存命中: 0.4/0.6/0.8
GLM-4.6V	1 (≤32k) 2 (32k-128k)	3 (≤32k) 6 (32k-128k)	输入缓存命中: 0.2/0.4
GLM-4.7-FlashX	0.5	3	输入缓存命中: 0.1
GLM-4.7-Flash	免费	免费	输入缓存命中: 免费

DeepSeek#

数据来源：DeepSeek API Docs

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
DeepSeek-V3.2 (deepseek-chat/deepseek-reasoner)	2	3	输入缓存命中: 0.2

火山引擎 (Volcengine)#

数据来源：火山方舟大模型服务平台

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
doubao-seed-1.8	0.8 (≤32k) 1.2 (32k-128k] 2.4 (128k-256k]	2 (≤32k, 短输出) 8 (≤32k, 长输出) 16 (32k-128k] 24 (128k-256k]	短输出: ≤0.2k 长输出: >0.2k 输入缓存命中: 0.16 缓存存储: 0.017元/1M/小时
doubao-seed-code	1.2 (≤32k) 1.4 (32k-128k] 2.8 (128k-256k]	8 (≤32k) 12 (32k-128k] 16 (128k-256k]	输入缓存命中: 0.24 缓存存储: 0.017元/1M/小时
doubao-seed-1.6	0.8 (≤32k) 1.2 (32k-128k] 2.4 (128k-256k]	2 (≤32k, 短输出) 8 (≤32k, 长输出) 16 (32k-128k] 24 (128k-256k]	短输出: ≤0.2k 长输出: >0.2k 输入缓存命中: 0.16 缓存存储: 0.017元/1M/小时
doubao-seed-1.6-lite	0.3 (≤32k) 0.6 (32k-128k] 1.2 (128k-256k]	0.6 (≤32k, 短输出) 2.4 (≤32k, 长输出) 4 (32k-128k] 12 (128k-256k]	短输出: ≤0.2k 长输出: >0.2k 输入缓存命中: 0.06 缓存存储: 0.017元/1M/小时
doubao-seed-1.6-flash	0.15 (≤32k) 0.3 (32k-128k] 0.6 (128k-256k]	1.5 (≤32k) 3 (32k-128k] 6 (128k-256k]	输入缓存命中: 0.03 缓存存储: 0.017元/1M/小时
doubao-seed-1.6-vision	0.8 (≤32k) 1.2 (32k-128k] 2.4 (128k-256k]	8 (≤32k) 16 (32k-128k] 24 (128k-256k]	输入缓存命中: 0.16 缓存存储: 0.017元/1M/小时
doubao-seed-1.6-thinking	0.8 (≤32k) 1.2 (32k-128k] 2.4 (128k-256k]	8 (≤32k) 16 (32k-128k] 24 (128k-256k]	缓存命中: 0.16 缓存存储: 0.017元/1M/小时

MiniMax#

数据来源：MiniMax 开放平台

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
MiniMax-M2.1	2.1	8.4	输入缓存命中: 0.21 缓存写入: 2.625
MiniMax-M2.1-lightning	2.1	16.8	输入缓存命中: 0.21 缓存写入: 2.625
MiniMax-M2	2.1	8.4	输入缓存命中: 0.21 缓存写入: 2.625
M2-her	2.1	8.4

月之暗面 (Moonshot AI)#

数据来源：Moonshot AI 开放平台

模型名称	输入价格 (元/1M Tokens)	输出价格 (元/1M Tokens)	说明
kimi-k2.5	4	21	缓存命中: 0.7
kimi-k2 (0905/0711/thinking)	4	16	缓存命中: 1
kimi-k2-turbo (turbo/thinking-turbo)	8	58	缓存命中: 1
moonshot-v1-8k	2	10
moonshot-v1-32k	5	20
moonshot-v1-128k	10	30

国外大模型#

更新时间：2026-02-08 (单位统一为美元/1M Tokens)

OpenAI#

数据来源：OpenAI Pricing (Standard)

模型名称	输入价格 ($/1M Tokens)	输出价格 ($/1M Tokens)	说明
gpt-5.2	1.75	14.00	缓存命中: 0.175
gpt-5.2-chat-latest	1.75	14.00	缓存命中: 0.175
gpt-5.2-codex	1.75	14.00	缓存命中: 0.175
gpt-5.2-pro	21.00	168.00
gpt-5.1-chat-latest	1.25	10.00	缓存命中: 0.125
gpt-5.1-codex-max	1.25	10.00	缓存命中: 0.125
gpt-5-chat-latest	1.25	10.00	缓存命中: 0.125
gpt-4o	2.50	10.00	缓存命中: 1.25

Anthropic (Claude)#

数据来源：Claude Pricing

模型名称	输入价格 ($/1M Tokens)	输出价格 ($/1M Tokens)	说明
Claude Opus 4.6	5.00	25.00	缓存写入: 6.25 (5m) / 10.00 (1h) 输入缓存命中: 0.50
Claude Sonnet 4.5	3.00	15.00	缓存写入: 3.75 (5m) / 6.00 (1h) 输入缓存命中: 0.30
Claude Haiku 4.5	1.00	5.00	缓存写入: 1.25 (5m) / 2.00 (1h) 输入缓存命中: 0.10

Google (Gemini)#

数据来源：Gemini API Pricing

模型名称	输入价格 ($/1M Tokens)	输出价格 ($/1M Tokens)	说明
Gemini 3 Pro (preview)	2.00 (≤200k) 4.00 (>200k)	12.00 (≤200k) 18.00 (>200k)	输入缓存命中: 0.20 (≤200k) / 0.40 (>200k) 缓存存储: $4.50/1M/小时
Gemini 3 Pro Image (preview)	2.00	12.00 (文字/思考) 120.00 (图片)	图片输入: $0.0011/张图片输出: $0.134(1k/2k) / $0.24(4k)
Gemini 3 Flash (preview)	0.50	3.00	音频输入: $1.00 输入缓存命中: 0.05 (文本/图片/视频) / 0.10 (音频) 缓存存储: $1.00/1M/小时
Gemini 2.5 Pro	1.25 (≤128k) 2.50 (>128k)	5.00 (≤128k) 10.00 (>128k)	输入缓存命中: 0.31 (≤128k) / 0.63 (>128k) 缓存存储: $3.50/1M/小时
Gemini 2.5 Flash	0.10 (≤128k) 0.20 (>128k)	0.40 (≤128k) 0.80 (>128k)	输入缓存命中: 0.025 (≤128k) / 0.05 (>128k) 缓存存储: $0.70/1M/小时

Evernight

国内大模型#

百度 (Baidu)#

阿里云 (Aliyun)#

智谱AI (ZhipuAI)#

DeepSeek#

火山引擎 (Volcengine)#

MiniMax#

月之暗面 (Moonshot AI)#

国外大模型#

OpenAI#

Anthropic (Claude)#

Google (Gemini)#

目录