各大语言模型 API 价格对比

# 前言

最近正在尝试使用 API 调用 LLM,发现各个大厂的 API 价格都有差异,所以想整理一下各个大厂的 API 价格对比,方便自己,也方便他人。

不包含 Embedding 、图片生成等模型的价格。

参考: 1M = 1000K = 100 0000 = 1000,000

纯手动整理,本文会及时更进各厂商对价格的调整,如有疏漏烦请指出,谢谢。

# OpenAI

这个不用说,先驱者。它将是我们评定其他大厂的参考标准。

官方的价格页面

# GPT-3.5-Turbo

Model                  Input            Output            
gpt-3.5-turbo-0125    $0.50 / 1M tokens$1.50 / 1M tokens
gpt-3.5-turbo-instruct$1.50 / 1M tokens$2.00 / 1M tokens

根据现在的汇率(1SUD=7.22CNY),CNY 的表格如下:

Model                  Input              Output            
gpt-3.5-turbo-0125    ¥ 3.61 / 1M tokens  ¥ 10.83 / 1M tokens
gpt-3.5-turbo-instruct¥ 10.83 / 1M tokens¥ 14.44 / 1M tokens

# GPT-4

好贵的

Model    Input              Output              
gpt-4    $30.00 / 1M tokens$60.00 / 1M tokens  
gpt-4-32k$60.00 / 1M tokens$120.00 / 1M tokens

根据现在的汇率(1SUD=7.22CNY),CNY 的表格如下:

Model    Input                Output              
gpt-4    ¥ 216.6 / 1M tokens¥ 433.2 / 1M tokens  
gpt-4-32k¥ 433.2 / 1M tokens¥ 866.4 / 1M tokens  

# GPT-4-Turbo

这个价格就合理多了,但是依然较为昂贵。

Model                    Input              Output            
gpt-4-0125-preview        $10.00 / 1M tokens$30.00 / 1M tokens
gpt-4-1106-preview        $10.00 / 1M tokens$30.00 / 1M tokens
gpt-4-1106-vision-preview$10.00 / 1M tokens$30.00 / 1M tokens

根据现在的汇率(1SUD=7.22CNY),CNY 的表格如下:

Model                    Input              Output              
gpt-4-0125-preview        ¥ 72.2 / 1M tokens¥ 216.6 / 1M tokens
gpt-4-1106-preview        ¥ 72.2 / 1M tokens¥ 216.6 / 1M tokens
gpt-4-1106-vision-preview¥ 72.2 / 1M tokens¥ 216.6 / 1M tokens

# GPT-4o

新出厂的强大模型,具备多模态,上下文 128k,速度更快价格更便宜,离谱。

Model    Input            Output             
gpt-4o    $5.00 / 1M tokens$15.00 / 1M tokens
gpt-4o-2024-05-13$5.00 / 1M tokens$15.00 / 1M tokens

根据现在的汇率(1SUD=7.22CNY),CNY 的表格如下:

Model    Input            Output             
gpt-4o    ¥ 36.10 / 1M tokens¥ 108.30 / 1M tokens
gpt-4o-2024-05-13¥ 36.10 / 1M tokens¥ 108.30 / 1M tokens

# 阿里云 DashScope

阿里云 DashScope,提供包括通义千问在内的各种 LLM 访问能力。 这是其官方文档

24.5.21 降价了。

# 通义千问

模型名                输入价格输出价格上下文 token 数(可输入 token 数)
qwen-turbo            ¥ 2 / 1M tokens¥ 6 / 1M tokens8k (6k)                  
qwen-plus            ¥ 4 / 1M tokens¥ 12 / 1M tokens32k (30k)                
qwen-max              ¥ 40 / 1M tokens  ¥ 120 / 1M tokens      8k (6k)                  
qwen-max-1201        ¥ 120 / 1 Mtokens¥ 120 / 1M tokens8k (6k)                  
qwen-max-longcontext  ¥ 40 / 1M tokens  ¥ 120 / 1M tokens      32k (30k)                
qwen-long¥ 0.5/ 1M tokens¥ 2 / 1M tokens目前暂未找到相关说明

免费额度

模型名                免费额度                                                            
qwen-turbo          开通 DashScope 即获赠总计 2,000,000 tokens 限时免费使用额度,有效期 180 天。
qwen-plus            开通 DashScope 即获赠总计 1,000,000 tokens 限时免费使用额度,有效期 180 天。
qwen-max 系列        开通 DashScope 即获赠总计 1,000,000 tokens 限时免费使用额度,有效期 30 天。  
qwen-long2024年5月21日0点到2024年6月21日24点,开通DashScope即获赠总计4,000,000 tokens限时免费使用额度,有效期30天。

# 通义千问【开源版模型】

  模型名                            输入价格        输出价格          上下文 token 数(可输入 token 数)
qwen1.5-110b-chat¥ 7 / 1M tokens¥ 14 / 1M tokens32k (30k)
qwen-72b-chat¥ 20 / 1M tokens¥ 20 / 1M tokens32k (30k)
qwen1.5-72b-chat¥ 5 / 1M tokens¥ 10 / 1M tokens32k (30k)
qwen1.5-32b-chat¥ 3.5 / 1M tokens¥ 7 / 1M tokens32k (30k)
qwen-14b-chat¥ 8 / 1M tokens¥ 8 / 1M tokens8k (6k)
qwen1.5-14b-chat¥ 2 / 1M tokens¥ 4 / 1M tokens8k (6k)
qwen-7b-chat¥ 6 / 1M tokens¥ 6 / 1M tokens8k (6k)                  
qwen1.5-7b-chat¥ 1 / 1M tokens¥ 2 / 1M tokens8k (6k)
qwen-1.8b-chat                    限时免费开放中8k (6k)
qwen1.5-0.5b-chat限时免费开放中32k (30k)

既然 qwen 1 和 qwen 1.5 价格一样,那肯定是调用 1.5 啦。

免费额度:除 1.8b 这个限时免费外,其他均有时长 30 天的 100 0000 tokens 的免费额度。

# 其他

有第三方大模型可用

例如 LLaMa2,价格目前免费,但需申请。

# 火山云

字节跳动旗下

这款也降价了。

模型名                输入价格输出价格上下文 token 数
Doubao-lite-4k¥ 0.3 / 1M tokens¥ 0.6 / 1M tokens4k
Doubao-lite-32k¥ 0.3 / 1M tokens¥ 0.6 / 1M tokens32k
Doubao-lite-128k¥ 0.8 / 1M tokens¥ 1 / 1M tokens128k
Doubao-pro-4k¥ 0.8 / 1 Mtokens¥ 2 / 1M tokens4k
Doubao-pro-32k¥ 0.8 / 1M tokens¥ 2 / 1M tokens32k
Doubao-pro-128k¥ 5/ 1M tokens¥ 9 / 1M tokens128k

免费额度均为 50 万 tokens。

# 其他

有第三方大模型可用

如 智谱AI(限时免费),Moonshot(与上游一致),Llama3, Mistral 等开源模型限时免费使用。

# 百度智能云

# 文心一言

单位已经统一。

模型输入输出
ERNIE-4.0-8K¥ 120(150) / 1M tokens¥ 120(150) / 1M tokens
ERNIE-Bot-8K¥ 24 / 1M tokens¥ 48 / 1M tokens
ERNIE-3.5-8K¥ 12 / 1M tokens¥ 12 / 1M tokens
ERNIE-Bot-turbo-0922¥ 8(12) / 1M tokens¥ 8(12) / 1M tokens
ERNIE-Speed-8K¥ 4 / 1M tokens¥ 8 / 1M tokens
ERNIE-3.5-4K-0205¥ 12 / 1M tokens¥ 12 / 1M tokens
ERNIE-3.5-8K-0205¥ 24 / 1M tokens¥ 48 / 1M tokens
ERNIE-3.5-8K-1222¥ 12 / 1M tokens¥ 12 / 1M tokens
ERNIE-Lite-8K¥ 3 / 1M tokens¥ 6 / 1M tokens
ERNIE-Speed-128K¥ 4 / 1M tokens¥ 8 / 1M tokens

百度宣布其两款主力模型 ENIRE Speed、ENIRE Lite 全面免费,即刻生效。

# 其他

有第三方大模型可用

在此仅选取部分模型的价格进行对比。

模型单价统一单位后的计费单价
Llama-2-7B-Chat0.004元/千tokens¥ 4 / 1M tokens
Llama-2-13B-Chat0.006元/千tokens¥ 6 / 1M tokens
Llama-2-70B-Chat0.035元/千tokens¥ 35 / 1M tokens
Mixtral-8x7B-Instruct0.035元/千tokens¥ 35 / 1M tokens
Gemma-7B-it0.004元/千tokens¥ 4 / 1M tokens
Yi-34B-Chat限时免费,每个账号每天包含500次调用额度¥0 / 1M tokens

# 零一万物

在 lmsys 获得了很不错的成绩。

模型单价(元 / 百万 tokens)
yi-large¥20
yi-large-turbo¥12
yi-large-rag¥25
yi-medium¥2.5
yi-medium-200k¥12
yi-spark¥1
yi-vision¥6

免费额度:注册送 36 元额度。

# 腾讯混元大模型

产品名计费单价统一单位后的计费单价上下文 token 数(根据文档推测)
腾讯混元大模型标准版0.01元 / 1000 tokens¥ 10 / 1M tokens16k
腾讯混元大模型高级版0.10元 / 1000 tokens¥ 10 / 1M tokens16k

免费额度:时长 12 个月的 10 0000 tokens 的免费额度

# 讯飞星火

模型单价统一单位后的计费单价  
星火大模型V1.5、V3.0、V3.50.3~0.24元 / 万 tokens¥ 30~24 / 1M tokens

免费额度:个人拥有时长 12 个月的 200 0000 tokens 的免费额度,企业额度为 500 0000 tokens。

# Kimi

月之暗面的模型。超长上下文确实有独到之处。

模型计费单价
moonshot-v1-8k¥ 12 / 1M tokens
moonshot-v1-32k¥ 24 / 1M tokens
moonshot-v1-128k¥ 60 / 1M tokens

免费额度:注册送 15 元额度。

# Deepseek

模型输入价格输出价格上下文长度
deepseek-chat¥ 1 / 1M tokens¥ 2 / 1M tokens32k tokens
deepseek-coder¥ 1 / 1M tokens¥ 2 / 1M tokens16k tokens

免费额度:注册送 20 元额度。

# MiniMax

模型名称单价统一单位后的计费单价上下文 token 数
abab6-chat0.1元/千tokens¥ 100 / 1M tokens32768
abab5.5-chat0.015元/千tokens¥ 15 / 1M tokens16384
abab5.5s-chat0.005元/千tokens¥ 5 / 1M tokens8192

免费额度:注册送 75 元额度。

# 智谱

24.05.11 GLM-3-Turbo 降价。

模型单价统一单位后的计费单价  上下文 token 数
GLM-40.1元 / 千tokens¥ 100 / 1M tokens128K
GLM-3-Turbo0.001元 / 千tokens¥ 1 / 1M tokens128K

很明显对标的 OpenAI,定价比 OpenAI 略低。

# Mistral

ModelInput (USD)Output (USD)Input (EUR)Output (EUR)
Mistral 7B0.25$ / 1M tokens0.25$ / 1M tokens0.2€ / 1M tokens0.2€ / 1M tokens
Mixtral 8x7B0.7$ / 1M tokens0.7$ / 1M tokens0.65€ / 1M tokens0.65€ / 1M tokens
Mistral Small2$ / 1M tokens6$ / 1M tokens1.85€ / 1M tokens5.55€ / 1M tokens
Mistral Medium2.7$ / 1M tokens8.1$ / 1M tokens2.5€ / 1M tokens7.5€ / 1M tokens
Mistral Large8$ / 1M tokens24$ / 1M tokens7.3€ / 1M tokens22€ / 1M tokens

根据现在的汇率(1SUD=7.22CNY / 1EUR=7.75),CNY 的表格如下:

Model          Input (USD-CNY)  Output (USD-CNY)  Input (EUR-CNY)  Output (EUR-CNY)  
Mistral 7B    ¥1.805 / 1M tokens¥1.805 / 1M tokens¥1.55 / 1M tokens  ¥1.55 / 1M tokens  
Mixtral 8x7B  ¥5.054 / 1M tokens  ¥5.054 / 1M tokens  ¥5.0375 / 1M tokens¥5.0375 / 1M tokens
Mistral Small  ¥14.44 / 1M tokens    ¥43.32 / 1M tokens    ¥14.3375 / 1M tokens¥43.0125 / 1M tokens
Mistral Medium¥19.494 / 1M tokens  ¥58.482 / 1M tokens  ¥19.375 / 1M tokens  ¥58.125 / 1M tokens  
Mistral Large  ¥57.76 / 1M tokens    ¥173.28 / 1M tokens  ¥56.575 / 1M tokens  ¥170.5 / 1M tokens  

# Replicate

ModelInput            Output            
meta/llama-2-70b      $0.65 / 1M tokens$2.75 / 1M tokens
meta/llama-2-13b      $0.10 / 1M tokens$0.50 / 1M tokens
meta/llama-2-7b      $0.05 / 1M tokens$0.25 / 1M tokens
meta/llama-2-70b-chat      $0.65 / 1M tokens$2.75 / 1M tokens
meta/llama-2-713b-chat      $0.10 / 1M tokens$0.50 / 1M tokens
meta/llama-2-7b-chat      $0.05 / 1M tokens$0.25 / 1M tokens
mistralai/mistral-7b-v0.1      $0.05 / 1M tokens$0.25 / 1M tokens
mistralai/mistral-7b-instruct-v0.2      $0.05 / 1M tokens$0.25 / 1M tokens
mistralai/mixtral-8x7b-instruct-v0.1      $0.30 / 1M tokens$1.00 / 1M tokens

根据现在的汇率(1SUD=7.22CNY),CNY 的表格如下:

ModelInput            Output          
meta/llama-2-70b      ¥4.693 / 1M tokens¥19.855 / 1M tokens
meta/llama-2-13b      ¥0.722 / 1M tokens¥3.61 / 1M tokens
meta/llama-2-7b      ¥0.361 / 1M tokens¥1.805 / 1M tokens
meta/llama-2-70b-chat      ¥4.693 / 1M tokens¥19.855 / 1M tokens
meta/llama-2-713b-chat      ¥0.722 / 1M tokens¥3.61 / 1M tokens
meta/llama-2-7b-chat      ¥0.361 / 1M tokens¥1.805 / 1M tokens
mistralai/mistral-7b-v0.1      ¥0.361 / 1M tokens¥1.805 / 1M tokens
mistralai/mistral-7b-instruct-v0.2      ¥0.361 / 1M tokens¥1.805 / 1M tokens
mistralai/mixtral-8x7b-instruct-v0.1      ¥2.166 / 1M tokens¥7.22 / 1M tokens

# Cloudflare

免费额度:10,000 Neurons per day

具体价格见 价格计算器

以下是根据计算器大致推断出的免费 Tokens 数量。Beta 时期的模型全部免费。

ModelInput(Cost 10k Neurons)Output(Cost 10k Neurons)
@cf/mistral/mistral-7b-instruct-v0.140000034000
@cf/meta/llama2-7b-chat-int840000064000
@cf/meta/llama2-7b-chat-fp1620000017000
使用 Hugo 构建
主题 StackJimmy 设计