收录 32+ 全球大模型平台

大模型 API
提供商导航

收录全球主流大模型平台,真实价格 · 最新模型 · 用户评测
找最适合自己的 AI API,一站搞定

Enter 搜索 · Esc 清空
32
平台
297
模型
32
收录平台
DeepSeek
deepseek

DeepSeek 是专注于 AGI 的中国人工智能公司,最新模型 DeepSeek-V4-Pro 性能强劲,价格极具竞争力(缓存命中仅 ¥0.025/百万tokens)。支持 128K 超长上下文,A

DeepSeek-V3.2-chatDeepSeek-V3.2-reasonerDeepSeek-V4-Pro
Anthropic
anthropic

Anthropic 由前 OpenAI 核心团队创立,Claude 4.6 系列是 2026 年最新模型,Sonnet 4.6 和 Opus 4.6 均支持 1M Token 上下文。以安全性、推理能

claude-3-5-sonnet-20241022claude-3-5-haiku-20241022claude-3-opus-20240229
阿里云百炼
aliyun-bailian

阿里云百炼是基于通义千问(Qwen)系列的大模型平台,Qwen3.7-Max 是 2026 年 5 月最新旗舰模型,面向智能体时代设计,ArtificialAnalysis 榜单全球第五、国产第一。支

qwen-maxqwen-max-longcontextqwen-plus
OpenAI
openai

OpenAI 是全球领先的人工智能研究公司,GPT-5.5 是 2026 年最新旗舰模型,推理能力大幅提升。o3/o4-mini 专注深度推理,API 生态完善,文档详尽。支持 1M 超长上下文。

GPT-5o1o3
Google AI
google-ai

Google AI 的 Gemini 系列是 DeepMind 研发的多模态大模型,Gemini 3.1 Pro 是 2026 年最新旗舰,支持 2M 超长上下文,原生集成 Google 生态。

gemini-2.0-flashgemini-2.0-flash-expgemini-1.5-pro
月之暗面
moonshot

月之暗面(Moonshot AI)是一家专注于大模型研发的公司,旗下 Kimi 大模型支持超长上下文理解(最高 256K tokens,约 200 万字),在文档分析、多轮对话、代码理解、多模态等场景

kimi-k2.5kimi-k2-0905-previewkimi-k2-0711-preview
Mistral AI
mistral

Mistral AI 是欧洲领先的 AI 公司,以高效开源模型闻名。Mistral Large 2 性能媲美 GPT-4,Mixtral 系列采用 MoE 架构兼顾性能与成本,支持多语言和代码生成。

mistral-large-latestmistral-medium-latestmistral-small-latest
Groq
groq

Groq 以自研 LPU 芯片提供业界最快推理速度,Llama 3.3 70B 响应延迟比同类产品低 10 倍以上,当前 beta 期间免费使用,是低延迟应用的理想选择。

llama-3.3-70b-versatilellama-3.1-70b-instructllama-3.1-8b-instant
Xiaomi MiMo
xiaomi-mimo

Xiaomi MiMo 是小米 AI 实验室自研的大模型平台,MiMo-V2.5 系列采用万亿参数 MoE 架构(1T 总参数/42B 激活),支持 1M 超长上下文。全模态 Agent 能力突出,已

MiMo-V2-ProMiMo-V2-7B-InstructMiMo-V2-14B-Instruct
Runway
runway

Runway 是 AI 视频生成领域的先驱,Gen-4.5 是 2026 年最新模型,支持高质量文本生成视频和图像生成视频。在影视制作、广告创意等领域广泛应用。

Gen-4.5 TurboGen-4.5Gen-3 Alpha Turbo
智谱 AI
zhipuai

智谱 AI 是国内最早的大模型独角兽之一,全栈自研 GLM 系列大模型。GLM-5.1 是 2026 年最新旗舰模型,Coding 能力对齐 Claude Opus 4.6,可自主工作长达 8 小时。

GLM-4-Plus-0111GLM-4V-PlusGLM-4-Long
AWS Bedrock
aws-bedrock

AWS Bedrock 是亚马逊云大模型平台,聚合 Anthropic Claude、Meta Llama、AI21 Jurassic、Cohere 等顶级模型,提供企业级安全、合规和身份管理能力。

anthropic.claude-3-5-sonnet-20241022anthropic.claude-3-5-haiku-20241022anthropic.claude-3-5-haiku-20241022
Fireworks AI
fireworks-ai

Fireworks AI 提供超快的开源模型推理服务,基于自研推理引擎实现极低延迟。支持 Llama、Mixtral 等主流模型,适合对响应速度要求高的应用场景。

accounts/fireworks/models/llama-v3p1-70b-instructaccounts/fireworks/models/mixtral-8x22b-instructaccounts/fireworks/models/qwen2p5-72b-instruct
xAI
xai

xAI 是 Elon Musk 创立的 AI 公司,Grok 系列模型以幽默风格和实时信息访问著称。Grok-3 具备强大的推理能力,支持 X 平台实时数据,适合需要最新信息的应用场景。

grok-3grok-3-minigrok-3-fast
讯飞星火
iflytek-spark

讯飞星火是科大讯飞推出的大模型,在中文语音理解和生成方面具有独特优势。Spark X2 是最新深度推理模型,支持多模态交互,深度集成讯飞语音技术。

Spark X2Spark X2 FlashSpark Ultra
Together AI
together-ai

Together AI 是开源模型推理平台,聚合 Llama、Mistral、Qwen 等主流开源模型,提供高性能 GPU 推理服务。价格透明,支持微调和自定义部署,是开源模型爱好者的首选。

meta-llama/Meta-Llama-3.1-405B-Instruct-Turbometa-llama/Meta-Llama-3.1-70B-Instruct-TurboQwen/Qwen2.5-72B-Instruct-Turbo
Perplexity
perplexity

Perplexity 是 AI 搜索引擎的领导者,结合大模型与实时网络搜索能力。pplx 系列模型专为搜索增强生成优化,提供带引用的准确回答,适合知识密集型应用。

llama-3.1-sonar-large-128k-onlinellama-3.1-sonar-small-128k-onlinellama-3.1-sonar-large-128k-chat
MiniMax
minimax

MiniMax 是少数在文本、语音、视频、音乐和图像全模态领域均研发世界前沿模型的 AI 公司。Token Plan 是对此前 Coding Plan 的全面升级,在语言模型之外提供更多模态的用量支持

M2.7M2.7-highspeedSpeech 2.8
阶跃星辰
stepfun

阶跃星辰是国内领先的大模型公司,Step 系列模型在多模态理解方面表现优异。Step-2 性能强劲,支持文本、图像、视频等多种模态输入,适合复杂的多模态应用场景。

step-2-16kstep-1-8kstep-1-flash
火山引擎
volcengine

火山引擎是字节跳动旗下云服务平台,豆包 2.0 是 2026 年最新模型系列,在抖音、头条等字节系产品中广泛使用,价格亲民。

doubao视觉模型豆包Embeddingdoubao-1.5-pro-256k
硅基流动
siliconflow

SiliconFlow(硅基流动)是高性价比大模型推理平台,聚合 Qwen、GLM、Llama、SD 等主流开源模型,兼容 OpenAI API 格式,部分模型完全免费,适合开发者快速接入。

Qwen2.5-72B-InstructQwen2.5-14B-InstructQwen2.5-7B-Instruct
七牛云
qiniu

七牛云是大模型服务平台(QNN),聚合多款国产大模型,支持 token 计费和流量包,兼容 OpenAI 格式 API,适合企业快速接入,上手简单。

qwen-plus-32kqwen-turbo-32kqwen-max
零一万物
01ai

零一万物(01.AI)由李开复创立,Yi 系列模型在中文能力上表现突出。Yi-Lightning 性价比极高,Yi-Large 支持超长上下文,适合中文场景的大规模应用。

yi-largeyi-large-turboyi-medium
腾讯云
tencent-cloud

腾讯云混元大模型(Hunyuan)是腾讯全链路自研万亿参数模型,已在微信、QQ、腾讯会议等亿级产品中打磨,支持文生文、文生图、文生代码等多种能力。

hunyuan-prohunyuan-standardhunyuan-lite
NVIDIA NIM
nvidia-nim

NVIDIA NIM(推理微服务)提供企业级 AI 推理加速,基于 NVIDIA GPU 优化,涵盖 Llama、Mistral、Gemma 等主流开源模型,支持本地部署和云端托管。

meta/llama-4-scout-17b-16e-instructmeta/llama-4-maverick-17b-128e-instructmistralai/mistral-nemo-12b-instruct
百川智能
baichuan

百川智能专注于中文大模型研发,Baichuan 系列在中文理解和生成方面具有优势。支持超长上下文处理,在文档分析、内容创作等场景表现出色。

Baichuan4Baichuan3-TurboBaichuan2-Turbo
百度千帆
baidu-qianfan

百度千帆是百度智能云大模型平台,ERNIE 5.0 是 2026 年最新旗舰模型,中文理解与生成能力顶尖,支持超长上下文。

ERNIE-4.0-8KERNIE-4.0-128KERNIE-3.5-8K
DeepInfra
deepinfra

DeepInfra 是开源模型云托管平台,提供 Llama、Mistral、Mixtral 等模型的高性能推理服务。价格低廉,支持按需扩缩容,适合需要稳定开源模型服务的开发者。

meta-llama/Meta-Llama-3.1-405B-Instructmeta-llama/Meta-Llama-3.1-70B-Instructmistralai/Mixtral-8x22B-Instruct-v0.1
Cerebras
cerebras

Cerebras 基于自研晶圆级芯片提供超快推理服务,Llama 3.1 70B 推理速度比 GPU 快 20 倍。适合对延迟有极致要求的实时应用场景。

llama3.1-8bllama3.1-70b
Replicate
replicate

Replicate 是开源模型部署平台,支持一键部署和运行开源模型。涵盖图像生成、语音合成、文本生成等多种模型,按使用量计费,适合快速原型开发。

meta/llama-3.1-405b-instructstability-ai/sdxl
Cohere
cohere

Cohere 专注于企业级 AI 应用,Command R+ 在 RAG 场景表现优异。提供 Embedding、生成、分类等完整 API 套件,支持多语言,适合构建企业知识库和客服系统。

command-r-pluscommand-rembed-multilingual-v3.0
Stability AI
stability-ai

Stability AI 是图像生成领域的领导者,Stable Diffusion 系列是最流行的开源图像生成模型。SD3 在图像质量和文字渲染上大幅提升,支持 API 调用和本地部署。

stable-diffusion-xl-1024-v1-0stable-diffusion-3-medium