收录 32+ 全球大模型平台

大模型 API
提供商导航

收录全球主流大模型平台，真实价格 · 最新模型 · 用户评测
找最适合自己的 AI API，一站搞定

平台

297

模型

收录平台

🌐 全部 📝 文本模型 🔗 Embedding 🎨 图像模型 🎤 语音模型 💻 代码模型 🧠 多模态

DeepSeek

deepseek

DeepSeek 是专注于 AGI 的中国人工智能公司，最新模型 DeepSeek-V4-Pro 性能强劲，价格极具竞争力（缓存命中仅 ¥0.025/百万tokens）。支持 128K 超长上下文，A

DeepSeek-V3.2-chatDeepSeek-V3.2-reasonerDeepSeek-V4-Pro

Anthropic 由前 OpenAI 核心团队创立，Claude 4.6 系列是 2026 年最新模型，Sonnet 4.6 和 Opus 4.6 均支持 1M Token 上下文。以安全性、推理能

claude-3-5-sonnet-20241022claude-3-5-haiku-20241022claude-3-opus-20240229

阿里云百炼是基于通义千问（Qwen）系列的大模型平台，Qwen3.7-Max 是 2026 年 5 月最新旗舰模型，面向智能体时代设计，ArtificialAnalysis 榜单全球第五、国产第一。支

qwen-maxqwen-max-longcontextqwen-plus

OpenAI 是全球领先的人工智能研究公司，GPT-5.5 是 2026 年最新旗舰模型，推理能力大幅提升。o3/o4-mini 专注深度推理，API 生态完善，文档详尽。支持 1M 超长上下文。

Google AI 的 Gemini 系列是 DeepMind 研发的多模态大模型，Gemini 3.1 Pro 是 2026 年最新旗舰，支持 2M 超长上下文，原生集成 Google 生态。

gemini-2.0-flashgemini-2.0-flash-expgemini-1.5-pro

月之暗面（Moonshot AI）是一家专注于大模型研发的公司，旗下 Kimi 大模型支持超长上下文理解（最高 256K tokens，约 200 万字），在文档分析、多轮对话、代码理解、多模态等场景

kimi-k2.5kimi-k2-0905-previewkimi-k2-0711-preview

Mistral AI 是欧洲领先的 AI 公司，以高效开源模型闻名。Mistral Large 2 性能媲美 GPT-4，Mixtral 系列采用 MoE 架构兼顾性能与成本，支持多语言和代码生成。

mistral-large-latestmistral-medium-latestmistral-small-latest

Groq 以自研 LPU 芯片提供业界最快推理速度，Llama 3.3 70B 响应延迟比同类产品低 10 倍以上，当前 beta 期间免费使用，是低延迟应用的理想选择。

llama-3.3-70b-versatilellama-3.1-70b-instructllama-3.1-8b-instant

Xiaomi MiMo 是小米 AI 实验室自研的大模型平台，MiMo-V2.5 系列采用万亿参数 MoE 架构（1T 总参数/42B 激活），支持 1M 超长上下文。全模态 Agent 能力突出，已

MiMo-V2-ProMiMo-V2-7B-InstructMiMo-V2-14B-Instruct

Runway 是 AI 视频生成领域的先驱，Gen-4.5 是 2026 年最新模型，支持高质量文本生成视频和图像生成视频。在影视制作、广告创意等领域广泛应用。

Gen-4.5 TurboGen-4.5Gen-3 Alpha Turbo

智谱 AI 是国内最早的大模型独角兽之一，全栈自研 GLM 系列大模型。GLM-5.1 是 2026 年最新旗舰模型，Coding 能力对齐 Claude Opus 4.6，可自主工作长达 8 小时。

GLM-4-Plus-0111GLM-4V-PlusGLM-4-Long

AWS Bedrock 是亚马逊云大模型平台，聚合 Anthropic Claude、Meta Llama、AI21 Jurassic、Cohere 等顶级模型，提供企业级安全、合规和身份管理能力。

anthropic.claude-3-5-sonnet-20241022anthropic.claude-3-5-haiku-20241022anthropic.claude-3-5-haiku-20241022

Fireworks AI 提供超快的开源模型推理服务，基于自研推理引擎实现极低延迟。支持 Llama、Mixtral 等主流模型，适合对响应速度要求高的应用场景。

accounts/fireworks/models/llama-v3p1-70b-instructaccounts/fireworks/models/mixtral-8x22b-instructaccounts/fireworks/models/qwen2p5-72b-instruct

xAI 是 Elon Musk 创立的 AI 公司，Grok 系列模型以幽默风格和实时信息访问著称。Grok-3 具备强大的推理能力，支持 X 平台实时数据，适合需要最新信息的应用场景。

grok-3grok-3-minigrok-3-fast

讯飞星火是科大讯飞推出的大模型，在中文语音理解和生成方面具有独特优势。Spark X2 是最新深度推理模型，支持多模态交互，深度集成讯飞语音技术。

Spark X2Spark X2 FlashSpark Ultra

Together AI 是开源模型推理平台，聚合 Llama、Mistral、Qwen 等主流开源模型，提供高性能 GPU 推理服务。价格透明，支持微调和自定义部署，是开源模型爱好者的首选。

meta-llama/Meta-Llama-3.1-405B-Instruct-Turbometa-llama/Meta-Llama-3.1-70B-Instruct-TurboQwen/Qwen2.5-72B-Instruct-Turbo

Perplexity 是 AI 搜索引擎的领导者，结合大模型与实时网络搜索能力。pplx 系列模型专为搜索增强生成优化，提供带引用的准确回答，适合知识密集型应用。

llama-3.1-sonar-large-128k-onlinellama-3.1-sonar-small-128k-onlinellama-3.1-sonar-large-128k-chat

MiniMax 是少数在文本、语音、视频、音乐和图像全模态领域均研发世界前沿模型的 AI 公司。Token Plan 是对此前 Coding Plan 的全面升级，在语言模型之外提供更多模态的用量支持

M2.7M2.7-highspeedSpeech 2.8

阶跃星辰是国内领先的大模型公司，Step 系列模型在多模态理解方面表现优异。Step-2 性能强劲，支持文本、图像、视频等多种模态输入，适合复杂的多模态应用场景。

step-2-16kstep-1-8kstep-1-flash

方舟 Coding Plan 最新支持 GLM-5.2、MiniMax-M3、DeepSeek-V4 系列、Doubao-Seed-2.0 系列、Kimi-K2.6 等模型，工具不限，现在订阅叠加9.

doubao视觉模型豆包Embeddingdoubao-1.5-pro-256k

SiliconFlow（硅基流动）是高性价比大模型推理平台，聚合 Qwen、GLM、Llama、SD 等主流开源模型，兼容 OpenAI API 格式，部分模型完全免费，适合开发者快速接入。

Qwen2.5-72B-InstructQwen2.5-14B-InstructQwen2.5-7B-Instruct

七牛云是大模型服务平台（QNN），聚合多款国产大模型，支持 token 计费和流量包，兼容 OpenAI 格式 API，适合企业快速接入，上手简单。

qwen-plus-32kqwen-turbo-32kqwen-max

零一万物（01.AI）由李开复创立，Yi 系列模型在中文能力上表现突出。Yi-Lightning 性价比极高，Yi-Large 支持超长上下文，适合中文场景的大规模应用。

yi-largeyi-large-turboyi-medium

腾讯云混元大模型（Hunyuan）是腾讯全链路自研万亿参数模型，已在微信、QQ、腾讯会议等亿级产品中打磨，支持文生文、文生图、文生代码等多种能力。

hunyuan-prohunyuan-standardhunyuan-lite

NVIDIA NIM（推理微服务）提供企业级 AI 推理加速，基于 NVIDIA GPU 优化，涵盖 Llama、Mistral、Gemma 等主流开源模型，支持本地部署和云端托管。

meta/llama-4-scout-17b-16e-instructmeta/llama-4-maverick-17b-128e-instructmistralai/mistral-nemo-12b-instruct

百川智能专注于中文大模型研发，Baichuan 系列在中文理解和生成方面具有优势。支持超长上下文处理，在文档分析、内容创作等场景表现出色。

Baichuan4Baichuan3-TurboBaichuan2-Turbo

百度千帆是百度智能云大模型平台，ERNIE 5.0 是 2026 年最新旗舰模型，中文理解与生成能力顶尖，支持超长上下文。

ERNIE-4.0-8KERNIE-4.0-128KERNIE-3.5-8K

DeepInfra 是开源模型云托管平台，提供 Llama、Mistral、Mixtral 等模型的高性能推理服务。价格低廉，支持按需扩缩容，适合需要稳定开源模型服务的开发者。

meta-llama/Meta-Llama-3.1-405B-Instructmeta-llama/Meta-Llama-3.1-70B-Instructmistralai/Mixtral-8x22B-Instruct-v0.1

¥4/1M

Cerebras

cerebras

Cerebras 基于自研晶圆级芯片提供超快推理服务，Llama 3.1 70B 推理速度比 GPU 快 20 倍。适合对延迟有极致要求的实时应用场景。

llama3.1-8bllama3.1-70b

🔔 免费

Replicate

replicate

Replicate 是开源模型部署平台，支持一键部署和运行开源模型。涵盖图像生成、语音合成、文本生成等多种模型，按使用量计费，适合快速原型开发。

meta/llama-3.1-405b-instructstability-ai/sdxl

🔔 免费

Cohere

cohere

Cohere 专注于企业级 AI 应用，Command R+ 在 RAG 场景表现优异。提供 Embedding、生成、分类等完整 API 套件，支持多语言，适合构建企业知识库和客服系统。

command-r-pluscommand-rembed-multilingual-v3.0

🔔 免费

Stability AI

stability-ai

Stability AI 是图像生成领域的领导者，Stable Diffusion 系列是最流行的开源图像生成模型。SD3 在图像质量和文字渲染上大幅提升，支持 API 调用和本地部署。

stable-diffusion-xl-1024-v1-0stable-diffusion-3-medium

🔔 免费

大模型 API 提供商导航

大模型 API
提供商导航