NVIDIA NIM

NVIDIA NIM（推理微服务）提供企业级 AI 推理加速，基于 NVIDIA GPU 优化，涵盖 Llama、Mistral、Gemma 等主流开源模型，支持本地部署和云端托管。

综合评分

速度

稳定性

性价比

易用性

条评测

🌐 官网 📄 API 文档 🔗 开始使用 →

📋 模型列表 & 价格

文本 7 个模型

模型名称	类型	上下文	输入价格	输出价格	说明
google/gemma-2-27b-it ⭐ 开源	文本	8.192K	¥400000.0000/1M	¥1600000.0000/1M	Google Gemma 2 27B，NVIDIA 优化版
meta/llama-3-3-70b-instruct ⭐ 开源	文本	128K	¥500000.0000/1M	¥2000000.0000/1M	Meta Llama 3.3 70B，NVIDIA 加速
meta/llama-4-maverick-17b-128e-instruct ⭐ 开源	文本	160K	¥1800000.0000/1M	¥7200000.0000/1M	Meta Llama 4 Maverick，NVIDIA 高性能版
meta/llama-4-scout-17b-16e-instruct ⭐ 开源	文本	160K	¥1100000.0000/1M	¥4400000.0000/1M	Meta Llama 4 Scout，NVIDIA 优化版，企业级推理
mistralai/mistral-nemo-12b-instruct ⭐ 开源	文本	160K	¥300000.0000/1M	¥1200000.0000/1M	Mistral Nemo 12B，NVIDIA 优化推理
mistralai/mixtral-8x7b-instruct ⭐ 开源	文本	32.768K	¥500000.0000/1M	¥2000000.0000/1M	Mixtral 8x7B 稀疏 MoE，NVIDIA 加速版
nvidia/llama-3-1-nemotron-70b-instruct ⭐ 开源	文本	128K	¥1500000.0000/1M	¥6000000.0000/1M	NVIDIA NeMo Instruct，NVIDIA 深度优化

Embedding 1 个模型

模型名称	类型	上下文	输入价格	输出价格	说明
nvidia/nv-embed-qa-4	Embedding	4.096K	¥100000.0000/1M	¥100000.0000/1M	NVIDIA 自研 QA Embedding 模型

👤 企业CTO王博士 ★ 4

速度 3 稳定 5 性价比 3 易用 3

NVIDIA NIM 企业级保障，GPU 加速推理快，但价格较高，适合对延迟和稳定性有极高要求的企业。

2026-03-31

登录后可提交评测，参与社区讨论

🔒 登录后评测 📣 注册账号