NVIDIA NIM

NVIDIA NIM(推理微服务)提供企业级 AI 推理加速,基于 NVIDIA GPU 优化,涵盖 Llama、Mistral、Gemma 等主流开源模型,支持本地部署和云端托管。

4
综合评分
3
速度
5
稳定性
3
性价比
3
易用性
1
条评测

📋 模型列表 & 价格

文本 7 个模型
模型名称类型上下文 输入价格输出价格说明
google/gemma-2-27b-it
⭐ 开源
文本 8.192K ¥400000.0000/1M ¥1600000.0000/1M Google Gemma 2 27B,NVIDIA 优化版
meta/llama-3-3-70b-instruct
⭐ 开源
文本 128K ¥500000.0000/1M ¥2000000.0000/1M Meta Llama 3.3 70B,NVIDIA 加速
meta/llama-4-maverick-17b-128e-instruct
⭐ 开源
文本 160K ¥1800000.0000/1M ¥7200000.0000/1M Meta Llama 4 Maverick,NVIDIA 高性能版
meta/llama-4-scout-17b-16e-instruct
⭐ 开源
文本 160K ¥1100000.0000/1M ¥4400000.0000/1M Meta Llama 4 Scout,NVIDIA 优化版,企业级推理
mistralai/mistral-nemo-12b-instruct
⭐ 开源
文本 160K ¥300000.0000/1M ¥1200000.0000/1M Mistral Nemo 12B,NVIDIA 优化推理
mistralai/mixtral-8x7b-instruct
⭐ 开源
文本 32.768K ¥500000.0000/1M ¥2000000.0000/1M Mixtral 8x7B 稀疏 MoE,NVIDIA 加速版
nvidia/llama-3-1-nemotron-70b-instruct
⭐ 开源
文本 128K ¥1500000.0000/1M ¥6000000.0000/1M NVIDIA NeMo Instruct,NVIDIA 深度优化
Embedding 1 个模型
模型名称类型上下文 输入价格输出价格说明
nvidia/nv-embed-qa-4
Embedding 4.096K ¥100000.0000/1M ¥100000.0000/1M NVIDIA 自研 QA Embedding 模型

💬 用户评测

👤 企业CTO王博士 ★ 4
速度 3 稳定 5 性价比 3 易用 3

NVIDIA NIM 企业级保障,GPU 加速推理快,但价格较高,适合对延迟和稳定性有极高要求的企业。

2026-03-31

✎ 发表评测

登录后可提交评测,参与社区讨论