Groq

Groq 以自研 LPU 芯片提供业界最快推理速度,Llama 3.3 70B 响应延迟比同类产品低 10 倍以上,当前 beta 期间免费使用,是低延迟应用的理想选择。

4.7
综合评分
5
速度
4
稳定性
5
性价比
4
易用性
1
条评测

📋 模型列表 & 价格

文本 6 个模型
模型名称类型上下文 输入价格输出价格说明
gemma2-9b-it
⭐ 开源
文本 8.192K 免费 免费 Google Gemma 2 9B,Groq 优化版
llama-3.1-70b-instruct
⭐ 开源
文本 128K 免费 免费 Llama 3.1 70B,Groq高速版
llama-3.1-8b-instant
⭐ 开源
文本 128K 免费 免费 Llama 3.1 8B,轻量高速版
llama-3.3-70b-versatile
⭐ 开源
文本 128K 免费 免费 Llama 3.3 70B,Groq LPU 加速,业界最快推理
llama-guard-3-8b
⭐ 开源
文本 8.192K ¥21600000.0000/1M ¥108000000.0000/1M Llama Guard 3 安全模型,内容审核专用
mixtral-8x7b-32768
⭐ 开源
文本 32.768K 免费 免费 Mixtral 8x7B 稀疏 MoE,Groq 加速版

💬 用户评测

👤 追求速度的开发者 ★ 4.7
速度 5 稳定 4 性价比 5 易用 4

Groq 的推理速度是真的快到离谱,Llama 3.3 70B 的延迟比很多 7B 模型还低!

2026-03-31

✎ 发表评测

登录后可提交评测,参与社区讨论