Groq

Groq 以自研 LPU 芯片提供业界最快推理速度，Llama 3.3 70B 响应延迟比同类产品低 10 倍以上，当前 beta 期间免费使用，是低延迟应用的理想选择。

4.7

综合评分

速度

稳定性

性价比

易用性

条评测

🌐 官网 📄 API 文档 🔗 开始使用 →

📋 模型列表 & 价格

文本 6 个模型

👤 追求速度的开发者 ★ 4.7

速度 5 稳定 4 性价比 5 易用 4

Groq 的推理速度是真的快到离谱，Llama 3.3 70B 的延迟比很多 7B 模型还低！

2026-03-31

登录后可提交评测，参与社区讨论

🔒 登录后评测 📣 注册账号