Groq

Groq 以自研 LPU 芯片提供业界最快推理速度,Llama 3.3 70B 响应延迟比同类产品低 10 倍以上,当前 beta 期间免费使用,是低延迟应用的理想选择。

4.7
综合评分
5
速度
4
稳定性
5
性价比
4
易用性
1
条评测

文本 Text 模型(9 个)

模型名称 上下文 输入价格 输出价格 备注
gemma2-9b-it 开源
8.192K 免费 免费 Google Gemma 2 9B,Groq 优化版
gemma2-9b-it 开源
8.192K 免费 免费 Gemma 2 9B Groq 优化版
llama-3.1-405b-reasoning 开源
131.072K $4.0000/1M $4.0000/1M Llama 3.1 405B Groq 超快推理版
llama-3.1-405b-reasoning 开源
131.072K $4.0000/1M $4.0000/1M Llama 3.1 405B Groq 超快推理版
llama-3.1-70b-instruct 开源
128K 免费 免费 Llama 3.1 70B,Groq高速版
llama-3.1-8b-instant 开源
128K 免费 免费 Llama 3.1 8B,轻量高速版
llama-3.3-70b-versatile 开源
131.072K 免费 免费 Llama 3.3 70B Groq 超快推理版,业界最低延迟
llama-3.3-70b-versatile 开源
128K 免费 免费 Llama 3.3 70B,Groq LPU 加速,业界最快推理
mixtral-8x22b 开源
65.536K $2.0000/1M $2.0000/1M Mixtral 8x22B Groq 加速版