Cerebras

Cerebras 基于自研晶圆级芯片提供超快推理服务,Llama 3.1 70B 推理速度比 GPU 快 20 倍。适合对延迟有极致要求的实时应用场景。

文本 Text 模型(2 个)

模型名称 上下文 输入价格 输出价格 备注
llama3.1-70b 开源
131.072K $1.0000/1M $1.0000/1M Llama 3.1 70B Cerebras 超快推理
llama3.1-8b 开源
131.072K 免费 免费 Llama 3.1 8B Cerebras 超快推理