Question 1

Cerebras Batch Inferenceは、従来の推論ソリューションとは何が異なるのでしょうか？

Accepted Answer

Cerebrasバッチ推論は、ウエハースケール技術を利用しており、著しく高いスループットと低レイテンシを実現しています。これにより、1秒あたり3,000トークンを超える記録的な速度を達成し、キューにあるワークロードに対してコスト効率の良い価格を提供します。

Question 2

価格モデルの柔軟性はどの程度ですか？

Accepted Answer

私たちの価格モデルは、オンデマンドと予約されたキャパシティの両方の選択肢に対応するよう設計されており、スタートアップから企業まで柔軟性を提供します。お客様は、自分のワークロードニーズに最適な価格を選ぶことができます。

Question 3

Cerebras Batch Inferenceでは、どのAIモデルがサポートされていますか？

Accepted Answer

私たちは、GPT OSS 120BやMeta Llama 3/4などの幅広いトップオープンモデルをサポートしています。この広範な互換性により、お客様のアプリケーションに合わせたカスタムおよびプロダクションレベルのモデルを即座に展開することが可能です。

セレブラス・バッチ推論

仕様