さくらのAI Engine

生成AIアプリ開発に最適なセキュアで柔軟なAPI基盤

ソーシャルログイン（GitHub）対応無料でPlaygroundを試す

すぐにモデルを試せる

無料ですぐにAIモデルをお試しいただけます（さくらIDまたはGitHubアカウント認証にてご利用いただけます）。
組み込み前に動作を直感的に確認できるため、利用イメージの検証から本格導入までをスムーズに進めることができます。

Playgroundでお試しいただけるモデル

無料でPlaygroundを試す

テキスト生成・分類・埋め込み・音声認識（whisper）に対応

カテゴリー	提供モデル	基盤モデル無償プランリクエスト制限内での利用が無料	従量課金プラン無償プランのリクエストを超過した場合
Chat completions	gpt-oss-120b	1ヶ月あたり 3,000リクエストまで	Input 0.15円 / 10,000トークン Output 0.75円 / 10,000トークン
	Qwen3-Coder-480B-A35B-Instruct-FP8		Input 0.3円/ 10,000トークン Output 2.5円/ 10,000トークン
	Qwen3-Coder-30B-A3B-Instruct		Input 0.15円 / 10,000トークン Output 0.75円 / 10,000トークン
	llm-jp-3.1-8x13b-instruct4		Input 0.15円 / 10,000トークン Output 0.75円 / 10,000トークン
Audio transcription	whisper-large-v3-turbo	1ヶ月あたり 50リクエストまで	0.5円 / 60秒
Embeddings	multilingual-e5-large	1ヶ月あたり 10,000リクエストまで	Input 2円 / 10,000トークン Output 無料
ドキュメント（RAG）		3円 / 100チャンク

表示価格は税込です。
基盤モデル無償プランと従量課金プランは別プランとなります（自動的に従量課金プランに移行することはありません）。
従量課金プランでも基盤モデル無償プランと同等の無償利用枠が存在します。ドキュメント（RAG）については無償利用枠はなく、両プランとも利用に応じて最小単位（100チャンク）ごとに料金が発生します。
基盤モデル無償プランで無償利用枠を超過した場合、APIリクエストに対してレート制御がかかります。従量課金プランで無償利用枠を超過した場合、各基盤モデルの最小単位（10,000トークン／60秒）ごとに料金が発生します。
基盤モデル無償プランには申し込み数に上限があり、上限に達した場合は新規利用の受付を停止いたします。

クローズドモデルは、提供元が商用利用を前提に提供するAIモデルです。モデル提供元の利用ポリシーに基づく審査・許諾が必要となるため、当社環境でのご利用には申請が必須となります。さくらのAI Engineのコントロールパネルより申請が可能です。
詳しくはマニュアルサイトをご確認ください。

カテゴリー	提供モデル・提供元	基盤モデル無償プラン	従量課金プラン
Chat Completions	提供モデル：PLaMo 2.0-31B 提供元：PFN	対象外	詳しくはマニュアルサイトをご確認いただくか、個別にお問い合わせください。お問い合わせフォーム
Chat Completions	提供モデル：cotomi v3※ 提供元：NEC	対象外	詳しくはマニュアルサイトをご確認いただくか、個別にお問い合わせください。お問い合わせフォーム

cotomi：「cotomi」は、NECが開発した生成AIの名称です。ことばにより未来を示し、「こと」が「みのる」ように」という想いを込めており、生成AIを軸にお客様と伴走するパートナーでありたいとNECは考えています。（「cotomi」は、日本電気株式会社の登録商標です。）

パブリックプレビューモデルはユーザーの皆様に実際の利用環境での動作検証およびフィードバックの収集を目的とした提供となり、予告なく提供を終了する場合があります。提供期間中も安定性や応答品質について保証するものではなく、動作や仕様が変更となる可能性があります。パブリックプレビュー終了後、継続して提供する際には料金が変更になる場合があります。