さくらのAI Engine
生成AIアプリ開発に最適なセキュアで柔軟なAPI基盤
すぐにモデルを試せる
多彩なモデルをコントロールパネルからPlaygroundですぐに試すことができます。組み込み前に動作を直感的に確認でき、利用イメージの検証から本格導入までをスムーズに進めることができます。
                - OpenAI互換
 - OpenAI互換APIで最新のLLMが使え、
国産モデルも利用可 
- 無償プラン
あり - 利用上限に達するまで
従量プランと同様に使える 
- 利用データの
流出なし - 日本国内DCで完結
モデル提供事業者へ利用データが送信されない 
- セキュアな
閉域構成 - VPN/LGWAN/専有ネットワーク対応
 
ご利用いただけるLLM例
テキスト生成・分類・埋め込み・音声認識(whisper)に対応
- Chat completions
 - Audio transcription
 - Embeddings
 - ドキュメント(RAG)
 
料金
| カテゴリー | 提供モデル | 基盤モデル無償プランリクエスト制限内での 利用が無料  | 
                      従量課金プラン無償プランのリクエストを 超過した場合  | 
                    
|---|---|---|---|
| Chat completions | gpt-oss-120b | 1ヶ月あたり 3,000リクエストまで  | 
                      
                        
 
  | 
                    
| Qwen3-Coder-480B-A35B-Instruct-FP8 | 
                        
 
  | 
                    ||
| Qwen3-Coder-30B-A3B-Instruct | 
                        
 
  | 
                    ||
| llm-jp-3.1-8x13b-instruct4 | 
                        
 
  | 
                    ||
| Audio transcription | whisper-large-v3-turbo | 1ヶ月あたり 50リクエストまで  | 
                      0.5円 / 60秒 | 
| Embeddings | multilingual-e5-large | 1ヶ月あたり 10,000リクエストまで  | 
                      
                        
 
  | 
                    
| ドキュメント(RAG) | 3円 / 100チャンク | ||
- 表示価格は税込です。
 - 基盤モデル無償プランと従量課金プランは別プランとなります(自動的に従量課金プランに移行することはありません)。
 - 従量課金プランでも基盤モデル無償プランと同等の無償利用枠が存在します。ドキュメント(RAG)については無償利用枠はなく、両プランとも利用に応じて最小単位(100チャンク)ごとに料金が発生します。
 - 基盤モデル無償プランで無償利用枠を超過した場合、APIリクエストに対してレート制御がかかります。従量課金プランで無償利用枠を超過した場合、各基盤モデルの最小単位(10,000トークン/60秒)ごとに料金が発生します。
 - 基盤モデル無償プランには申し込み数に上限があり、上限に達した場合は新規利用の受付を停止いたします。
 
| パブリックプレビューモデル | 従量課金プラン | 
|---|---|
| Qwen3-0.6B-cpu (2025年10月9日〜) | 
                        
 
  | 
                    
| Phi-4-mini-instruct-cpu (2025年10月9日〜) | 
                        
 
  | 
                    
| Qwen3-VL-30B-A3B-Instruct (2025年10月21日〜) | 
                        
 
  | 
                    
| Phi-4-multimodal-instruct (2025年10月21日〜) | 
                        
 
  | 
                    
- パブリックプレビューモデルはユーザーの皆様に実際の利用環境での動作検証およびフィードバックの収集を目的とした提供となり、予告なく提供を終了する場合があります。提供期間中も安定性や応答品質について保証するものではなく、動作や仕様が変更となる可能性があります。パブリックプレビュー終了後、継続して提供する際には料金が変更になる場合があります。
 
ご利用の流れ
- STEP 1.
 - 
                  
さくらインターネットの会員IDを作成
会員IDをお持ちでない方は、まずはじめに会員IDを作成します。
ご登録には電話番号が必要です。(電話番号認証を行います)すでにさくらインターネットの会員IDをお持ちの方はステップ2にお進みください。
さくらインターネットの会員IDを作成する(無料) 
- STEP 2.
 - 
                  
「さくらのクラウド」のプロジェクトを作成
会員IDを使ってコントロールパネルにログインした後、さくらのクラウドのプロジェクトを作成します。
- 「さくらのクラウド」をご利用いただく際にはクレジットカード登録が必要です。さくらインターネットの他のサービスでクレジットカードを登録されている場合、追加登録は不要です。
 - すでに「さくらのクラウド」のプロジェクトをお持ちの方はステップ3にお進みください。
 
 
- STEP 3.
 - 
                  
コントロールパネルからご利用開始
コントロールパネルにアクセスし、さくらのAI Engineをご利用ください。
さくらのクラウドのログイン画面へリダイレクトされます。
「さくらのAI Engine」コントロールパネルにアクセスする
STEP1、STEP2で取得したアカウント情報を入力し、ログインしてください。コントロールパネルアクセス後、左メニューの「Playground」よりご利用いただけます。
 
さくらのAIに関する
個別のご相談・
お問い合わせもお待ちしております