さくらのAI Engine
生成AIアプリ開発に最適なセキュアで柔軟なAPI基盤
さくらのAI Engineは、生成AIアプリケーションを簡単に構築できるAPIサービスです。
多数のモデルの中から、オープンモデルや日本語特化モデルを厳選して提供しています。
APIは、業界標準のOpenAI APIと互換性があるため、既にOpenAI APIをご利用の方はスムーズに移行できます。
また、お客様のデータは学習などに一切利用されないため、高度な情報セキュリティーが求められる業務でも、安心してご活用いただけます。
すべてのデータ処理は日本国内のサーバーで完結し、日本の法律に基づいて運用。
信頼性と安全性を重視した、ビジネスに最適なAI基盤を提供します。
まずはPlaygroundでお試し!
「さくらのAI Engine」で提供しているAIモデルの一部を、無料でお試しいただけます。
GUIで直感的に動作を確認できるため、本格導入前の性能検証にご活用ください。
Playgroundは、さくらID または GitHub・X(旧Twitter)アカウント認証でご利用いただけます。
(「さくらのAI Engine」のご利用には、さくらの会員IDとクラウドプロジェクトが必要です)
Playgroundでお試しいただけるモデル
- gpt-oss-120b
- llm-jp-3.1
- Qwen3-Coder
- Qwen3
- Phi-4
- VOICEVOX
- OpenAI互換
- OpenAI互換APIで最新のLLMが使え、
国産モデルも利用可
- 無償プラン
あり - 利用上限に達するまで
従量プランと同様に使える
- 利用データの
流出なし - 日本国内DCで完結
モデル提供事業者へ利用データが送信されない
- セキュアな
閉域構成 - VPN/LGWAN/専有ネットワーク対応
ご利用いただけるLLM例
テキスト生成・分類・埋め込み・音声認識(whisper)に対応
- Chat completions
- Audio transcription
- Embeddings
- ドキュメント(RAG)
料金
| カテゴリー | 提供モデル | 基盤モデル無償プランリクエスト制限内での利用が無料 | 従量課金プラン無償プランのリクエストを 超過した場合 |
|---|---|---|---|
| Chat completions | gpt-oss-120b | 1ヶ月あたり 3,000リクエストまで |
|
| Qwen3-Coder-480B-A35B-Instruct-FP8 |
|
||
| Qwen3-Coder-30B-A3B-Instruct |
|
||
| llm-jp-3.1-8x13b-instruct4 |
|
||
| Audio transcription | whisper-large-v3-turbo | 1ヶ月あたり 50リクエストまで |
0.5円 / 60秒 |
| Embeddings | multilingual-e5-large | 1ヶ月あたり 10,000リクエストまで |
|
| Text-to-Speech | VOICEVOX:ずんだもん | 1ヶ月あたり 50リクエストまで |
|
| VOICEVOX:東北ずん子 | |||
| VOICEVOX:東北きりたん | |||
| VOICEVOX:東北イタコ | |||
| VOICEVOX:四国めたん | |||
| VOICEVOX:あんこもん | |||
| VOICEVOX:冥鳴ひまり | |||
| VOICEVOX:春日部つむぎ | |||
| ドキュメント(RAG) | 3円 / 100チャンク | ||
- 表示価格は税込です。
- 基盤モデル無償プランと従量課金プランは別プランとなります(自動的に従量課金プランに移行することはありません)。
- 従量課金プランでも基盤モデル無償プランと同等の無償利用枠が存在します。ドキュメント(RAG)については無償利用枠はなく、両プランとも利用に応じて最小単位(100チャンク)ごとに料金が発生します。
- 基盤モデル無償プランで無償利用枠を超過した場合、APIリクエストに対してレート制御がかかります。従量課金プランで無償利用枠を超過した場合、各基盤モデルの最小単位(10,000トークン/60秒)ごとに料金が発生します。
- 基盤モデル無償プランには申し込み数に上限があり、上限に達した場合は新規利用の受付を停止いたします。
- VOICEVOX提供モデルに関するライセンス表示および利用条件については、こちらをご確認ください。
- モーラとは、かな1字分の音の長さを表す単位です。
クローズドモデル料金
クローズドモデルは、提供元が商用利用を前提に提供するAIモデルです。モデル提供元の利用ポリシーに基づく審査・許諾が必要となるため、当社環境でのご利用には申請が必須となります。さくらのAI Engineのコントロールパネルより申請が可能です。
詳しくはマニュアルサイトをご確認ください。
| カテゴリー | 提供モデル・提供元 | 基盤モデル無償プラン | 従量課金プラン |
|---|---|---|---|
| Chat Completions | 提供モデル:PLaMo 2.0-31B 提供元:PFN |
対象外 | 詳しくはマニュアルサイトをご確認いただくか、個別にお問い合わせください。お問い合わせフォーム |
| 提供モデル:cotomi v3※ 提供元:NEC |
- cotomi:「cotomi」は、NECが開発した生成AIの名称です。ことばにより未来を示し、「こと」が「みのる」ように」という想いを込めており、生成AIを軸にお客様と伴走するパートナーでありたいとNECは考えています。(「cotomi」は、日本電気株式会社の登録商標です。)
パブリックプレビューモデル
| 提供モデル | 基盤モデル無償プラン | 従量課金プラン |
|---|---|---|
| Qwen3-0.6B-cpu (2025年10月9日〜) |
1ヶ月あたり 3,000リクエストまで |
|
| Phi-4-mini-instruct-cpu (2025年10月9日〜) |
|
|
| Qwen3-VL-30B-A3B-Instruct (2025年10月21日〜) |
|
|
| Phi-4-multimodal-instruct (2025年10月21日〜) |
|
|
| Qwen3-Embedding-4B(FP16) (2025年12月16日〜) |
1ヶ月あたり 10,000リクエストまで |
|
- パブリックプレビューモデルはユーザーの皆様に実際の利用環境での動作検証およびフィードバックの収集を目的とした提供となり、予告なく提供を終了する場合があります。提供期間中も安定性や応答品質について保証するものではなく、動作や仕様が変更となる可能性があります。パブリックプレビュー終了後、継続して提供する際には料金が変更になる場合があります。
ご利用の流れ
- STEP 1.
-
さくらインターネットの会員IDを作成
会員IDをお持ちでない方は、まずはじめに会員IDを作成します。
ご登録には電話番号が必要です。(電話番号認証を行います)すでにさくらインターネットの会員IDをお持ちの方はステップ2にお進みください。
さくらインターネットの会員IDを作成する(無料)
- STEP 2.
-
「さくらのクラウド」のプロジェクトを作成
会員IDを使ってコントロールパネルにログインした後、さくらのクラウドのプロジェクトを作成します。
- 「さくらのクラウド」をご利用いただく際にはクレジットカード登録が必要です。さくらインターネットの他のサービスでクレジットカードを登録されている場合、追加登録は不要です。
- すでに「さくらのクラウド」のプロジェクトをお持ちの方はステップ3にお進みください。
- STEP 3.
-
コントロールパネルからご利用開始
コントロールパネルにアクセスし、さくらのAI Engineをご利用ください。
さくらのクラウドのログイン画面へリダイレクトされます。
「さくらのAI Engine」コントロールパネルにアクセスする
STEP1、STEP2で取得したアカウント情報を入力し、ログインしてください。
さくらのAIに関する
個別のご相談・
お問い合わせもお待ちしております