さくらのAIサービス第一弾
さくらのAI Engine
基盤モデル搭載済みGPUサーバーで推論処理ができるAPIサービス
- APIですぐ利用
- サーバー構築・運用は不要
- 無料で使える
- リクエスト制限内での
利用が無料
- 複数の基盤モデル
- 目的に応じたモデルを
選択できる
- セキュアな国内完結
- データが外部に出ない
安心基盤
ご利用いただけるLLM例
テキスト生成・分類・埋め込み・音声認識(whisper)に対応
- Chat completions
- Audio transcription
- Embeddings
- ドキュメント(RAG)
料金
カテゴリー | 提供モデル | 基盤モデル無償プランリクエスト制限内での 利用が無料 |
従量課金プラン無償プランのリクエストを 超過した場合 |
---|---|---|---|
Chat completions | gpt-oss-120b | 1ヶ月あたり 3,000リクエストまで |
|
Qwen3-Coder-480B-A35B-Instruct-FP8 |
|
||
Qwen3-Coder-30B-A3B-Instruct |
|
||
llm-jp-3.1-8x13b-instruct4 |
|
||
Audio transcription | whisper-large-v3-turbo | 1ヶ月あたり 50リクエストまで |
0.5円 / 60秒 |
Embeddings | multilingual-e5-large | 1ヶ月あたり 10,000リクエストまで |
|
ドキュメント(RAG) | 3円 / 100チャンク |
表示価格は税込です。
- 基盤モデル無償プランと従量課金プランは別プランとなります(自動的に従量課金プランに移行することはありません)。
- 従量課金プランでも基盤モデル無償プランと同等の無償利用枠が存在します。ドキュメント(RAG)については無償利用枠はなく、両プランとも利用に応じて最小単位(100チャンク)ごとに料金が発生します。
- 基盤モデル無償プランで無償利用枠を超過した場合、APIリクエストに対してレート制御がかかります。従量課金プランで無償利用枠を超過した場合、各基盤モデルの最小単位(10,000トークン/60秒)ごとに料金が発生します。
- 基盤モデル無償プランには申し込み数に上限があり、上限に達した場合は新規利用の受付を停止いたします。
ご利用の流れ
- STEP 1.
-
さくらインターネットの会員IDを作成
会員IDをお持ちでない方は、まずはじめに会員IDを作成します。
さくらインターネットの会員IDを作成する(無料)
ご登録には電話番号が必要です。(電話番号認証を行います)
すでにさくらインターネットの会員IDをお持ちの方はステップ2にお進みください。
- STEP 2.
-
「さくらのクラウド」のプロジェクトを作成
会員IDを使ってコントロールパネルにログインした後、さくらのクラウドのプロジェクトを作成します。
- 「さくらのクラウド」をご利用いただく際にはクレジットカード登録が必要です。さくらインターネットの他のサービスでクレジットカードを登録されている場合、追加登録は不要です。
- すでに「さくらのクラウド」のプロジェクトをお持ちの方はステップ3にお進みください。
- STEP 3.
-
コントロールパネルからご利用開始
コントロールパネルにアクセスし、さくらのAI Engineをご利用ください。
さくらのクラウドのログイン画面へリダイレクトされます。
「さくらのAI Engine」コントロールパネルにアクセスする
STEP1、STEP2で取得したアカウント情報を入力し、ログインしてください。
さくらのAIに関する
個別のご相談・
お問い合わせもお待ちしております