さくらのAIサービス第一弾

さくらのAI Engine

基盤モデル搭載済みGPUサーバーで推論処理ができるAPIサービス

APIですぐ利用
サーバー構築・運用は不要
無料で使える
リクエスト制限内での
利用が無料
複数の基盤モデル
目的に応じたモデルを
選択できる
セキュアな国内完結
データが外部に出ない
安心基盤

ご利用いただけるLLM例

テキスト生成・分類・埋め込み・音声認識(whisper)に対応

  • Chat completions
  • Audio transcription
  • Embeddings
  • ドキュメント(RAG)
APIドキュメントを見る

料金

カテゴリー 提供モデル 基盤モデル無償プランリクエスト制限内での
利用が無料
従量課金プラン無償プランのリクエストを
超過した場合
Chat completions gpt-oss-120b 1ヶ月あたり
3,000リクエストまで
Input
0.15円 / 10,000トークン
Output
0.75円 / 10,000トークン
Qwen3-Coder-480B-A35B-Instruct-FP8
Input
0.3円/ 10,000トークン
Output
2.5円/ 10,000トークン
Qwen3-Coder-30B-A3B-Instruct
Input
0.15円 / 10,000トークン
Output
0.75円 / 10,000トークン
llm-jp-3.1-8x13b-instruct4
Input
0.15円 / 10,000トークン
Output
0.75円 / 10,000トークン
Audio transcription whisper-large-v3-turbo 1ヶ月あたり
50リクエストまで
0.5円 / 60秒
Embeddings multilingual-e5-large 1ヶ月あたり
10,000リクエストまで
Input
2円 / 10,000トークン
Output
無料
ドキュメント(RAG) 3円 / 100チャンク

表示価格は税込です。

  • 基盤モデル無償プランと従量課金プランは別プランとなります(自動的に従量課金プランに移行することはありません)。
  • 従量課金プランでも基盤モデル無償プランと同等の無償利用枠が存在します。ドキュメント(RAG)については無償利用枠はなく、両プランとも利用に応じて最小単位(100チャンク)ごとに料金が発生します。
  • 基盤モデル無償プランで無償利用枠を超過した場合、APIリクエストに対してレート制御がかかります。従量課金プランで無償利用枠を超過した場合、各基盤モデルの最小単位(10,000トークン/60秒)ごとに料金が発生します。
  • 基盤モデル無償プランには申し込み数に上限があり、上限に達した場合は新規利用の受付を停止いたします。

ご利用の流れ

STEP 1.

さくらインターネットの会員IDを作成

会員IDをお持ちでない方は、まずはじめに会員IDを作成します。
ご登録には電話番号が必要です。(電話番号認証を行います)
すでにさくらインターネットの会員IDをお持ちの方はステップ2にお進みください。

さくらインターネットの会員IDを作成する(無料)
STEP 2.

「さくらのクラウド」のプロジェクトを作成

会員IDを使ってコントロールパネルにログインした後、さくらのクラウドのプロジェクトを作成します。

  • 「さくらのクラウド」をご利用いただく際にはクレジットカード登録が必要です。さくらインターネットの他のサービスでクレジットカードを登録されている場合、追加登録は不要です。
  • すでに「さくらのクラウド」のプロジェクトをお持ちの方はステップ3にお進みください。
「さくらのクラウド」のプロジェクトを作成/ログインする
STEP 3.

コントロールパネルからご利用開始

コントロールパネルにアクセスし、さくらのAI Engineをご利用ください。

さくらのクラウドのログイン画面へリダイレクトされます。
STEP1、STEP2で取得したアカウント情報を入力し、ログインしてください。

「さくらのAI Engine」コントロールパネルにアクセスする

さくらのAIに関する
個別のご相談・
お問い合わせもお待ちしております

お問い合わせフォーム