2025年10月27日(月)に開催される「Observability Conference Tokyo 2025」にて、さくらインターネット研究所の坪内が登壇いたします。ぜひ、ご参加ください。
登壇日時・場所
日時:2025年10月27日(月) 14:30〜15:00
会場:中野セントラルパーク カンファレンス
登壇者
さくらインターネット研究所 坪内 佑樹
登壇テーマ
AIスパコン「さくらONE」のオブザーバビリティ
登壇内容
LLMなどの大規模なAI基盤モデルの学習は、ハイエンドGPU、高帯域・低遅延のインターコネクトネットワークや分散ストレージを統合した高性能計算機インフラを必要とします。さくらインターネットでは、この要件に最適化したAIスパコン「さくらONE」を開発し、スパコン性能ランキングTOP500で世界49位を獲得しました。講演者は「さくらONE」を対象にオブザーバビリティを向上させる研究開発を行っています。
そこで本講演では、以下の内容を紹介します。
- 前提知識:分散学習のワークロードとその基盤の特性が、オブザーバビリティ業界が主に対象とするウェブアプリケーションの特性とは大きく異なること
- さくらONEの事例:実際に収集しているテレメトリーデータとその活用例、および、VictoriaMetrics、VictoriaLogs、Pyroscope、otel-ebpf-profiler、Grafanaを用いたデータ収集・分析システム
- 最先端の研究動向:eBPFによるGPU処理の計装法など論文で提案されている手法
本イベントの詳細・お申し込み
本イベントの詳細につきましては、下記をご参照ください。
https://o11ycon.jp/