デジタルインフラサービスを提供するさくらインターネット株式会社(本社:大阪府大阪市、代表取締役社長:田中 邦裕、以下「さくらインターネット」)の組織内研究所「さくらインターネット研究所」に所属する研究員の論文が、AIおよび機械学習分野の世界的な国際会議「Neural Information Processing Systems(NeurIPS)2025」に併催されるワークショップ「AI for Accelerated Materials Discovery(AI4Mat)Workshop」に採択されました。
本論文は、米国カリフォルニア州サンディエゴにて、現地時間2025年12月6日(土)に発表を行います。

研究の概要
さくらインターネット研究所は、科学論文から材料の合成手順を抽出し、材料・操作・条件のつながりを有向グラフで表現可能な新たなデータセット「MatPROV」を公開しました。本データセットの新規性と有用性が評価され、研究論文採択にいたりました。
研究の背景と目的
さくらインターネット研究所では、研究データの管理、分析および共有を効率化する「ラボ・インフォマティクス」分野の研究開発を進めています。特に、科学的発見のプロセスを加速することを目的に、電子実験ノートプラットフォームの開発に取り組んでいます。電子実験ノートでは、実験手順を正確かつ体系的に記録することが極めて重要です。
今回採択された研究論文では、この課題に対して以下の2点を中心に取り組みました。
- 実験手順を構造化データとして記録するための最適な表現形式の研究
- 自然言語で記述された実験手順を自動的に構造化データへ変換するための大規模言語モデル(LLM)の活用
研究対象には材料科学を選定しました。材料の合成手順は成果物の性質に大きな影響を与えることが広く知られており、実験手順のデータ化の有効性を検証する題材として適しているからです。しかし従来の研究では、合成手順の表現にあたって事前に構造が定義された限定的なスキーマに依存していたため、現実世界の材料合成手順に見られる操作の分岐や合流などの複雑さを十分に表現できないという課題がありました。
研究の特長と成果
この課題を解決するため、さくらインターネット研究所は、手順や因果関係を柔軟に表現できる来歴情報の国際標準「PROV-DM(Provenance Data Model)」を採用しました。さらに、LLMを用いて科学論文から合成手順を抽出し、PROV-DMに準拠した独自のデータセット「MatPROV」を構築しました。
「MatPROV」は、材料・操作・条件の関係性を直感的に理解できる有向グラフとして表現しており、AIによる自動合成計画やプロセス最適化など、今後の研究に広く活用できる基盤となります。
本研究の成果は、AIを活用した材料探索に新たな可能性をもたらし、持続可能な材料開発の加速に貢献することが期待されます。さらに、この研究で得られた知見は、電子実験ノートにおける実験手順の記録・構造化を高度化する基盤技術としても応用可能であり、研究現場におけるデータ管理と活用の新たな展開につながります。
さくらインターネット研究所は、今後も社会にとって有用で新しいインターネットインフラを実現するための研究開発に努めてまいります。
採択された論文について
タイトル
MatPROV: A Provenance Graph Dataset of Material Synthesis Extracted from Scientific Literature
Hirofumi Tsuruta (SAKURA internet Inc.), Masaya Kumagai (SAKURA internet Inc., Kyoto University)
(和訳)
MatPROV: 科学文献から抽出された材料合成の来歴グラフデータセット
鶴田 博文(さくらインターネット株式会社)、熊谷 将也(さくらインターネット株式会社、京都大学)
論文
https://arxiv.org/abs/2509.01042
公開データセット
https://huggingface.co/datasets/MatPROV-project/MatPROV
概要

研究の概要図
材料研究において合成手順は、材料の特性に直接的な影響を及ぼす重要な要素です。近年、データ駆動型アプローチが材料発見を加速させる中で、科学文献から合成手順を構造化データとして抽出することへの関心が高まっています。
一方で既存の研究の多くは、あらかじめ定義された項目を持つ特定の材料向けのスキーマに依存したり、合成手順を操作の線形な並びとして仮定したりしており、現実世界の合成手順が有する構造的な複雑さを十分に捉えられていません。
こうした制約に対処するため、さくらインターネット研究所は合成手順の表現方法として、来歴情報の国際標準であるPROV-DMを採用し、手順を有向グラフとして柔軟に表現できるようにしました。
本研究では、LLMを用いて科学論文から抽出した、PROV-DM準拠の合成手順データセット「MatPROV」を提案します。MatPROVは、材料・操作・条件の間に存在する構造的な複雑性や因果関係を直感的に理解しやすい有向グラフで表現します。この表現により、機械が直接扱える形に整理された合成関連の知識が得られ、自動合成計画や合成プロセス最適化など、今後の研究に新たな展開が期待されます。
「NeurIPS 2025 AI4Mat Workshop」での発表について
「NeurIPS」について
「NeurIPS」は、1987年に設立されたAIおよび機械学習分野の国際会議であり、投稿件数の多さと厳格な査読プロセスによる低い採択率から、世界的に権威のある会議の一つとされています。本会議では、深層学習、強化学習、コンピュータビジョン、自然言語処理、さらには様々な分野の応用研究など、AIと機械学習の広範な領域における最先端の研究成果が発表されています。
本会議の第39回目となる「NeurIPS 2025」は、2025年12月に米国で開催されます。
「AI4Mat Workshop」について
「AI4Mat Workshop」は、材料科学とAIの研究者が、AIによる材料発見の最前線を切り開く課題や成果を議論および共有する場として、2022年に発足したワークショップです。
日時・場所
日時:2025年12月6日(土)
場所:米国カリフォルニア州サンディエゴ San Diego Convention Center
発表者
さくらインターネット研究所 鶴田 博文
詳細
下記ウェブサイトをご参照ください。
https://neurips.cc/Conferences/2025
参考
さくらインターネットとCOGNANOのAI創薬に関する共同研究論文が、世界最高峰のAI国際会議「NeurIPS 2024」に採択(2024年9月30日公開)
https://www.sakura.ad.jp/corporate/information/newsreleases/2024/09/30/1968217266/
さくらインターネット株式会社について
代表者:代表取締役社長 田中 邦裕
本 社:大阪府⼤阪市北区⼤深町6番38号 グラングリーン⼤阪 北館 JAM BASE 3階
創 業:1996年12月23日
設 立:1999年8月17日
URL :https://www.sakura.ad.jp/corporate/
この件に関する報道関係者からのお問い合わせ先
さくらインターネット株式会社 広報担当
問い合わせフォーム:https://sakura.f-form.com/sakurapr
※本内容は発表時点の情報です。その後、予告せず変更となる場合があります。
※記載されている会社名、製品名は、各社の商標、もしくは登録商標です。