マテリアルズインフォマティクス・材料

マテリアルインフォマティクスの難所はモデルではない

2026/7/4 （更新: 2026/7/26）

🤖 AIが執筆しています

「組成式を入れれば物性が予測できる」というデモを見て、材料開発が自動化されると思った人へ。技術的には嘘ではないが、現場で効く部分はそこではない。

本稿は材料の専門家ではないエンジニア向けに書く。だから、まず言葉を一つだけ揃える。ここで言うスタックとは、ある仕事を回すために積み重ねる道具立て——ライブラリやツールの組み合わせ——のことだ（Web 開発でいう「技術スタック」と同じ用法）。材料インフォマティクスでは、matminer・CrabNet・CGCNN といったオープンソースのライブラリ群がそれにあたる。誰でも無料で使え、論文やデモの多くはこの組み合わせで動いている。

以下では、このスタックが実際に何をしていて、どこで効き、どこで過大評価されるのかを、順に見ていく。結論を先に言えば——難所はモデルではない。

※ 概念図（フロー）・作図：AI。材料インフォマティクスのパイプライン。注目とデモ・論文リーダーボードが測るのは③モデルの部分だけで、そこは公開ベンチ（Materials Project など DFT 由来で密・整合・網羅）＝いちばん易しい。本当の難所は①データの量・一貫性・専有性、②特徴量化（表現）の選択、そして④予測を①へ戻す実験検証ループにあり、リーダーボードはそこを測らない。

スタックは何をしているか

中心は「物質をどう数値ベクトルにするか」だ。matminer はその特徴量化(featurization)ライブラリで、組成や結晶構造から原子半径・電気陰性度の統計量などを大量に生成する¹。automatminer はそれを自動でパイプライン化する。CrabNet は構造を使わず組成だけで予測するTransformerベースのモデルで、構造未知の探索初期に向く²。CGCNN³ や MEGNet⁴ は結晶構造をグラフ(原子=ノード、結合=エッジ)として扱うグラフニューラルネットで、構造が分かっていれば精度が上がることが多い（ただし組成のみのモデルが匹敵・凌駕する課題もある²）。

要するに、入力の表現方法が3段階(組成のみ/手作り特徴量/グラフ)あり、手元に何の情報があるかで選ぶ。モデルアーキテクチャ選びが結果に与える影響は、この表現の選択に比べれば小さい。

用語メモ：DFT・内挿と外挿（この先で使う）

DFT（密度汎関数理論）——量子力学に基づき、材料のエネルギーや安定性を実験なしに第一原理から計算する手法。物性を机上で見積もれるが計算コストが高い。Materials Project や OQMD のような公開データベースは、この DFT を大量に回して作られている＝整合的で密で網羅的、という性質を持つ。だから公開ベンチマークは「いちばん条件の揃った易しい土俵」になる。
内挿と外挿——既知データの範囲の内側を埋めるのが内挿、範囲の外側を当てにいくのが外挿。機械学習は内挿には強く、外挿には弱い。少数の自社データで未知の組成領域を狙う探索は本質的に外挿＝当たりにくい、というのがこの後の話の骨子だ。

効く場所と過大評価される場所

「任意の物性を予測」というデモは、たいてい Materials Project⁵ や OQMD⁶ のような公開ベンチマークで動いている。これらはDFT計算で生成された、整合的で密で広くカバーされたデータだ。ところが本稿が相手にするのは、その公開ベンチマークではなく自社の実験データで回す場面だ。そこでは手元にあるのはせいぜい数十〜数百件、測定条件はバラバラ、欠損だらけで、しかも一番効く組成領域は社外秘である。ベンチマークで0.9のR²を出すモデルが、自社データでは外挿になった瞬間に精度が大きく崩れうる。

MLが本当に効くのは、(1) 計算コストの高いDFTのサロゲートとして大量スクリーニングを回す場面、(2) すでにそこそこ均質なデータがある狭い系での内挿、そして(3) ベイズ最適化と組んで「次に作るべきサンプル」を提案する能動学習だ。逆に、小さく汚いデータからゼロショットで新物質を当てる、という期待は外挿の壁に阻まれる⁷。もう一つの壁は合成可能性だ——「安定だと予測できること」と「実際に合成できること」は別問題で、DFTで安定と出た候補が現実に作れるとは限らない。この判定は上のループの外側にあり、モデルの精度指標では捉えられない。

難所はモデルではなく、データの量・一貫性・専有性、特徴量化の選択、そして予測を実験で検証するループにある。論文のリーダーボードはそこを測っていない。

出典

matminer（特徴量化の OSS・pymatgen 連携）— Ward ら, Comput. Mater. Sci. 2018. https://doi.org/10.1016/j.commatsci.2018.05.018 ↩
CrabNet（組成のみの Transformer・28 ベンチで既存手法に匹敵〜凌駕）— Wang ら, npj Comput. Mater. 2021. https://doi.org/10.1038/s41524-021-00545-1 ↩ ↩²
CGCNN（結晶グラフ CNN）— Xie & Grossman, Phys. Rev. Lett. 2018. https://doi.org/10.1103/PhysRevLett.120.145301 ↩
MEGNet（分子・結晶の汎用グラフネット）— Chen ら, Chem. Mater. 2019. https://doi.org/10.1021/acs.chemmater.9b01294 ↩
Materials Project（DFT 由来の公開材料 DB）— Jain ら, APL Materials 2013. https://doi.org/10.1063/1.4812323 ↩
OQMD（20 万超の DFT 構造の公開 DB）— Saal ら, JOM 2013. https://doi.org/10.1007/s11837-013-0755-4 ↩
外挿では従来の精度指標が性能を過大評価する（LOCO-CV を提案。発見用途では反復実験が高スループット・スクリーニングを上回りうる）— Meredig ら, Mol. Syst. Des. Eng. 2018. https://doi.org/10.1039/C8ME00012C ↩

この記事はAIが執筆しています。内容には誤りが含まれる可能性があります。ご注意ください。