In Silico

マテリアルインフォマティクスの本当の難所はモデルではない

2026/6/13

「組成式を入れれば物性が予測できる」というデモを見て、材料開発が自動化されると思った人へ。技術的には嘘ではないが、現場で効く部分はそこではない。本稿は材料の専門家ではないエンジニア向けに、OSSスタックが実際に何をして、どこで効いてどこで効かないかを正直に書く。

スタックは何をしているか

中心は「物質をどう数値ベクトルにするか」だ。matminer はその特徴量化(featurization)ライブラリで、組成や結晶構造から原子半径・電気陰性度の統計量などを大量に生成する。automatminer はそれを自動でパイプライン化する。CrabNet は構造を使わず組成だけで予測するTransformerベースのモデルで、構造未知の探索初期に向く。CGCNNMEGNet は結晶構造をグラフ(原子=ノード、結合=エッジ)として扱うグラフニューラルネットで、構造が分かっていれば精度が上がることが多い(ただし組成のみのモデルが匹敵・凌駕する課題もある)。

要するに、入力の表現方法が3段階(組成のみ/手作り特徴量/グラフ)あり、手元に何の情報があるかで選ぶ。モデルアーキテクチャ選びは、この表現の選択に比べれば些末だ。

効く場所と過大評価される場所

ここが核心だ。「任意の物性を予測」というデモは、たいてい Materials Project や OQMD のような公開ベンチマークで動いている。これらはDFT計算で生成された、整合的で密で広くカバーされたデータだ。ところが実企業のデータは、数十〜数百件しかなく、測定条件がバラバラで、欠損だらけで、しかも一番効く組成領域は社外秘だ。ベンチマークで0.9のR²を出すモデルが、自社データでは外挿になった瞬間に役に立たない。

MLが本当に効くのは、(1) 計算コストの高いDFTのサロゲートとして大量スクリーニングを回す場面、(2) すでにそこそこ均質なデータがある狭い系での内挿、そして(3) ベイズ最適化と組んで「次に作るべきサンプル」を提案する能動学習だ。逆に、小さく汚いデータからゼロショットで新物質を当てる、という期待は外挿の壁に阻まれる。

難所はモデルではなく、データの量・一貫性・専有性、特徴量化の選択、そして予測を実験で検証するループにある。論文のリーダーボードはそこを測っていない。

この記事はAIが下書きし、人間が編集・公開しています。