In Silico

原子のための基盤モデル——ニューラルネットに「力」を覚えさせる

2026/6/18

シリーズ 「凸包(The Convex Hull)」 第2回。第1回では、ある結晶が「安定」とは、DFT で計算した凸包(競合する全配置の下側境界)より下にあることだと見ました。問題は——DFT は正確だが、遅い。1つの結晶を解くのに大きな計算機で数分から数時間かかります。何百万もの候補をふるいにかけるには、絶望的に遅い。

今回は、その壁を破ったモデルの話です。

結晶は「グラフ」である

ニューラルネットに材料を読ませる、と聞くと難しそうですが、表現は素直です。結晶をグラフとして扱う——原子をノード、近くにある原子どうしの関係をエッジにする。すると、画像でも文章でもなく「グラフ上の予測問題」になります。

ネットに何を予測させるか。エネルギーと、各原子にかかる力です。

ここが肝心です。エネルギーだけでなく(=各原子がどちらへ動きたいか)を出せると、ネットは単なる電卓ではなく、原子を実際に動かして構造を緩和できるようになります。物理では、力はエネルギーの傾き(勾配)です。だからエネルギーの地形を学んだネットは、その地形の傾きから力を読み取り、原子を谷へ転がせる。こうして「DFT を高速に近似する道具」=機械学習原子間ポテンシャル(MLIP) が生まれます。速度はおおむね DFT の千〜一万倍。ふるい分けには、これで十分です。

「原子のための基盤モデル」——LLMと同じ手口

2022年以降の本当の転換は、ここからです。

昔は、材料ごと・系ごとに専用のポテンシャルを作っていました。新しい転換は——周期表の広い範囲を1つのネットでカバーする「普遍ポテンシャル」を、巨大なDFTデータで事前学習すること。これは、あなたがLLMで知っている手口そのものです。大きな固定コーパスで事前学習し、未知へ汎化させ、そして分布シフトを心配する。違うのは中身が言語でなく原子だという点だけ。

具体例を挙げます(すべて実在の研究):

LLMの読者なら、ここで「あ、これ同じ構造の話だ」と気づくはずです。固定された参照コーパスで事前学習した基盤モデル、汎化と分布シフトの同じ問い——アーキテクチャ(グラフニューラルネット)も認識論もLLMと地続きです。神経科学の直観で言えば、オフラインで訓練したデコーダがオンラインで劣化する、あの現象の三度目の再演です。

ただし——罠もLLMと同じ

ここで背骨に戻ります。DFT の答えを完璧に当てるモデルは、シミュレータを学んだのであって、現実を学んだのではありません。

機械学習ポテンシャルが学ぶ「正解」は、第1回で見たとおり DFT が計算した値です。だからモデルは、訓練した参照(DFT)の良さ以上には正確になれない。参照が外す領域(バンドギャップや強相関系)では、どれだけ精度よくDFTを再現しても、現実とはずれます。「モデルがDFTと一致した」は「現実と一致した」ではない——この一段を飛ばすと、speed の数字に酔って、何を達成したのか見失います。

もう一つ、正直な但し書き。万能の勝者はいません。形成エネルギーが得意なポテンシャル、緩和後の構造が得意なポテンシャルは別だったりします。速いネットは**トリアージ(ふるい分け)**であって最終判定ではない。最後はやはりDFTが、そして究極的には実験が確かめます。

まとめ、そして次回

第2回の要点。結晶をグラフとして読み、エネルギーと力を予測する基盤モデルが、DFTを千〜一万倍速く近似し、何百万もの候補をふるえるようになった。手口はLLMと同じ(事前学習・汎化・分布シフト)、そして罠も同じ(参照を学んだだけで現実ではない)。

ここで自然な疑問が立ちます。これだけ高速にふるえるなら——何百万個も「凸包より下」の材料を予測できるなら、その「下」は本当に「現実の新材料」を意味するのか? 第3回は、このシリーズの山場です。2023年、ある研究が「人類が知る安定材料を一桁増やした、220万個」と発表しました。そして材料化学者たちが、実際に中身を見にいった。何が見つかったか——次回に。


この記事はAIが下書きし、人間が編集・公開しています。