220万個の新材料——いや、本当に?
シリーズ 「凸包(The Convex Hull)」 第3回。ここが山場です。第1回で「安定=DFTで計算した凸包より下」、第2回で「その判定をニューラルネットが高速に近似できる」と見ました。では——その高速なネットで、何百万個も『凸包より下』の材料を予測したら、その『下』は本当に『現実の新材料』を意味するのか?
桁違いの見出し
2023年、Google DeepMind の GNoME が Nature に発表されました(Merchant ら「Scaling deep learning for materials discovery」)。数字は圧倒的です:
- 220万個の新結晶を予測。
- うち 38万個を「最も安定」=合成候補と判定。
- これにより「人類が知る安定材料」を、従来のおよそ2万個から42万1千個へ——約20倍に拡大した、と。「800年分の知識に相当する」とも語られました。
報道は当然沸きました。「AIが材料科学を解いた」。第1回・第2回を読んだあなたなら、ここで一歩立ち止まれます。この220万という数字は、何に対する数字なのか。
数字は、漏斗(ファネル)を降りるたびに縮む
第1回の結論を思い出してください。「凸包より下」は「DFT が計算した基準面より下」という意味であって、「ビーカーの中で本当に結晶になる」とイコールではありません。だから、予測から現実へ向かって漏斗を降りると、数字は劇的に縮みます:
- 220万個 … モデルが予測した結晶。
- 38万個 … モデルの計算した凸包より下=「最も安定」。
- 736個 … そのうち、世界中の研究室が独立に実際に作っていた(=予測が現実と一致した検証例)構造の数。
- 41個 … 自律実験ラボ(A-Lab、第5回で扱います)が新たに合成した数。
220万から736へ。派手な見出しの数字は、「本当に存在する」に近づくほど、桁が落ちていく。 これがこのシリーズの背骨——律速は一番目立つ部分でなく、その下にある——の、もっとも鮮烈な実例です。「凸包より下にある」と「現実に作れて役に立つ新材料である」の間には、深い谷がある。
念のため公正に言えば、GNoME のスケーリング自体は本物で、巨大な貢献です。736個の独立検証も立派な数字です。問題は「達成」ではなく、見出しの数字をそのまま『新材料の数』と読んでしまう読み方の側にあります。
称賛され、そして精査された
だからこそ、この発表は称賛と同時に、専門家の精査を受けました。材料化学の大家 Anthony Cheetham と Ram Seshadri は、Chemistry of Materials 誌(2024)に批判的な論考を発表し、「凸包より下にある構造の数」と「新規で・信頼でき・役に立つ材料の数」は別物だという、まさにこの谷を問題にしました。
ここで大事なのは、これを「AIの敗北」と片付けないことです。DeepMind のスケーリング結果と、化学者たちの慎重さは、別々のことについて両方とも正しい。 一方は「DFTという基準で、これだけ多くの候補を高速に拾えた」と言い、もう一方は「その候補が、現実に・新しく・有用に結晶化するかは、また別の測定問題だ」と言っている。この二つを混同しないことが、世界トップレベルの読み方です。そして——どちらが正しいかを決めたのはベンチマークではなく、中身を見にいった人間の専門家でした。
まとめ、そして次回
第3回の核心。**「AIが220万個の新材料を発見」は、煎じ詰めると「あるモデルが、DFTで計算した凸包より下に220万点を予測した」**ということ。その数字は、合成・検証という現実の測定へ降りるたびに縮む(220万→38万→736)。価値と難所は、予測の数でなく、その下の基準(本当にDFTは正しいか)と、その先の現実(本当に作れるか)にある。
ここまではすべて in silico——DFTとニューラルネットの中の話でした。次回(第4回)は、身体を持つAIの話です。ロボティクスの世界が、同じ賭けを「フィジカルAI」という新しい看板で繰り返しています。シミュレータの中で完璧に動く方策が、現実の床で転ぶ——あの sim2real のギャップは、実は今回の「凸包より下 ≠ 現実」と、まったく同じ構造の問題です。
この記事はAIが下書きし、人間が編集・公開しています。