マテリアルズインフォマティクス・材料
AIは本当に「新材料」を見つけたのか——効くところと、盛りすぎるところ
機械学習は、材料探しの「安いふるい」として候補を絞るのに効く。 では、その実力はどこまでか。近年の華々しい見出しを、冷静に検証してみよう。
ここ数年、「AIが材料を発見した」というニュースが立て続けに出た。そのたびに、専門家が中身を見にいき——多くが「実は新しくなかった」ことが分かってきた。これは、AIが材料探しで効く場所と盛りすぎる場所を、はっきり教えてくれる。
まず、言葉を分ける——「安定」≠「作れる」≠「役立つ」≠「新しい」
つまずきの根っこは、4つの別々のことを、つい一緒くたにしてしまうことだ。
「計算で安定そう(①)」は、ただの出発点だ。そこから「実際に作れる(②)」「役立つ性質を持つ(③)」「既知でなく本当に新しい(④)」までには、何段もの関門がある。 ところが見出しは、①の数を「新材料の数」として語ってしまう。この“すり替え”が、近年の3つの出来事すべての火種になった。
3つの実例——華々しい発表と、その後の検証
① グーグルDeepMindの「GNoME」(2023年) 深層学習で220万の結晶構造を予測し、うち約38万が安定と発表。人類が計算で知っていた安定材料をおよそ10倍に増やした、と[1]。 ——だが2024年、専門家(Cheetham & Seshadri)がChemistry of Materials誌で反論した。多くは「新規性・確からしさ・有用性」を欠き、既知の構造のありふれた元素置換にすぎないものが目立つ。安定の大半は、実は乱れた既知相の整然版ではないか、と[2]。
② バークレーの「A-Lab」(2023年) AIとロボットの自律実験室が、17日で58の標的のうち41の新化合物を合成した、とNatureに発表[3]。 ——直後から、ロバート・パルグレイブらが「X線データの解析が甘く、多くは既知の物質の取り違え」と公開で指摘。約3分の2は既知の乱れた相だった可能性が高い、と論文化された[4]。 最終的にNatureは訂正(Author Correction)を出した(2026年1月オンライン)。論文タイトルから「新規(novel)」の語を削り、訓練データに紛れていた1化合物(Zn₂Cr₃FeO₈)を除外。訂正後の記載は、当初の「58標的・41新化合物」を「57標的のうち36化合物」と書き改めている——報告された40件の成功のうち36件は正しく、4件はX線回折だけでは判定不能、というのが著者らの再解析の結論だ。ここで言う「新規」も「科学的に新しい」ではなく「予測プラットフォームにとって新しい」の意味だった、と著者自身が認めている。撤回ではなく訂正で、議論は今も完全には決着していない[4]。
③ マイクロソフトの「MatterGen」(2025年) 既存候補を“ふるう”のではなく、新しい結晶を生成する拡散モデル。実証として設計・合成された化合物 TaCr₂O₆ が話題になった[5]。 ——だが2026年、JuelsholtらがMaterials Horizons誌(査読付き)で、それは1970年代前半にすでに報告されていた乱れた相と本質的に同じで、MatterGen自身の訓練データにも入っていた——つまり「新発見」ではなく既知物質の言い換えだ、と指摘した[6]。
公平に——では、AIは役立たずなのか?
いや、それは違う。ここは正直に両論を置く。
機械学習は、既知の化学の“内側”で、性質を高速に見積もって候補を絞ること(=スクリーニングの“安いふるい”の段)には、実際に強い。GNoMEの予測のうち736件は独立に実験で確かめられたと報告されており、スクリーニングの加速そのものは本物だ[1]。
問題は、その強みが「内挿(interpolation)」——学んだデータの周辺をなめらかに埋めること——に偏っていることだ。 一方で見出しが期待させるのは「外挿(extrapolation)」——誰も見たことのない、本当に新しい化学へ大きく踏み出すことだ。ここでのAIの弱さは「まったくできない」という単純な話ではない。問題は、訓練データから遠ざかるほど、予測の確からしさがなめらかに落ちていくという性質にある。だから“新発見”ほど当たり外れが大きくなる。上で見たGNoMEやA-Labの“発見”が、検証の段で次々に既知物質へと差し戻されたのも、この「内挿は強いが、外挿で崩れる」性質が共通の根にある。
要するに——AIは、材料探しの速い“ふるい”としては本物だ。だが「発見者」と呼ぶには早い。「計算で安定」と「作って役立つ新材料」の間には、まだ人間の合成と検証が要る、深い谷がある。「派手な予測より、地味な検証」は、最先端の材料AIでも、そのまま当てはまる。
出典(すべて公開情報): [1] GNoME:Google DeepMind, "Scaling deep learning for materials discovery", Nature (2023年11月)。220万予測・約38万安定・計算既知のおよそ10倍、独立実験736件。 [2] GNoME批判:A. K. Cheetham & R. Seshadri, Chemistry of Materials (2024)——新規性・確からしさ・有用性の欠如、置換・乱れの問題。関連:Leeman et al., PRX Energy (2024)。 [3] A-Lab:N. J. Szymanski et al., "An autonomous laboratory…", Nature (2023年11月)。当初「17日・58標的・41新化合物」。 [4] A-Lab批判と訂正:Leeman, Palgrave, Schoop et al., PRX Energy (2024)。Nature の Author Correction(2026年1月オンライン/2月号、s41586-025-09992-y)で「新規」削除・36/40に修正・編集部注記。撤回ではなく訂正。 [5] MatterGen:Microsoft Research, "A generative model for inorganic materials design", Nature (2025年1月)。実証化合物 TaCr₂O₆。 [6] MatterGen批判:M. Juelsholt et al., Materials Horizons (RSC, 2026, 査読付き)——TaCr₂O₆は1970年代前半既知の乱れた相と同等で訓練データに存在。
この記事はAIが下書きし、人間が編集・公開しています。