マテリアルズインフォマティクス・材料

AIは本当に「新材料」を見つけたのか——効くところと、盛りすぎるところ

2026/6/21 （更新: 2026/6/21）シリーズ「コンピュータで材料を探す」第3回 / 全3回

🤖 AIが下書き・人間が編集

機械学習は、材料探しの「安いふるい」として候補を絞るのに効く。では、その実力はどこまでか。近年の華々しい見出しを、冷静に検証してみよう。

ここ数年、「AIが材料を発見した」というニュースが立て続けに出た。そのたびに、専門家が中身を見にいき——多くが「実は新しくなかった」ことが分かってきた。これは、AIが材料探しで効く場所と盛りすぎる場所を、はっきり教えてくれる。

まず、言葉を分ける——「安定」≠「作れる」≠「役立つ」≠「新しい」

つまずきの根っこは、4つの別々のことを、つい一緒くたにしてしまうことだ。

「計算で安定」は出発点にすぎない。「作れる」「役立つ」「本当に新しい」は、それぞれ別の、ずっと厳しい関門だ。

「計算で安定そう（①）」は、ただの出発点だ。そこから「実際に作れる（②）」「役立つ性質を持つ（③）」「既知でなく本当に新しい（④）」までには、何段もの関門がある。ところが見出しは、①の数を「新材料の数」として語ってしまう。この“すり替え”が、近年の3つの出来事すべての火種になった。

3つの実例——華々しい発表と、その後の検証

① グーグルDeepMindの「GNoME」（2023年） 深層学習で220万の結晶構造を予測し、うち約38万が安定と発表。人類が計算で知っていた安定材料をおよそ10倍に増やした、と^[1]。 ——だが2024年、専門家（Cheetham & Seshadri）がChemistry of Materials誌で反論した。多くは「新規性・確からしさ・有用性」を欠き、既知の構造のありふれた元素置換にすぎないものが目立つ。安定の大半は、実は乱れた既知相の整然版ではないか、と^[2]。

② バークレーの「A-Lab」（2023年） AIとロボットの自律実験室が、17日で58の標的のうち41の新化合物を合成した、とNatureに発表^[3]。 ——直後から、ロバート・パルグレイブらが「X線データの解析が甘く、多くは既知の物質の取り違え」と公開で指摘。約3分の2は既知の乱れた相だった可能性が高い、と論文化された^[4]。最終的にNatureは訂正（Author Correction）を出した（2026年1月オンライン）。論文タイトルから「新規（novel）」の語を削り、訓練データに紛れていた1化合物（Zn₂Cr₃FeO₈）を除外。訂正後の記載は、当初の「58標的・41新化合物」を「57標的のうち36化合物」と書き改めている——報告された40件の成功のうち36件は正しく、4件はX線回折だけでは判定不能、というのが著者らの再解析の結論だ。ここで言う「新規」も「科学的に新しい」ではなく「予測プラットフォームにとって新しい」の意味だった、と著者自身が認めている。撤回ではなく訂正で、議論は今も完全には決着していない^[4]。

③ マイクロソフトの「MatterGen」（2025年） 既存候補を“ふるう”のではなく、新しい結晶を生成する拡散モデル。実証として設計・合成された化合物 TaCr₂O₆ が話題になった^[5]。 ——だが2026年、JuelsholtらがMaterials Horizons誌（査読付き）で、それは1970年代前半にすでに報告されていた乱れた相と本質的に同じで、MatterGen自身の訓練データにも入っていた——つまり「新発見」ではなく既知物質の言い換えだ、と指摘した^[6]。

公平に——では、AIは役立たずなのか？

いや、それは違う。ここは正直に両論を置く。

機械学習は、既知の化学の“内側”で、性質を高速に見積もって候補を絞ること（＝スクリーニングの“安いふるい”の段）には、実際に強い。GNoMEの予測のうち736件は独立に実験で確かめられたと報告されており、スクリーニングの加速そのものは本物だ^[1]。

問題は、その強みが「内挿（interpolation）」——学んだデータの周辺をなめらかに埋めること——に偏っていることだ。一方で見出しが期待させるのは「外挿（extrapolation）」——誰も見たことのない、本当に新しい化学へ大きく踏み出すことだ。ここでのAIの弱さは「まったくできない」という単純な話ではない。問題は、訓練データから遠ざかるほど、予測の確からしさがなめらかに落ちていくという性質にある。だから“新発見”ほど当たり外れが大きくなる。上で見たGNoMEやA-Labの“発見”が、検証の段で次々に既知物質へと差し戻されたのも、この「内挿は強いが、外挿で崩れる」性質が共通の根にある。

要するに——AIは、材料探しの速い“ふるい”としては本物だ。だが「発見者」と呼ぶには早い。「計算で安定」と「作って役立つ新材料」の間には、まだ人間の合成と検証が要る、深い谷がある。「派手な予測より、地味な検証」は、最先端の材料AIでも、そのまま当てはまる。

出典（すべて公開情報）： [1] GNoME：Google DeepMind, "Scaling deep learning for materials discovery", Nature (2023年11月)。220万予測・約38万安定・計算既知のおよそ10倍、独立実験736件。 [2] GNoME批判：A. K. Cheetham & R. Seshadri, Chemistry of Materials (2024)——新規性・確からしさ・有用性の欠如、置換・乱れの問題。関連：Leeman et al., PRX Energy (2024)。 [3] A-Lab：N. J. Szymanski et al., "An autonomous laboratory…", Nature (2023年11月)。当初「17日・58標的・41新化合物」。 [4] A-Lab批判と訂正：Leeman, Palgrave, Schoop et al., PRX Energy (2024)。Nature の Author Correction（2026年1月オンライン／2月号、s41586-025-09992-y）で「新規」削除・36/40に修正・編集部注記。撤回ではなく訂正。 [5] MatterGen：Microsoft Research, "A generative model for inorganic materials design", Nature (2025年1月)。実証化合物 TaCr₂O₆。 [6] MatterGen批判：M. Juelsholt et al., Materials Horizons (RSC, 2026, 査読付き)——TaCr₂O₆は1970年代前半既知の乱れた相と同等で訓練データに存在。

この記事はAIが下書きし、人間が編集・公開しています。