In Silico

AI・信頼性・評価

「AIエージェント」とは何か——考えて、道具を使って、また考える“ループ”

2026/6/21 (更新: 2026/6/21) シリーズ「AIエージェントは、実際どう動くのか」 第1回 / 全5回

「AIエージェント」という言葉を、最近よく聞くようになった。 チャットAIに質問すれば答えが返ってくる——それは、もう驚かない。では「エージェント」は何が違うのだろうか。

このシリーズは、その中身を、実践と研究の両面から、忖度なく見ていく。第1回は、いちばんの土台=「エージェントとは何か」である。

まず、LLM単体は「言葉の続きを予測する機械」

土台を確認する。ChatGPTのようなAIの中身は LLM(大規模言語モデル:大量の文章で訓練され、次に来る言葉を確率で予測するAI) である。 LLMは、ものすごく流暢に文章を続けられる。でも、それ「だけ」では——自分では何もできない。ウェブを検索できない。計算を実行できない。書いたコードを走らせて結果を確かめられない。学習した時点の知識で止まっていて、今日の天気も知らない。

つまり、LLM単体は「考える(っぽいことを言う)」ことはできても、「行動して、確かめる」ことができないのである。

エージェント=LLMを「ループ」と「道具」で包んだもの

ここを埋めるのが「エージェント」である。発想は驚くほど素直で、LLMをループの中に置き、道具(ツール)を持たせる。

考える → 道具を使う(行動)→ 結果を観察する → また考える → …(目的を達するまで繰り返す)

人が問題を解くときと同じである。頭の中だけで完結させず、調べて、試して、結果を見て、修正する。エージェントとは、LLMにこの「行ったり来たり」をさせる仕組みなのである。

鍵になった研究:「考える」と「動く」を交互に——ReAct

この「考えながら動く」を明確に形にしたのが、ReAct(Yao ら、2022年公開・ICLR 2023採択)という研究である1。 やり方はこうだ——LLMに、思考(Thought)→ 行動(Action)→ 観察(Observation) を交互に出力させる。

例えば「Aさんが受賞した賞の、前年の受賞者は誰?」を解くとき:

ReActが示した大事な点は、「考えるだけ」より「考えながら動く」方が、嘘(ハルシネーション)や誤りの積み重なりが減ることだった1。頭の中だけで推論を続けると、AIは事実をでっち上げがちである。でも途中で外の世界に問い合わせて答え合わせをすれば、軌道修正できる。これは「生成より検証」という考え方と、まさに地続きである。

なぜ「道具」がそんなに効くのか

道具の本質は、LLMの“凍りついた頭”の外に出られることにある2。 モデルの知識は訓練時点で固定され、あとから簡単には変えられない。でも、検索という道具があれば今の情報にアクセスでき、計算機があれば正確な計算ができ、コード実行があれば本当に動くか確かめられる。道具は、賢さの“量”ではなく“種類”を増やすのである。

(なお、「エージェント=LLM+計画+記憶+道具」という整理は、Lilian Weng の有名な解説3で広まったものである。ただし——これは出典の主張ではなく筆者の補足だが——「エージェント」に厳密な学術的定義があるわけではなく、ゆるやかな共通理解にとどまる、という点も正直に添えておく。)

……ただし、ここに落とし穴もある

ループと道具で、LLMは「行動できるAI」になった。デモを見ると、まるで万能の助手のようである。 だが——ここから先が、このシリーズの本当のテーマである。考える→動く→観察するを何十回も繰り返すと、各ステップのわずかな失敗が、掛け算で積み重なっていく。デモは華々しいのに、実用ではもろい。なぜそうなるのかは、第4回で数字とともに、忖度なく掘る。

次回(第2回)は、このループの“外側”——「ハーネス」の話である。実は、モデル本体の賢さより、その周りの足場(道具・記憶・文脈管理)の作り方が、エージェントの出来を大きく左右する。


出典

  1. ReAct: S. Yao et al., “ReAct: Synergizing Reasoning and Acting in Language Models”, arXiv:2210.03629 (2022, ICLR 2023)。思考・行動・観察を交互に行うことで、推論のみの場合のハルシネーション・誤りの伝播を減らせると報告。 https://arxiv.org/abs/2210.03629 2

  2. Toolformer: T. Schick et al., “Toolformer: Language Models Can Teach Themselves to Use Tools”, arXiv:2302.04761 (Meta, 2023)。道具は、訓練後は変えにくいモデルの重みの外側にある情報・計算能力を補う。 https://arxiv.org/abs/2302.04761

  3. エージェント=LLM+計画+記憶+道具という整理:Lilian Weng, “LLM Powered Autonomous Agents”, Lil’Log (2023)。この三要素の枠組みを広めた解説。(「エージェントに厳密な学術的定義はない」は本文筆者の補足であり、同記事の主張ではない。) https://lilianweng.github.io/posts/2023-06-23-agent/

この記事はAIが下書きし、人間が編集・公開しています。