AI・信頼性・評価

「AIエージェント」とは何か——考えて、道具を使って、また考える“ループ”

2026/6/21 （更新: 2026/6/21）シリーズ「AIエージェントは、実際どう動くのか」第1回 / 全5回

🤖 AIが下書き・人間が編集

「AIエージェント」という言葉を、最近よく聞くようになった。チャットAIに質問すれば答えが返ってくる——それは、もう驚かない。では「エージェント」は何が違うのだろうか。

このシリーズは、その中身を、実践と研究の両面から、忖度なく見ていく。第1回は、いちばんの土台＝「エージェントとは何か」である。

まず、LLM単体は「言葉の続きを予測する機械」

土台を確認する。ChatGPTのようなAIの中身は LLM（大規模言語モデル：大量の文章で訓練され、次に来る言葉を確率で予測するAI） である。 LLMは、ものすごく流暢に文章を続けられる。でも、それ「だけ」では——自分では何もできない。ウェブを検索できない。計算を実行できない。書いたコードを走らせて結果を確かめられない。学習した時点の知識で止まっていて、今日の天気も知らない。

つまり、LLM単体は「考える（っぽいことを言う）」ことはできても、「行動して、確かめる」ことができないのである。

エージェント＝LLMを「ループ」と「道具」で包んだもの

ここを埋めるのが「エージェント」である。発想は驚くほど素直で、LLMをループの中に置き、道具（ツール）を持たせる。

考える → 道具を使う（行動）→ 結果を観察する → また考える → …（目的を達するまで繰り返す）

道具（ツール） とは、LLMの外にある機能のこと——ウェブ検索、計算機、コードの実行、データベース、ファイルの読み書きなど。
LLMは毎回、「次に何をすべきか」を考え、道具を呼び出して行動し、返ってきた結果を見て、次の一手を考え直す。

人が問題を解くときと同じである。頭の中だけで完結させず、調べて、試して、結果を見て、修正する。エージェントとは、LLMにこの「行ったり来たり」をさせる仕組みなのである。

鍵になった研究：「考える」と「動く」を交互に——ReAct

この「考えながら動く」を明確に形にしたのが、ReAct（Yao ら、2022年公開・ICLR 2023採択）という研究である¹。やり方はこうだ——LLMに、思考（Thought）→ 行動（Action）→ 観察（Observation） を交互に出力させる。

例えば「Aさんが受賞した賞の、前年の受賞者は誰？」を解くとき：

思考：まずAさんの受賞した賞を調べる必要がある
行動：検索「Aさん受賞賞」
観察：（検索結果）……賞はX
思考：次にXの前年の受賞者を調べる
行動：検索「X 前年受賞者」……

ReActが示した大事な点は、「考えるだけ」より「考えながら動く」方が、嘘（ハルシネーション）や誤りの積み重なりが減ることだった¹。頭の中だけで推論を続けると、AIは事実をでっち上げがちである。でも途中で外の世界に問い合わせて答え合わせをすれば、軌道修正できる。これは「生成より検証」という考え方と、まさに地続きである。

なぜ「道具」がそんなに効くのか

道具の本質は、LLMの“凍りついた頭”の外に出られることにある²。モデルの知識は訓練時点で固定され、あとから簡単には変えられない。でも、検索という道具があれば今の情報にアクセスでき、計算機があれば正確な計算ができ、コード実行があれば本当に動くか確かめられる。道具は、賢さの“量”ではなく“種類”を増やすのである。

（なお、「エージェント＝LLM＋計画＋記憶＋道具」という整理は、Lilian Weng の有名な解説³で広まったものである。ただし——これは出典の主張ではなく筆者の補足だが——「エージェント」に厳密な学術的定義があるわけではなく、ゆるやかな共通理解にとどまる、という点も正直に添えておく。）

……ただし、ここに落とし穴もある

ループと道具で、LLMは「行動できるAI」になった。デモを見ると、まるで万能の助手のようである。だが——ここから先が、このシリーズの本当のテーマである。考える→動く→観察するを何十回も繰り返すと、各ステップのわずかな失敗が、掛け算で積み重なっていく。デモは華々しいのに、実用ではもろい。なぜそうなるのかは、第4回で数字とともに、忖度なく掘る。

次回（第2回）は、このループの“外側”——「ハーネス」の話である。実は、モデル本体の賢さより、その周りの足場（道具・記憶・文脈管理）の作り方が、エージェントの出来を大きく左右する。

出典

ReAct: S. Yao et al., “ReAct: Synergizing Reasoning and Acting in Language Models”, arXiv:2210.03629 (2022, ICLR 2023)。思考・行動・観察を交互に行うことで、推論のみの場合のハルシネーション・誤りの伝播を減らせると報告。 https://arxiv.org/abs/2210.03629 ↩ ↩²
Toolformer: T. Schick et al., “Toolformer: Language Models Can Teach Themselves to Use Tools”, arXiv:2302.04761 (Meta, 2023)。道具は、訓練後は変えにくいモデルの重みの外側にある情報・計算能力を補う。 https://arxiv.org/abs/2302.04761 ↩
エージェント＝LLM＋計画＋記憶＋道具という整理：Lilian Weng, “LLM Powered Autonomous Agents”, Lil’Log (2023)。この三要素の枠組みを広めた解説。（「エージェントに厳密な学術的定義はない」は本文筆者の補足であり、同記事の主張ではない。） https://lilianweng.github.io/posts/2023-06-23-agent/ ↩

この記事はAIが下書きし、人間が編集・公開しています。