AI・信頼性・評価

コンテキストエンジニアリング——限られた“作業机”に、何を載せるか

2026/6/21 シリーズ「AIエージェントは、実際どう動くのか」第3回 / 全5回

🤖 AIが下書き・人間が編集

エージェントの出来は“外側の足場”——ハーネス——で大きく変わる。その足場の中でも、いま最も注目されているのが——コンテキストエンジニアリング（机に何を載せるかの設計）である。ここを掘る。

AIの“作業机”には、限りがある

まず大事な事実を一つ。LLMには、一度に見られる情報の量に上限がある（これを「コンテキストウィンドウ」と呼ぶ）。人にたとえるなら、作業机の広さである。どんなに優秀な人でも、机が小さければ、関係する資料を全部は広げられない。今この瞬間に必要なものだけを机に載せ、要らないものは引き出しにしまう——その采配が、仕事の効率を決める。

エージェントは、考える→動く→観察するを何十回も繰り返す。その一回ごとに、限られた机に「いま何を載せるか」が問われ続ける。載せ忘れれば的外れになり、載せすぎれば散らかって迷子になる。これを采配する技術が、コンテキストエンジニアリングである。

「プロンプトを書く」から「コンテキストを設計する」へ

少し前まで、AIをうまく使うコツは「プロンプトエンジニアリング」——つまり一回の指示文の書き方だ、と言われていた。だが、長く自律的に動くエージェントの時代になると、話の重心が移った。大事なのは一回の言い回しより、机の上の情報“全体”をどう組み立て続けるかである。2025年ごろから、これを「コンテキストエンジニアリング」と呼ぶ流れが広まった（Andrej Karpathy らが広めたとされる）¹。

机に載るものは、ざっと：

指示（システムプロンプト）：そもそも何を目指し、どう振る舞うか（常に置いておく土台）。
短期記憶：直近のやりとり（さっき何をして何が返ってきたか）。
長期記憶：過去の経験や、必要なときに外から引っぱってくる知識（検索＝RAG的なもの）。
道具の結果：行動して返ってきた観察。

ハーネスの仕事は、毎ステップ、この中からいま必要な分だけを机に載せることである。

多ければいい、ではない——長いコンテキストの「lost in the middle」

ありがちな誤解が、「机は広いほど（コンテキストは多いほど）いい」というものである。実際は違う。情報が少なすぎれば、AIは手がかりを失う。逆に多すぎても、肝心な情報がノイズに埋もれ、AIは注意散漫になる。長いコンテキストの真ん中あたりに置かれた大事な情報ほど、AIが見落としやすい——この「中央に置かれた情報を取りこぼす」現象は、lost in the middle という名前で知られている¹。おまけに、机を広げるほどお金（計算コスト）もかかる。

だから本質は「全部載せる」ことではなく、「いま要る最小限を、的確に選ぶ」ことにある。引き算の技術なのだ。

これは「新しい技術」なのか、それとも“言い換え”なのか

正直な注釈を一つ。「コンテキストエンジニアリングは、結局プロンプトエンジニアリングの言い換えでは？」という冷静な批判もある¹。これはもっともな指摘だ。私の見立てでは——重心の移動は本物だ。「一発の指示を磨く」から「長く走る情報の状態を管理し続ける」へ、という強調点の変化は実在する。ただし、それがまったく新しい学問なのか、既存技の再整理なのかは、まだ定まっていない。新語に踊らされず、中身（限られた机を的確に采配する）を見るのが良いだろう。

エージェントの「ループ」「ハーネス」「コンテキスト」が揃えば、仕組みとしては、これで一通り動く。（もっとも、この三つにくっきり線が引けるわけではない。とくに「ハーネス」は人によって指す範囲が違う広い言葉で、コンテキストの管理まで含めて「ハーネス」と呼ぶ立場もある。本シリーズは便宜上、足場の作り＝ハーネス／その上で何を見せ続けるか＝コンテキストと分けているが、境界はにじむ——そう断った上で読んでほしい。） ——だが、いよいよ本丸だ。これだけ整えても、なぜエージェントは「デモは凄いのに実用では脆い」のか。 その正体を、製造業の歩留まりと同じ“掛け算”の数字で、忖度なく明かしていく。

出典

「コンテキストエンジニアリング」という言葉と枠組み（限られたコンテキストウィンドウに“次の一歩に必要な情報だけ”を載せる設計）は、2025年に Andrej Karpathy らが広めたとされる新しい呼称。プロンプトエンジニアリングの言い換えにすぎないという議論も並行して存在する（新興の枠組みであり、確立した学問分野ではない）。記憶の種類（短期＝対話履歴、長期＝検索/RAG）の整理は Lilian Weng, “LLM Powered Autonomous Agents” (2023) に基づく一般的な枠組み。長文脈での情報見落とし（“lost in the middle”的な現象；Liu et al., “Lost in the Middle”, arXiv:2307.03172, 2023 ほか）は複数の研究で指摘されている。 https://arxiv.org/abs/2307.03172 https://lilianweng.github.io/posts/2023-06-23-agent/ ↩ ↩² ↩³

この記事はAIが下書きし、人間が編集・公開しています。