用語集

記事に出てくる略語・専門用語をまとめた。記事の中では、各用語の初出に点線が付き、カーソルを乗せる（スマホはタップ）と説明が出る。ここはその全体一覧である。

BCI: ブレイン・コンピュータ・インターフェース（Brain-Computer Interface）。脳と機械を直接つなぐ技術。
CGCNN: 結晶構造から物性を予測するグラフニューラルネットワーク（Crystal Graph CNN）。
DFT: 密度汎関数理論（Density Functional Theory）。材料の物性を量子力学から計算する標準手法。
DPO: 直接選好最適化（Direct Preference Optimization）。RLHFを簡略化した微調整法。
DR: ドメインランダム化（Domain Randomization）。学習時に物理条件を乱数で変え、現実とのズレに強い方策を得る手法。
ECE: 期待較正誤差（Expected Calibration Error）。モデルの自信と実際の正答率のズレを測る指標。
EEG: 脳波（Electroencephalography）。頭皮で測る脳の電気信号。
GNoME: DeepMindの材料探索AI。多数の安定結晶の候補を提示した。
LLM: 大規模言語モデル（Large Language Model）。大量のテキストで訓練され、文章を生成・理解するAIの中核。
LQR: 線形二次レギュレータ（Linear-Quadratic Regulator）。最適制御の古典的手法。
MD: 分子動力学（Molecular Dynamics）。原子の運動を数値計算で追うシミュレーション。
MEGNet: 材料の物性を予測するグラフニューラルネットワーク（MatErials Graph Network）。
METR: AIの自律タスク遂行能力を計測する独立研究組織。
MLCC: 積層セラミックコンデンサ（Multi-Layer Ceramic Capacitor）。電子機器に大量に使われる超小型部品。
PPO: 近接方策最適化（Proximal Policy Optimization）。安定して学習する代表的な強化学習アルゴリズム。
RAG: 検索拡張生成（Retrieval-Augmented Generation）。外部文書を検索して回答に与え、根拠を補う方式。
ReAct: 推論（Reason）と行動（Act）を交互に行うエージェントの枠組み（arXiv:2210.03629）。
Reflexion: 失敗を言葉で振り返り、再挑戦するエージェント手法（arXiv:2303.11366）。
REINFORCE: 方策勾配法の基本アルゴリズム。報酬で方策を直接更新する。
RL: 強化学習（Reinforcement Learning）。試行錯誤と報酬で方策を学ぶ機械学習。
RLHF: 人間のフィードバックによる強化学習（RL from Human Feedback）。人の好みに合わせてモデルを微調整する手法。
SWE-bench: 実在のGitHub課題をエージェントに解かせ、テストで自動採点する評価ベンチマーク。
Toolformer: モデルが道具（API）の使い方を自分で学ぶ手法（arXiv:2302.04761）。
UCB: 上限信頼区間（Upper Confidence Bound）。バンディット問題で使う探索アルゴリズム。
Voyager: スキルを蓄積していく自律エージェント（arXiv:2305.16291）。
WFC: Wave Function Collapse。制約を満たすパターンを生成するアルゴリズム。