タグ: 制御

制御理論はRLが再発明する半分を先に解いていた 2026/6/27
深層RLが「発見」する安定性・最適性・頑健性の多くは、制御理論が数十年前に保証付きで解いていた。RLは保証なしで、桁違いのサンプルで再発明する——ただしモデルが無い領域では本当に勝つ。