タグ: 制御
- 制御理論は、RLが再発明している半分を、もっと前に解いていた 2026/6/19
深層RLが「発見」する安定性・最適性・頑健性の多くは、制御理論が数十年前に保証付きで解いていた。RLは保証なしで、桁違いのサンプルで再発明する——ただしモデルが無い領域では本当に勝つ。
- 倒立振子を、制御とRLの両方で立たせてみた——賢い方が、無料で勝つわけではない 2026/6/18
MuJoCoの倒立振子を、古典制御(LQR)と強化学習(REINFORCE)の両方で実際に動かし、同じ物差しで測った。結果は対照的で、正直だった。