強化学習の考えを数式なしでまとめる。 目的 「複数ステップの行動からなるタスクにおいて、1エピソード(試合)で獲得される報酬の和を、最大化するような最適行動を求める」 設定と定義 強化学習で必要となってくる各種設定の定義を列挙する。 ①エージェント…
友人に「強化学習って何なん?」と尋ねられたので、手法の本質を簡潔に説明できるか考えてみた。 強化学習は、めっちゃ簡単に言うと、 「制御理論の一種で、環境の情報(ハミルトニアンなど)を知らなくても、経験的にそれを獲得し、最適な制御方法を学習する…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。