ChunPom’s diary

数学、物理、機械学習に関する話題。あと院試、資格、大学入試まで。

強化学習

強化学習 考え方

強化学習の考えを数式なしでまとめる。 目的 「複数ステップの行動からなるタスクにおいて、1エピソード(試合)で獲得される報酬の和を、最大化するような最適行動を求める」 設定と定義 強化学習で必要となってくる各種設定の定義を列挙する。 ①エージェント…

制御と強化学習

友人に「強化学習って何なん?」と尋ねられたので、手法の本質を簡潔に説明できるか考えてみた。 強化学習は、めっちゃ簡単に言うと、 「制御理論の一種で、環境の情報(ハミルトニアンなど)を知らなくても、経験的にそれを獲得し、最適な制御方法を学習する…