2018-04-23から1日間の記事一覧

強化学習　考え方

強化学習の考えを数式なしでまとめる。目的「複数ステップの行動からなるタスクにおいて、1エピソード(試合)で獲得される報酬の和を、最大化するような最適行動を求める」設定と定義強化学習で必要となってくる各種設定の定義を列挙する。 ①エージェント…