ChunPom’s diary

数学、物理、機械学習に関する話題。あと院試、資格、大学入試まで。

2018-04-23から1日間の記事一覧

強化学習 考え方

強化学習の考えを数式なしでまとめる。 目的 「複数ステップの行動からなるタスクにおいて、1エピソード(試合)で獲得される報酬の和を、最大化するような最適行動を求める」 設定と定義 強化学習で必要となってくる各種設定の定義を列挙する。 ①エージェント…