めも

メモ.

2019-05-25から1日間の記事一覧

バンディット問題の勉強(バンディット問題の理論とアルゴリズム1〜2章)

バンディット問題とは 方策の評価方法:リグレット 確率的バンディット 問題設定 標本分布と本当の分布の間の評価 観測した報酬の平均(標本平均)と本当の平均(母平均)の差の評価 方策 参考文献・資料 小宮山純平先生の人工知能学会誌での「私のブックマ…