バンディット問題とは 方策の評価方法:リグレット 確率的バンディット 問題設定 標本分布と本当の分布の間の評価 観測した報酬の平均(標本平均)と本当の平均(母平均)の差の評価 方策 参考文献・資料 小宮山純平先生の人工知能学会誌での「私のブックマ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。