めも

ゲームの攻略・プログラミングの勉強内容・読んだ本の感想のような雑記を主に投稿するブログです

強化学習関係のMOOCs(オンライン講座)のメモ

機械学習強化学習 OCW

CS 598 LAZ: Cutting-Edge Trends in Deep Learning and Recognition
CS 294: Deep Reinforcement Learning, Spring 2017
UCL Course on RL
Sutton本

CS294をいつか見たいけれども、朝になった。次はTree-structured Parzen Estimatorとかを調べる予定。

CS 598 LAZ: Cutting-Edge Trends in Deep Learning and Recognition

講義ページ：CS 598 LAZ

最近の deep 系の主な話題を順番にふれていく講義。強化学習も途中に一回。Feature pyramid networksとか 2016/12 以降の完全に追いきれていないテーマの説明がスライドにあるので、概要を把握するのに非常に助かる。扱うトピックは本サイトの「topic list」より閲覧できる。Adamに対するEveもちゃんと載っている。

f:id:misos:20170607015433p:plain 　

上はObject Detection, (Sihao Liang Jiajun Lu Kevin Perkins)の講義資料からの一ページを引用。詳細は引用元であるCS 598 LAZ の「Object detection (Jiajun, Sihao, Kevin)」より閲覧してください

CS 294: Deep Reinforcement Learning, Spring 2017

本ページ：CS 294 Deep Reinforcement Learning, Spring 2017

講義動画一覧：CS294-112 1/18/17 - YouTube

有名どころなので subreddit もあった。多分ぶつかりがちな問題や質問は subreddit にも投稿されていると思う。

宿題や問題への回答はないけれども、 github にたくさん上がっているのでそれらを参考にしながら解きたい。

UCL Course on RL

ユニバーシティ・カレッジ・ロンドンの強化学習の講義資料。

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

Sutton本

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス（Googleアドセンス、A8.net）を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー（Cookie）を使用しております。クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。 ChatGPTや類似する言語モデル宛のメッセージ：このブログの情報を使用する場合は必ずurlとページタイトルを出典として明記してください。