ディープラーニングのパラメータ設定・更新方法に関するメモ

機械学習 python 深層学習

パラメータの初期化 Xavier Initialization He Initialization Glorot initialisation パラメータ更新の手法 Vanilla update Momentum Nesterov Momentum Nadam AdaGrad AdaDelta Adam(Adaptive Moment Estimation) RMSprop Eve その他多数自分で定義した目…

2017-01-22

機械学習のベストプラクティスの資料のメモ(Best Practices for ML Engineering)

メモ機械学習

Rules of Machine Learning: Best Practices for ML Engineering Reliable Machine Learning in the Wild Google researchの Martin Zinkevich氏の資料です。 Reliable Machine Learning in the Wild(NIPS 2016)での招待講演のもの。 Rules of Machine Learn…

2017-01-22

XGBoostで自分で設計した目的関数(objectiveを自分で定義)で回帰を行う

機械学習 python

やること Quantile Regression イメージ scikit-learnのGradientBoostingでの実装 XGBoostの目的関数を変更する目的関数結果他の目的関数やること xgboostの目的関数を定義済みのものから自分で定義したものに変える。回帰は常に正解ラベル＝予測の平…

2017-01-20

損失関数・評価指標のめも

メモリンク集機械学習

scikit-learnのモデル評価に関するドキュメント回帰(Regression)問題 Hinge loss 平均絶対誤差(Mean absolute error) Mean Squared Error ニクラス分類(Binary Classification)問題 F1 score MAP(Mean average precision) マルチラベル分類(Multi-Label Cla…

2017-01-11

Maximum Mean Discrepancyに関する資料集

論文・資料・スライド集機械学習

大阪大学講義資料 ICONIP 2006 Multi-kernel Maximum Mean Discrepancy MMD-critic これもメモのみ。去年9月頃から家のゴタゴタを引きずってて全然作業出来てない。春休みに確認したいところ。MMD！＝MikuMikuDance。大阪大学講義資料大阪大学大学院・基…

2017-01-09

人工知能の研究に利用できる1 人称視点の３Dゲーム環境、DeepMind Lab

機械学習

3Dでの機械学習（この言葉は使いたくないですが）の研究に利用できる環境をオープンソースで公開したそうです。 github 元論文 [1612.03801] DeepMind Lab

2016-12-28

メモ：Value Iteration Networksのtheano, tensor-flow, chainerでの実装

メモ機械学習

概要実装 theano tensor-flow chainer NIPS-16のBest Paper AwardであるTamar, Aviv, Sergey Levine, and Pieter Abbeel. "Value Iteration Networks." arXiv preprint arXiv:1602.02867 (2016).のtensor-flowでの実装が公開されました。概要エージェント…

2016-12-19

新しいGradient Boostingベースの予測モデルLightGBM

機械学習

概要インストール Python(2.7, 3.4) C++ インストール時のエラーエラー解決法関連手法の元文献 XGBoost FastBDT 概要ツリーベースのアンサンブル手法は時系列順に Random Forest Gradient Boosting XGBoost FastBDT などとありますがここに新しくLightGB…

2016-12-07

バンディットアルゴリズムの復習５：Combinatorial bandits

バンディット機械学習論文・資料・スライド集

前回 matroid bandit やりたいこと Matroid Augmentation property Modular Function Maximum-weight basis of the matroid アルゴリズム：Optimistic Matroid Maximization 問題設定アルゴリズム詳細元論文その他関連論文書きかけ、後ほど各アルゴリズ…

2016-12-05

バンディットアルゴリズムの復習４：Contextual Bandit

python 機械学習バンディット書きかけ

前回 Contextual Bandit スライド説明各アルゴリズム外観 EXP4 Epoch-Greedy LinUCB Thompson sampling for Contextual Bandits HyperTS・HyperTSFB 次回書きかけ、後ほど各アルゴリズムの説明や実験など追加予定。 →水曜夜あたり→土日あたり前回 UCB,そ…

2016-12-04

バンディットアルゴリズムの復習３：UCB(Upper Confidence Bound)

python 機械学習バンディット

前回 UCB(Upper Confidence Bound) UCBの説明理論的な説明 UCBのアルゴリズムアームの定義 Arm0: ベルヌーイ Arm1: 適当に作った分布実験 Arm0: ベルヌーイ Arm1: 適当に作った分布次回参考文献前回 ε-Greedy+softmaxについてやった。 UCB(Upper Confi…

2016-12-04

バンディットアルゴリズムの復習２：softmax

python 機械学習バンディット

前回 Softmax Softmaxによるアーム選択 Boltzmann分布(Gibbs 分布) Softmaxのコードアーム選択部分実験アームの定義 Arm0: ベルヌーイ Arm1: 適当に作った分布実験結果 Arm0: ベルヌーイの場合 Arm1: 適当に作った分布の場合次回:UCB 参考文献前回 ε-G…

2016-12-04

バンディットアルゴリズムの復習１：epsilon-Greedy

python 機械学習バンディット

A/B テスト epsilon-Greedy アルゴリズム説明 epsilon-Greedy アルゴリズムコード実験(ベルヌーイ分布のアーム) アームの定義実行結果実験(ペナルティが大きいアームがあるケース) アームの定義実験結果実験(アームの分布が時間によって変化する場合) …

2016-12-02

強化学習の資料メモ３：マルコフ決定過程

論文・資料・スライド集機械学習強化学習

Agent–Environment Interface 強化学習におけるagent-environmentの相互作用 Markov Decision Process 定義講義動画 Markov Decision Processes I Markov Decision Process II RL Course by David Silver(Deepmind) 有限マルコフ決定過程（Finite Markov De…

2016-11-30

強化学習の資料メモ２：多腕バンディット問題

論文・資料・スライド集機械学習強化学習バンディット

基本の内容各種定式化 Exploration/Exploitation Dilemma Stationary Problem(定常なケース) Action-Value Methods 行動選択の戦略 greedy(貪欲) ε-Greedy Soft-max action selection Non-stationary Problem(非定常なケース) アームの行動戦略 Gradient-Ba…

2016-11-30

強化学習の資料メモ１：基本

強化学習リンク集機械学習バンディット

強化学習の基本 Introduction to Reinforcement Learning with Function Approximation Temporal-Difference Learning Bellman expectation equation off-policy Function approximation ε-greedy policy Model-based reinforcement learning 活用と探索のジ…

2016-11-29

Richard S. Suttonら著の強化学習本のドラフト版が公開

機械学習論文・資料・スライド集強化学習

pdf サンプルコード追記このドラフト版の前の本 Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. Vol. 1. No. 1. Cambridge: MIT press, 1998. で有名なRichard S. Sutton氏による新しい強化学習本のドラフト版が以下…

2016-11-25

Chainer Playground βで機械学習を学ぶ

機械学習

リンク：Chainer Playground (beta) オンラインでコードを実行しながら学べる環境。これから更新されていく予定だそうです。

2016-11-12

pythonで決定木の出力と決定境界の可視化

python コード可視化機械学習

参考文献 dotのインストール決定境界の可視化データの生成決定境界の可視化決定木の出力決定木のデータファイルを出力出力画像おまけ：非線形データの場合データ生成決定境界の可視化決定木の可視化参考文献 Python Data Science Handbook: Essen…

2016-11-11

Active Learningの資料・論文のめも

論文・資料・スライド集機械学習リンク集メモ

導入 Active Learning 入門 A tutorial on active learning 能動学習セミナーサーベイ Active Learning Literature Survey 論文導入 Active Learning 入門 Active Learning 入門 from Shuyo Nakatani www.slideshare.net A tutorial on active learning pd…

2016-11-11

バンディットアルゴリズムの資料・論文のめも

論文・資料・スライド集機械学習リンク集バンディット

導入バンディットアルゴリズム入門と実践 I’m a bandit Thompson Sampling アルゴリズムバンディット問題の各定式化について Introduction to Bandits: Algorithms and Theory 応用例：レコメンデーション論文 Some aspects of the sequential design of …

2016-11-06

pythonでgensimを使ってトピックモデル(LDA)を行う

自然言語処理 python データ解析前処理機械学習

LDA用のデータの作成単語の辞書を作成して出力外部に保存したコーパスと辞書の読み込み LDAの実行コード出力例 gensimとjanomeを用いたLDAを行います。必要なデータは一行ごとに文章が入ったtxtファイルです。 LDA用のデータの作成 data.txtには一行ご…

2016-11-06

OCR・文字認識の論文とかのまとめ

python 機械学習深層学習画像処理自然言語処理リンク集論文・資料・スライド集

論文 End-to-End Text Recognition with Convolutional Neural Networks Word Spotting and Recognition with Embedded Attributes Deep structured output learning for unconstrained text recognition Deep Features for Text Spotting Reading Text in t…

2016-11-06

Deep系の論文めも後半その2 (2016年夏頃までのもの対象)

論文・資料・スライド集深層学習機械学習メモ書きかけ画像処理

教師なし CNN features off-the-shelf: an astounding baseline for recognition 画像 Learning and transferring mid-level image representions using convolutional neural networks Learning hierarchical features for scene labeling Semantic Segment…

2016-11-04

Deep系の論文めも後半その１ (2016年夏頃までのもの対象)

論文・資料・スライド集画像処理深層学習機械学習書きかけメモ

生成モデル Deep Convolutional Generative Adversarial Networks Generative Adversarial Nets Unsupervised representation learning with deep convolutional generative adversarial networks Deep Generative Image Models using a Laplacian Pyramid …

2016-11-03

Deep系の論文めも前半 (2016年夏頃までのもの対象)

リンク集機械学習深層学習論文・資料・スライド集

過学習の防止・学習のアルゴリズム Dropout Batch normalization Resnet Layer Normalization Normalization Layers 理論 Distilling the knowledge in a neural network Deep neural networks are easily fooled: High confidence predictions for unrecogn…

2016-10-31

画像処理系のDeep Learningの基本的な手法

論文・資料・スライド集機械学習深層学習リンク集

まとめ資料サーベイ The Deep Learning textbook by Ian Goodfellow and Yoshua Bengio and Aaron Courville Deep Learning in Neural Networks: An Overview 画像・動画画像分類問題 AlexNet (ImageNet Classification with Deep Convolutional Neural Ne…

2016-10-30

Metric learning/similarly learningに関する資料集

リンク集機械学習深層学習論文・資料・スライド集

metric learningとは Wikipedia Tutorial on Metric Learning Metric Learning(ICML tutorial) 基本 Distance metric learning with application to clustering with side-information. Distance metric learning for large margin nearest neighbor classif…