読者です 読者をやめる 読者になる 読者になる

ゆるふわめも

in Kyoto or Tokyo

可視化

画像に含まれる色をクラスタリングして自動的に抽出する

できたもの 実装内容 仕組み 改善点 おまけ 今後の課題 クラスタリング数を動的に変更する ワンポイントの色の抽出 クラスタリングについてのメモ クラスタリングするアルゴリズムの分類 階層的なクラスタリング手法 繰り返し割り当てを変えていく手法 その…

matplotlibでの凡例(ラベル)の表示場所・形式を変更する

データを生成 legend(凡例)の表示方法の指定 通常 場所を指定(グラフ枠内) 凡例表示を複数列に分割する, 枠に影をつける, 横幅いっぱいにする グラフの枠外に表示する 凡例にタイトルをつける 凡例を分割して別々に表示する ラベル名を任意の文字列に付け替…

OPENVIS, ウェブ上のインフォマティクスに関する学会

OPENVIS 2017 2016 2015 IEE VIZ 2017 IVAPP 2017 ウェブ上でのデータ可視化に関する学会。 可視化の人たちだけあって、スライドも綺麗。 スライドは全てダウンロード or 閲覧できて発表動画も公開されているので、 暇なときに面白そうなのが見れたらなあ、…

グラフィカルモデルの資料のメモ

グラフィカルモデル入門 ベイジアンネットとレコメンデーション グラフィカルラッソ 完全にあとで読む用のメモ。 グラフィカルモデル入門 グラフィカルモデル入門 from Kawamoto_Kazuhiko 千葉大学統合情報センター , 川本一彦先生の資料。 ベイジアンネット…

graphvizを使ってフローチャートや遷移図を作成する

できること インストール コマンドでのコンパイル web上でコンパイル 作成例 決定木の可視化 作成例は後ほど追記予定。 できること digraph g{ rankdir=LR; "a" -> "b" -> "c" -> "d" -> "e" -> "f" } をコンパイルすると ができます。 インストール brew in…

pythonで決定木の出力と決定境界の可視化

参考文献 dotのインストール 決定境界の可視化 データの生成 決定境界の可視化 決定木の出力 決定木のデータファイルを出力 出力画像 おまけ:非線形データの場合 データ生成 決定境界の可視化 決定木の可視化 参考文献 Python Data Science Handbook: Essen…

pythonで線形+多項式フィッティング

データの生成 コード グラフ上にプロット フィッテング 過学習のテンプレとして出てくる。 データの生成 コード 予測する曲線のデータと、それにノイズを乗せたデータを生成します。 import matplotlib.pyplot as plt import seaborn import numpy as np def…

pythonで時系列データのプロット、棒グラフ、散布図

データのロード プロット 棒グラフ 単純なカウント 特定のカラムの数のカウント(group by) 散布図 二変数間での散布図 二変数間の散布図を同時に複数 よく使うのでメモ。 データのロード import seaborn as sns data = sns.load_dataset('planets') ロードし…

python matplotlib 内で日本語を利用する(日本語のラベルや凡例・legendをつける)

matplotlibで使用できるフォントを探す 指定したフォントをmatplotlib全体で使用できるように指定する コード 表示例 matplotlib.rcを使ったフォントの変更 コード 表示例 matplotlibで使用できるフォントを探す 指定したフォントをmatplotlib全体で使用でき…

python matplotlib 内で日本語を利用する(使用できるフォントを探す)

利用できるフォントを探す コード 出力 matplotlibで使用 日本語でラベルや凡例を表示する 利用できるフォントを探す コード import matplotlib.font_manager as fm # フォント一覧 fonts = fm.findSystemFonts() # フォントのパスと名前を取得、とりあえず1…

pythonでpandasのgroupbyで集約+散布図(scatter)を作成

やること コード データ作成 集計 + 上位の丸め込み コード全体 出力 やること 変数が三つある時によくやるのでメモ。 データで例えると「映画の視聴回数」「変数A」「変数B」で回数ごとに A, Bの変数に変化があるかを調べたい時にとりあえず見てみる。 大抵…

mini-batch k-meansでデータをクラスタリングして教師データの偏りを可視化する

やること コード クラスタリング プロットするためのデータ準備 グラフ作成 結果 やること データをクラスタリングして、各クラスタごとの教師データの分布の偏りを確かめたい。 今回は 教師データ = 0, 1 の2クラスを想定。 可視化をするためのデータは 主…

pythonでAutoencoderの精度をバッチサイズを変更しながら確認

コード モデル定義 モデルの訓練 バッチサイズを狭めながらオートエンコーダを訓練して、その損失関数の減少具合を確認する。 緑色線がエポックごとのおおよその損失関数のlossの値、赤色がバッチごとのlossの値を全てプロットしたものです。 コード モデル…

pythonで相関係数を可視化する

問題設定 ニクラス問題で教師データのラベルが 1, 0だった時にそのラベルごとに変数の相関を、さらにラベルの違いごとに変数相関に違いがあるかを確認する。 コード plt.figure(figsize=(10, 10)) plt.subplot(221) plt.title('alldata corr') sns.heatmap(t…