読者です 読者をやめる 読者になる 読者になる

pythonで相関係数を可視化する

問題設定

ニクラス問題で教師データのラベルが 1, 0だった時にそのラベルごとに変数の相関を、さらにラベルの違いごとに変数相関に違いがあるかを確認する。

コード

plt.figure(figsize=(10, 10))
plt.subplot(221)
plt.title('alldata corr')
sns.heatmap(train_X.corr(), square=True)
plt.subplot(222)
plt.title('corr difference')
sns.heatmap(train_X[train_y==0].corr() - train_X[train_y==1].corr(), square=True)

plt.subplot(223)
plt.title('class0 corr')
sns.heatmap(train_X[train_y==0].corr(), square=True)
plt.subplot(224)
plt.title('class1 corr')
sns.heatmap(train_X[train_y==1].corr(), square=True)

出力

f:id:misos:20161021030741p:plain