めも

メモ.

pythonで予測ミスの分布を確認

いつもいっかいどっかでやるのでメモ。 クラスを分類しまちがえた時は、そのミスの自信度を確認すること。

コード

# check error
prd = clf.predict_proba(X_test)[:, 1]
tfdata = pd.concat([pd.DataFrame(y_test), pd.DataFrame(prd)], axis=1)
tfdata.columns = ['ans', 'prd']

ok = np.array(tfdata[abs(tfdata['ans']-tfdata['prd'])<0.5])
no = np.array(tfdata[abs(tfdata['ans']-tfdata['prd'])>=0.5])

ok_conf = [abs(r[0]-r[1]) for r in ok]
no_conf = [abs(r[0]-r[1]) for r in no]

plt.hist(ok_conf, normed=1, alpha=0.5, label='cor', bins=10)
plt.hist(no_conf, normed=1, alpha=0.5, label='inc', bins=10)

出力

f:id:misos:20161019235650p:plain

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス(Googleアドセンス、A8.net)を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー(Cookie)を使用しております。 クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。