いつもいっかいどっかでやるのでメモ。 クラスを分類しまちがえた時は、そのミスの自信度を確認すること。
コード
# check error prd = clf.predict_proba(X_test)[:, 1] tfdata = pd.concat([pd.DataFrame(y_test), pd.DataFrame(prd)], axis=1) tfdata.columns = ['ans', 'prd'] ok = np.array(tfdata[abs(tfdata['ans']-tfdata['prd'])<0.5]) no = np.array(tfdata[abs(tfdata['ans']-tfdata['prd'])>=0.5]) ok_conf = [abs(r[0]-r[1]) for r in ok] no_conf = [abs(r[0]-r[1]) for r in no] plt.hist(ok_conf, normed=1, alpha=0.5, label='cor', bins=10) plt.hist(no_conf, normed=1, alpha=0.5, label='inc', bins=10)