めも

メモ.

pythonでpd.DataFrameのカラム名一覧を取得+単純集計

やりたいこと

全特徴のヒストグラムを作成する。 data.columns.valuesで DataFrameのカラム一覧を取得する。

コード


data = pd.read_csv(filename)
names = data.columns.values
N, M = 5, 5

plt.figure(figsize=(N*2, M*2))
for i, ni in enumerate(names):
    # これ以上はプロットできないので終了
    if i==N*M:
        break
    
    # data for histogram
    clm = data[ni]
    
    try: # ヒストグラムを表示
        plt.subplot(N,M,i+1)
        plt.hist(clm)
        plt.title(ni)
    except: # データが数字じゃない場合パス
        plt.subplot(N,M,i+1)
        plt.title(ni+'/error')


    plt.xticks(rotation=90)

# 文字の重なりをなくす
plt.tight_layout()

出力

f:id:misos:20161023001519p:plain

他の例

ドキュメントに多数の例があります。

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス(Googleアドセンス、A8.net)を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー(Cookie)を使用しております。 クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。