めも

メモ.

pandas.DataFrameでcsvファイルを内部結合

よく使うのでメモ。 ID_labelxID_labelyが同じ行をまとめる内部結合です。

やりたいこと

X: (ID_labelx, xa, xb) = (tanaka, data_xa, data_xb)
Y: (ID_labely, ya, yb) = (tanaka, data_ya, data_yb)

のデータが

join: (ID_labelx, xa, xb, ya, yb) = (tanaka, data_xa, data_xb, data_ya, data_yb)

となります。

コード

# load data
X = pd.read_csv('X.csv')
Y = pd.read_csv('Y.csv')

# join
join = pd.merge(X, Y, how="inner", left_on="ID_labelx", right_on="ID_labely")
pd.to_csv('XY_innerjoin.csv')

他の例

ドキュメントに多数の例があります。

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス(Googleアドセンス、A8.net)を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー(Cookie)を使用しております。 クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。