pandasはPythonのライブラリの中でも、データ解析やデータ加工に優れた機能を持っています。この記事では、pandasを使って複数のCSVファイルを結合する方法を紹介します。
1. pandasのインストール
pandasを使うには、まずpandasをインストールする必要があります。pipを使ってインストールすることができます。
pip install pandas
2. CSVファイルの準備
まず、結合するCSVファイルを準備します。以下の例では、data1.csvとdata2.csvを結合することを想定しています。
data1.csv
name,age
Alice,25
Bob,30
Charlie,35
data2.csv
name,age
Dave,40
Ellen,45
Frank,50
3. pandasを使ってCSVファイルを結合する
pandasを使ってCSVファイルを結合するには、pd.concat()関数を使います。以下のようにコードを書くことができます。
import pandas as pd
df1 = pd.read_csv('data1.csv')
df2 = pd.read_csv('data2.csv')
df = pd.concat([df1, df2])
これにより、data1.csvとdata2.csvが結合され、dfに格納されます。dfを出力すると、以下のような結果が得られます。
name age
0 Alice 25
1 Bob 30
2 Bob 35
3 Dave 40
4 Ellen 45
5 Frank 50
4. 結合したCSVファイルを保存する
最後に、結合したCSVファイルを保存する方法を紹介します。pandasのto_csv()関数を使うことで、CSVファイルに保存することができます。
df.to_csv('merged_data.csv', index=False)
index=Falseを指定することで、出力結果に行番号を含めないように設定することができます。
以上が、pandasを使って複数のCSVファイルを結合する方法です。データ加工やデータ解析においては、pandasは非常に優れたライブラリですので、ぜひ使いこなしていきましょう。