pandasはPythonのライブラリの中でも、データ解析やデータ加工に優れた機能を持っています。この記事では、pandasを使って複数のCSVファイルを結合する方法を紹介します。

1. pandasのインストール

pandasを使うには、まずpandasをインストールする必要があります。pipを使ってインストールすることができます。

pip install pandas

2. CSVファイルの準備

まず、結合するCSVファイルを準備します。以下の例では、data1.csvdata2.csvを結合することを想定しています。

data1.csv

name,age
Alice,25
Bob,30
Charlie,35

data2.csv

name,age
Dave,40
Ellen,45
Frank,50

3. pandasを使ってCSVファイルを結合する

pandasを使ってCSVファイルを結合するには、pd.concat()関数を使います。以下のようにコードを書くことができます。

import pandas as pd

df1 = pd.read_csv('data1.csv')
df2 = pd.read_csv('data2.csv')

df = pd.concat([df1, df2])

これにより、data1.csvdata2.csvが結合され、dfに格納されます。dfを出力すると、以下のような結果が得られます。

    name  age
0  Alice   25
1    Bob   30
2    Bob   35
3   Dave   40
4  Ellen   45
5  Frank   50

4. 結合したCSVファイルを保存する

最後に、結合したCSVファイルを保存する方法を紹介します。pandasのto_csv()関数を使うことで、CSVファイルに保存することができます。

df.to_csv('merged_data.csv', index=False)

index=Falseを指定することで、出力結果に行番号を含めないように設定することができます。

以上が、pandasを使って複数のCSVファイルを結合する方法です。データ加工やデータ解析においては、pandasは非常に優れたライブラリですので、ぜひ使いこなしていきましょう。