Pythonを使ってCSVファイルからデータを抽出する場合、必要な列だけを取り出すことがよくあります。ここでは、Pandasライブラリを使用して、CSVファイルから特定の列だけを抽出する方法を紹介します。
Pandasを使ってCSVファイルを読み込む
まず、Pandasを使ってCSVファイルを読み込みます。以下のコードを使用することで、CSVファイルを読み込むことができます。
import pandas as pd
df = pd.read_csv('example.csv')
特定の列だけを抽出する
CSVファイルから特定の列だけを抽出するには、以下のように列のラベルを指定します。
import pandas as pd
df = pd.read_csv('example.csv')
new_df = df[['column1', 'column2']]
ここで、column1とcolumn2は抽出したい列のラベルです。複数の列を抽出する場合は、列のラベルをリストで指定します。
抽出したデータを新しいCSVファイルとして保存する
最後に、抽出したデータを新しいCSVファイルとして保存することができます。以下のコードを使用することで、新しいCSVファイルを保存することができます。
import pandas as pd
df = pd.read_csv('example.csv')
new_df = df[['column1', 'column2']]
new_df.to_csv('new_file.csv', index=False)
ここで、new_file.csvは新しいCSVファイルのファイル名です。index=Falseを指定することで、新しいCSVファイルに行のインデックスを含めないようにすることができます。
以上で、Pythonを使ってCSVファイルから特定の列だけを抽出する方法を紹介しました。