PyPDF2はPythonでPDFファイルを編集するためのライブラリであり、PDFファイルの作成、結合、分割、テキストの抽出などの機能を提供しています。今回はPyPDF2を使用して、PDFファイルを分割する方法を紹介します。

1. PyPDF2のインストール

まずはPyPDF2をインストールしましょう。以下のコマンドを実行してください。

pip install PyPDF2

2. PDFファイルを分割する方法

以下のコードを使用して、PDFファイルを指定したページ数ごとに分割することができます。

import PyPDF2

# 分割するPDFファイルを開く
pdf_file = open('example.pdf', 'rb')

# PyPDF2のPdfFileReaderオブジェクトを作成する
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

# 分割されたPDFファイルの保存先フォルダーを指定する
output_folder = '/output/folder/'

# 分割するページ数
split_num = 5

# PDFファイルを分割する
for i in range(0, pdf_reader.getNumPages(), split_num):
    # PyPDF2のPdfFileWriterオブジェクトを作成する
    pdf_writer = PyPDF2.PdfFileWriter()

    # PDFファイルを指定したページ数ごとに分割する
    for page in range(i, i + split_num):
        if page < pdf_reader.getNumPages():
            pdf_writer.addPage(pdf_reader.getPage(page))

    # 分割されたPDFファイルを保存する
    output_filename = output_folder + 'output_' + str(i) + '.pdf'
    with open(output_filename, 'wb') as output:
        pdf_writer.write(output)

# 分割が完了したら、開いたPDFファイルを閉じる
pdf_file.close()

このコードでは、example.pdfという名前のPDFファイルを5ページずつ分割し、/output/folder/というフォルダーに保存します。分割されたPDFファイルの名前は、output_0.pdfoutput_5.pdfoutput_10.pdf、…となります。

3. まとめ

PyPDF2を使用して、PythonでPDFファイルを分割する方法を紹介しました。このライブラリを使用することで、PDFファイルの編集が簡単にできるようになります。