PyPDF2はPythonでPDFファイルを編集するためのライブラリであり、PDFファイルの作成、結合、分割、テキストの抽出などの機能を提供しています。今回はPyPDF2を使用して、PDFファイルを分割する方法を紹介します。
1. PyPDF2のインストール
まずはPyPDF2をインストールしましょう。以下のコマンドを実行してください。
pip install PyPDF2
2. PDFファイルを分割する方法
以下のコードを使用して、PDFファイルを指定したページ数ごとに分割することができます。
import PyPDF2
# 分割するPDFファイルを開く
pdf_file = open('example.pdf', 'rb')
# PyPDF2のPdfFileReaderオブジェクトを作成する
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 分割されたPDFファイルの保存先フォルダーを指定する
output_folder = '/output/folder/'
# 分割するページ数
split_num = 5
# PDFファイルを分割する
for i in range(0, pdf_reader.getNumPages(), split_num):
# PyPDF2のPdfFileWriterオブジェクトを作成する
pdf_writer = PyPDF2.PdfFileWriter()
# PDFファイルを指定したページ数ごとに分割する
for page in range(i, i + split_num):
if page < pdf_reader.getNumPages():
pdf_writer.addPage(pdf_reader.getPage(page))
# 分割されたPDFファイルを保存する
output_filename = output_folder + 'output_' + str(i) + '.pdf'
with open(output_filename, 'wb') as output:
pdf_writer.write(output)
# 分割が完了したら、開いたPDFファイルを閉じる
pdf_file.close()
このコードでは、example.pdfという名前のPDFファイルを5ページずつ分割し、/output/folder/というフォルダーに保存します。分割されたPDFファイルの名前は、output_0.pdf、output_5.pdf、output_10.pdf、…となります。
3. まとめ
PyPDF2を使用して、PythonでPDFファイルを分割する方法を紹介しました。このライブラリを使用することで、PDFファイルの編集が簡単にできるようになります。