Pythonを使用すると、PDFファイルを読み取り、変更、作成できます。以下は、PythonでPDFファイルを扱う方法の例です。
PyPDF2のインストール
PyPDF2は、PythonでPDFを扱うための有用なライブラリです。PyPDF2をインストールするには、ターミナルまたはコマンドプロンプトで以下のコマンドを実行します。
pip install PyPDF2
PDFファイルの読み取り
以下のコードは、PythonでPDFファイルを読み取る方法を示しています。
import PyPDF2
# PDFファイルをバイナリモードで開く
pdf_file = open('example.pdf', 'rb')
# PDFリーダーを作成する
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# ページ数を取得する
num_pages = pdf_reader.getNumPages()
# 各ページを読み取る
for i in range(num_pages):
page = pdf_reader.getPage(i)
print(page.extractText())
# ファイルを閉じる
pdf_file.close()
PDFファイルの変更
以下のコードは、PythonでPDFファイルを変更する方法を示しています。この例では、PDFファイルの最初のページに新しいテキストを追加します。
import PyPDF2
# PDFファイルをバイナリモードで開く
pdf_file = open('example.pdf', 'rb')
# PDFリーダーを作成する
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# PDFライターを作成する
pdf_writer = PyPDF2.PdfFileWriter()
# 最初のページを取得する
page = pdf_reader.getPage(0)
# 新しいテキストを追加する
page.mergePage("Hello, World!")
# 新しいページをPDFライターに追加する
pdf_writer.addPage(page)
# 新しいPDFファイルを保存する
pdf_output = open('new_example.pdf', 'wb')
pdf_writer.write(pdf_output)
# ファイルを閉じる
pdf_file.close()
pdf_output.close()
PDFファイルの作成
以下のコードは、Pythonで新しいPDFファイルを作成する方法を示しています。この例では、空のPDFファイルを作成し、1ページ目に「Hello, World!」を追加します。
import PyPDF2
# PDFライターを作成する
pdf_writer = PyPDF2.PdfFileWriter()
# 新しいページを作成する
page = PyPDF2.pdf.PageObject.createBlankPage(None, 612, 792)
# 新しいテキストを追加する
page.mergeTranslatedPage("Hello, World!", 72, 720)
# 新しいページをPDFライターに追加する
pdf_writer.addPage(page)
# 新しいPDFファイルを保存する
pdf_output = open('new_file.pdf', 'wb')
pdf_writer.write(pdf_output)
# ファイルを閉じる
pdf_output.close()
これらは、PythonでPDFファイルを扱う方法の例です。他にも多くの方法があり、必要に応じて調べることができます。