PythonでPDF編集をしてみよう

カテゴリ:Pythonの話

公開日:2020.07.31 最終更新日:2023.08.09
このエントリーをはてなブックマークに追加

こんにちは!今回はPythonを使ってPDFの編集を行っていきたいと思います。

また、弊社ではWebプロモーション成功事例集をまとめた限定資料を無料で配布しています。

Webマーケティングに興味がある方は、下記ページより目を通してみてください。

1.PDF編集ライブラリ

PythonでPDFを編集する場合、以下のようなライブラリが存在します。

PyPDF2
PDFページの操作、テキストの読み取りができるが日本語に対応していない
pdfminer.six日本語対応している。PDFファイルをテキストファイルに変換できる
Apache TikaエクセルやPDFなど様々なファイルからテキストを抽出できる
Tesseract OCROCRでPDFを認識し、請求書などをスキャナーで読み込むことができる


2.pythonでできること(ファイル操作)

pythonのライブラリを使うことで、既存PDFの結合・回転・コピー・重ね合わせやPDFファイルの新規作成も行うことができます。また、今回はPDFファイルについて紹介していますが、エクセルファイルについては、Pythonでマクロを組むことで自動化することもできます。

3.PDFファイルを編集してみよう

では、PyPDF2を使ってPDFファイルの結合をしてみましょう!(先にpipでPyPDF2をインストールしてあります。)

まずは、PythonのIDLEを開き新しファイルを作成します。あとは以下のようなコードを記述すればPDFファイルを結合することができます。

先ほどコードを記述したファイルは「merger_pdf.py」としておきます。そして、「pdf_files」というフォルダの中にいくつかPDFファイルを用意しておきましょう。

では、先ほど作成した「merge_pdf.py」をダブルクリックしてみましょう。すると、以下のように新しいPDFファイルが作成されました。

PDFファイルを確認すると、上から順にPDFファイルの結合ができてました!

またwebで集客する方法を別の記事にまとめております。

詳しく解説しているので、web集客について深く知りたい方は、ぜひこちらもご覧ください。

web集客
【2023年更新】Web集客の方法と種類を無料・有料別に紹介!
今回の記事を読むことで、Web集客をして、実際に売上を伸ばすための最適な方法をご紹介します。

4.さいごに

PDFファイルに関して、Pythonでできることは項目2でも述べたようにたくさんあります。PDFファイルはさまざまな場面で使用されるので、覚えておけば時間の節約にもつながるでしょう。例えば、「Tesseract OCR」を使いスキャンしたPDFファイルの整理を自動化することだってできます。このようにPythonにはメリットしかありません!どんどんPythonを使っていきましょう!






弊社inglowでは、これから広告の運用を考えられている方、あるいはこれから広告代理店に運用をお願いされる方向けに、「業界別Web広告の成功事例」をまとめた資料を無料配布しております。

下記のフォームに入力いただくだけで、無料で資料をダウンロードしていただけます。ぜひご利用下さい。

mihon

    このサイトはreCAPTCHAとGoogleによって保護されています。プライバシーポリシー利用規約が適用されます。

    一覧へ戻る