PythonでPDF編集をしてみよう
カテゴリ:Pythonの話
こんにちは!今回はPythonを使ってPDFの編集を行っていきたいと思います。
また、弊社ではWebプロモーション成功事例集をまとめた限定資料を無料で配布しています。
Webマーケティングに興味がある方は、下記ページより目を通してみてください。
1.PDF編集ライブラリ
PythonでPDFを編集する場合、以下のようなライブラリが存在します。
PyPDF2 | PDFページの操作、テキストの読み取りができるが日本語に対応していない |
pdfminer.six | 日本語対応している。PDFファイルをテキストファイルに変換できる |
Apache Tika | エクセルやPDFなど様々なファイルからテキストを抽出できる |
Tesseract OCR | OCRでPDFを認識し、請求書などをスキャナーで読み込むことができる |
2.pythonでできること(ファイル操作)
pythonのライブラリを使うことで、既存PDFの結合・回転・コピー・重ね合わせやPDFファイルの新規作成も行うことができます。また、今回はPDFファイルについて紹介していますが、エクセルファイルについては、Pythonでマクロを組むことで自動化することもできます。
3.PDFファイルを編集してみよう
では、PyPDF2を使ってPDFファイルの結合をしてみましょう!(先にpipでPyPDF2をインストールしてあります。)
まずは、PythonのIDLEを開き新しファイルを作成します。あとは以下のようなコードを記述すればPDFファイルを結合することができます。
先ほどコードを記述したファイルは「merger_pdf.py」としておきます。そして、「pdf_files」というフォルダの中にいくつかPDFファイルを用意しておきましょう。
では、先ほど作成した「merge_pdf.py」をダブルクリックしてみましょう。すると、以下のように新しいPDFファイルが作成されました。
PDFファイルを確認すると、上から順にPDFファイルの結合ができてました!
またwebで集客する方法を別の記事にまとめております。
詳しく解説しているので、web集客について深く知りたい方は、ぜひこちらもご覧ください。
4.さいごに
PDFファイルに関して、Pythonでできることは項目2でも述べたようにたくさんあります。PDFファイルはさまざまな場面で使用されるので、覚えておけば時間の節約にもつながるでしょう。例えば、「Tesseract OCR」を使いスキャンしたPDFファイルの整理を自動化することだってできます。このようにPythonにはメリットしかありません!どんどんPythonを使っていきましょう!
弊社inglowでは、これから広告の運用を考えられている方、あるいはこれから広告代理店に運用をお願いされる方向けに、「業界別Web広告の成功事例」をまとめた資料を無料配布しております。
下記のフォームに入力いただくだけで、無料で資料をダウンロードしていただけます。ぜひご利用下さい。