SSブログ

pdf2image [Python]

PDFファイルを1ページずつ画像にするライブラリ
https://pypi.org/project/pdf2image/

poppler っていうコマンドのフロントエンドなので 別途 poppler をインストールする必要がある。
ubuntu の場合
apt install poppler-utils poppler-data

としておけば良さそう

poppler は、Linux デスクトップの PDF のプレビューに使われているものらしく素性は良さそう。
https://ja.wikipedia.org/wiki/Poppler

各ページを jpeg にして保存する場合の例
from pdf2image import convert_from_path
for i, image in convert_from_path('example.pdf').enumerate():
    image.save(f'{i}.jpg', "JPEG")

convert_from_path(パス名) や convert_from_bytes(バイナリデータ) で、 Pillow の Image オブジェクトのリストを返す
コメント(0) 
共通テーマ:日記・雑感

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

Facebook コメント