それマグで!

知識はカップより、マグでゆっくり頂きます。 takuya_1stのブログ

習慣に早くから配慮した者は、 おそらく人生の実りも大きい。

pdf を convert コマンドで分割し画像化すると劣化する

image magick の convert コマンドでpdf を画像化したら劣化

convert コマンドで分割すると、画像が汚くなって品質が落ちた。これは困る。

poor image quality で検索したら、 -density や-colorspace を使えとかいてあった。

PDF to JPG is of bad quality - ImageMagick

これで、解決する。

実際にやってみた

劣化したやつ

takuya@rena:~/Desktop$ convert  /Users/takuya/Desktop/image.pdf dest*.png
takuya@rena:~/Desktop$ ls -alt dest\*-*
-rw-r--r-- 1 takuya staff  87802  9 17 04:33 dest*-0.png
-rw-r--r-- 1 takuya staff 110603  9 17 04:33 dest*-1.png

ましになったもの

takuya@rena:~/Desktop$ convert -density 400 /Users/takuya/Desktop/image.pdf dest*.png
takuya@rena:~/Desktop$ ls -alt dest\*-*
-rw-r--r-- 1 takuya staff 835813  9 17 04:28 dest*-1.png
-rw-r--r-- 1 takuya staff 642617  9 17 04:28 dest*-0.png

更にましになったもの

takuya@rena:~/Desktop$ convert -density 400 -colorspace RGB /Users/takuya/Desktop/image.pdf dest*.png
takuya@rena:~/Desktop$ ls -alt dest\*-*
-rw-r--r-- 1 takuya staff 1858642  9 17 04:29 dest*-1.png
-rw-r--r-- 1 takuya staff 1298530  9 17 04:29 dest*-0.png

画像を取り出すだけならpdfimageコマンド

スキャナでスキャンしたPDFファイルはJPEGが埋まっているだけなので、pdfimage で取り出すのが鉄板。

takuya@rena:~/Desktop$ pdfimages -j image.pdf out
takuya@rena:~/Desktop$ ls -lt out*.jpg
-rw-r--r-- 1 takuya staff 103072  9 17 04:32 out-0000.jpg
-rw-r--r-- 1 takuya staff 102290  9 17 04:32 out-0001.jpg

注意点 2016-05-12 追記

convert -density 300 input.pdf

density は入力ファイルの前につけること。

スキャンPDFファイル中の画像を取り出し分解する。pdfimageコマンド - それマグで!