Skip to content

Instantly share code, notes, and snippets.

@kachick
Last active February 13, 2022 20:02
Show Gist options
  • Save kachick/8521699 to your computer and use it in GitHub Desktop.
Save kachick/8521699 to your computer and use it in GitHub Desktop.
電子書籍300冊程度自炊した時点での解像度・ファイルフォーマット方針

個人の感想

書籍(文字中心)

  • 300dpでもあんま気にならない。が、技術書(2500~8000円程度?)中心だと総じてコミック(400~1500円程度?)に比べて高価なのでこっちをケチるのもなんだかなーという気はしてしまう。
  • JPEGだと文字のにじみが目立つ
  • 可逆圧縮が効きやすい(サイズがJPEG比で、256色だと1.6~1.7倍程度。16色だと0.8倍程度)
  • 2色しか目立たない様な書籍でも、モノクロスキャンだと違和感を感じる(なんで?濃度?)
  • 白黒だと省かれるみたいだけど、グレースケールだと紙質(ざらざらとか)がそのまま暗さとして反映されたりするっぽい 裏面だけ暗くなったりとか謎の症状発生するんで、よっぽど良質な紙で無ければ下地追従有効にしたほうがよさげ 読みやすくなるし、圧縮もききやすくなる(無効時は16色PNGへの変換で逆に1.5倍へ増加。有効時は普通に半減。元のサイズ自体も2/3ぐらいになる)
  • 輪郭強調も微妙。ぱっと見読みやすくなるような気もするけど、文字の外と中とでトーンの差が出来てしまうのがまだらっぽくて気持ち悪い気もする。

結論

  • 300dpi
  • 16色PNG (256色でも十分許容範囲内のサイズに収まるけど、そもそも文字中心書籍で256色欲しいと感じるものはあんまない。減色すればJPEGへ全方位で優る)

サンプルとして、The RSpec Book (日本語版) を256色グレースケールでスキャン

  • JPEGだと148MB
  • LZW圧縮下でのTIFFが250MB。
    このTIFFをpngquantで16色まで減色したPNGが124MB

注記

  • ・・・ということで最終的に16色PNGへもっていきたいが、減色処理には時間がかかる。 文字中心だと可逆圧縮も十分利くし、可逆圧縮状態で保持しておけば好きなときに減色はできる。
    なので、JPEGを忌避しつつスムーズにスキャン作業進めるなら、とりあえず可逆圧縮でパカスカ貯めこんどく方がいい。 グレースケールのデータで下地追従になってれば、可逆圧縮でも16色PNGの2倍程度におさまったりする ただ、多色刷りをフルカラーで取り込んだようなものは減色しないと大幅(20倍とか)に膨らむ(すれば縮む)ので、さっさとやってしまった方がいい。 本当に色数が必要なようなばあいは、256色PNGかフルカラーJPEGで

  • スキャナの地色飛ばしはやっぱ不安定なのでImageMagickでなんとか・・・となった時に、コミックとおなじ感覚だと無理があった。 TeamGeekでちょっと試した限り、「convert -level "20%,90%"」 ぐらいがよさげ


コミック

  • 300dpiだと辛い(トーンでの表現が大きく抜け落ちる)
  • JPEGでの劣化があまり気にならない
  • 可逆圧縮が効きにくい(サイズがJPEG比で256色だと4倍程度。16色だと1.2倍程度)

結論

  • 600dpi
  • 256色JPEGか、16色PNG (この2つの差がほとんど判別付かない・・・)。とりあえず、トーン使ってないマンガ(カラスヤさんとか)だったらPNGにする

画像処理

  • 書籍同様、コミックの大半で紙質がイマイチ。 が、スキャナで地色除去やカラークリーンナップかけると処理結果が雑過ぎる。かといって細かい調整かけられるわけでもないので、その辺の処理はすべて無効にしてグレースケールかカラーで取り込んでおき、あとでまとめて画像処理かけたほうが無難。 今のとこ、コミックに対してはグレースケール取り込み後にImageMagickで次の処理かけるのが好み。これだけの処理なら速度も早い。
convert -modulate 130 -contrast -contrast before.jpg after.jpg
mogrify -modulate 130 -contrast -contrast

-modulateで落ちたコントラストを、後から強制的に戻しているような感じ?気持ち悪いっちゃ悪い +contrastで低減、-contrastで加えるっていうのがいつも間違えそうになる

書籍同様 level指定でもよさげで、この時は20~25と90ぐらいが丁度いい感じ

convert -level "20%,90%" before.jpg after.jpg
convert -level "25%,90%" before.jpg after.jpg
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment