Skip to content

Instantly share code, notes, and snippets.

@aminophen
Forked from zr-tex8r/tcpdfcrop.bat
Last active August 14, 2019 03:02
Show Gist options
  • Save aminophen/fdc3dfa320d9f0c32aeb to your computer and use it in GitHub Desktop.
Save aminophen/fdc3dfa320d9f0c32aeb to your computer and use it in GitHub Desktop.
ZR氏による「バッチで作る、劣化版pdfcrop」の改善版
@echo off
echo tcpdfcrop v0.9.4 (2015-08-06)
setlocal
if /I "%~1"=="/h" (
set BBOX=HiResBoundingBox
shift
) else (
set BBOX=BoundingBox
)
set FROMDIR=%~dp1
set FROM=%~n1
set TODIR=%~dp2
set TO=%~n2
set RANGE=%~3
set TPX=_tcpc
set CROPTEMP=croptemp
if "%FROM%"=="" (
echo Usage: tcpdfcrop [/h] in.pdf [out.pdf] [page-range] [left-margin] [top-margin] [right-margin] [bottom-margin]
echo Option /h uses HiResBoundingBox instead of BoundingBox.
)
if not exist "%FROMDIR%%FROM%.pdf" exit /B
if not "%TEMP%"=="" cd "%TEMP%"
copy "%FROMDIR%%FROM%.pdf" "%CROPTEMP%.pdf" 1>nul
if "%TO%"=="" set TO=%FROM%-crop
if "%TODIR%"=="" set TODIR=%FROMDIR%
if "%TODIR%%TO%"=="%FROMDIR%%FROM%" set TO=%FROM%-crop
if exist "%TODIR%%TO%.pdf" del "%TODIR%%TO%.pdf"
if exist "%TODIR%%TO%.pdf" exit /B
extractbb "%CROPTEMP%.pdf"
type "%CROPTEMP%.xbb" | find "%%Pages: " > "%CROPTEMP%-pages.txt"
set /P NUM=<"%CROPTEMP%-pages.txt"
set NUM=%NUM:* =%
type "%CROPTEMP%.xbb" | find "%%PDFVersion: " > "%CROPTEMP%-version.txt"
set /P VERSION=<"%CROPTEMP%-version.txt"
set VERSION=%VERSION:*.=%
del "%CROPTEMP%.xbb" "%CROPTEMP%-pages.txt" "%CROPTEMP%-version.txt"
for /F "tokens=1,2 delims=-" %%m in ("%RANGE%") do (
set FIRST=%%m
set LAST=%%n
)
if "%FIRST%"=="" set FIRST=1
if "%FIRST%"=="*" set FIRST=1
if "%LAST%"=="" (
if "%RANGE%"=="" (
set LAST=%NUM%
) else (
set LAST=%FIRST%
)
)
if "%LAST%"=="*" set LAST=%NUM%
set LMARGIN=%~4
set TMARGIN=%~5
set RMARGIN=%~6
set BMARGIN=%~7
if "%LMARGIN%"=="" set LMARGIN=0
if "%TMARGIN%"=="" set TMARGIN=0
if "%RMARGIN%"=="" set RMARGIN=0
if "%BMARGIN%"=="" set BMARGIN=0
echo \pdfoutput=1 >%TPX%n.tex
echo \pdfminorversion=%VERSION% >>%TPX%n.tex
for /L %%i in (%FIRST%,1,%LAST%) do (
rungs -dBATCH -dNOPAUSE -q -sDEVICE=bbox -dFirstPage=%%i -dLastPage=%%i "%CROPTEMP%.pdf" 2>&1 | find "%%%BBOX%: " >%TPX%%%i.tex
echo {\catcode37=13 \catcode13=12 \def^^^^25^^^^25#1: #2^^^^M{\gdef\do{\proc[#2]}}\input %TPX%%%i.tex\relax}{}^
\def\proc[#1 #2 #3 #4]{\pdfhorigin-#1bp \pdfvorigin#2bp \pdfpagewidth=\dimexpr#3bp-#1bp\relax\pdfpageheight\dimexpr#4bp-#2bp\relax}\do^
\advance\pdfhorigin by %LMARGIN%bp\relax \advance\pdfpagewidth by %LMARGIN%bp\relax \advance\pdfpagewidth by %RMARGIN%bp\relax^
\advance\pdfvorigin by -%BMARGIN%bp\relax \advance\pdfpageheight by %BMARGIN%bp\relax \advance\pdfpageheight by %TMARGIN%bp\relax^
\setbox0=\hbox{\pdfximage page %%i mediabox{%CROPTEMP%.pdf}\pdfrefximage\pdflastximage}^
\ht0=\pdfpageheight \shipout\box0\relax >>%TPX%n.tex
)
echo \end >>%TPX%n.tex
pdftex -no-shell-escape -interaction=batchmode %TPX%n.tex 1>nul
for /L %%i in (%FIRST%,1,%LAST%) do del %TPX%%%i.tex
del %TPX%n.tex %TPX%n.log %CROPTEMP%.pdf
if not exist %TPX%n.pdf exit /B
move "%TPX%n.pdf" "%TODIR%%TO%.pdf" 1>nul
echo ==^> %FIRST%-%LAST% page(s) written on "%TODIR%%TO%.pdf".
@aminophen
Copy link
Author

ページ範囲指定を v0.8 で実装。第三引数で開始ページと終了ページをハイフンで結んで指定する。アスタリスクを使えば「最後まで」「最初から」を指定できるはず。

  • tcpdfcrop in.pdf out.pdf 3-10 : 3 ページ目から 10 ページ目までを処理
  • tcpdfcrop in.pdf out.pdf 3-* : 3 ページ目から(最後まで)を処理
  • tcpdfcrop in.pdf out.pdf *-10 : (最初から)10 ページ目までを処理
  • tcpdfcrop in.pdf out.pdf 3 : 3 ページ目のみを処理

この機能はオリジナルの Perl スクリプトには存在せず、本バッチファイルの有利な点となった。このため TeX Live ユーザにも一定の有用性が見込めると判断し、従来は Perl なしの W32TeX での利用を仮定して gswin32c 固定だったものを、両方で利用可能な rungs に変更した。

なお、v0.6 で余白処理を追加した際に入ったバグを修正(余白にあたる引数が空白の場合に出る ! Missing number, treated as zero. なるエラーを回避する初歩的なハンドリングが不足していた…)。

@doraTeX
Copy link

doraTeX commented Mar 24, 2015

すみません,

type "%FROM%.xbb" | find "Pages" > "%FROM%-pages.txt"

だとファイル名に Pages という単語が入っている場合に失敗しますね。

type "%FROM%.xbb" | find "%%Pages: " > "%FROM%-pages.txt"

とすべきでした。

@aminophen
Copy link
Author

ファイル名に Pages という単語が入っている場合に失敗

修正しました (v0.8.1) 。

@aminophen
Copy link
Author

本家 Perl スクリプト版はデフォルトで元の PDF version を保持するので、その仕様に合わせた (v0.8.2) 。これで、クロップすると PDF version が勝手に上がってしまって画像が使えなくなる可能性を排除。

ちなみにこの変更 (v0.8.2) により、多くの場合で従来の v0.8.1 に比べて低い PDF version で出力されるはず。このとき、高い version に比べてファイルサイズが大きくなるのは(たぶん)仕様。

@aminophen
Copy link
Author

aminophen commented Mar 31, 2015

v0.8.2 以前は HiResBoundingBox を使っていたが、オリジナルの Perl スクリプトはデフォルトで BoundingBox を使っている(つまり hires ではない)ので、微妙に余白の付き方が異なっていた。v0.9 で tcpdfcrop.bat のデフォルトを変更してオリジナルに統一。とりあえず従来版 (v0.8.2) を tcpdfcrophires.bat として残した。

# これ以上のオプション実装は Windows バッチファイルでは難しいので、別々のバッチファイルにしてみた。

@aminophen
Copy link
Author

v0.9.1 で、一時ファイルを環境変数 TEMP で指定されたフォルダ内に生成するようにした。これに伴い「ファイル名に Shift_JIS のダメ文字が入っていると不可」という問題も解消。

今気づいている点・制限事項 (v0.9.2) :

  • 引数の指定の仕方が異なる
  • 余白以外のオプションは本家 Perl スクリプトと違って変更できない
  • 空白ページが含まる場合の扱いが異なる(本家 Perl スクリプト版は元のサイズを維持して取り込むが、バッチファイル版は横幅のみ維持して縦幅は 1 mm になる) → bcpdfcrop v0.1.3 と v0.1.9 で解消。
  • 本家 Perl スクリプト版とバッチファイル版で同じ PDF を処理すると、なぜか僕のバッチファイルで作った方がファイルサイズが小さくなる(ただし、Perl 版のほうが処理は高速)

@doraTeX
Copy link

doraTeX commented Jul 19, 2015

ノーマル版とHiRes版に分かれているのは,オプションで統合してはいかがでしょう。
setlocal の直後に

if /I "%1"=="/h" (
  set BBOX=HiResBoundingBox
  shift
) else (
  set BBOX=BoundingBox
)

として,BBを find する部分を

find "%%%BBOX%: "

としておけば,

Usage: tcpdfcrop [/h] in.pdf [out.pdf] [page-range] [left-margin] [top-margin] [right-margin] [bottom-margin]

と,/h オプションでHiRes版とノーマル版を切り替えることができるのではないかと思います。

@aminophen
Copy link
Author

/h オプションでHiRes版とノーマル版を切り替える

早速取り込んで v0.9.3 としました。ついでにインデントを統一しました。

@aminophen
Copy link
Author

複数ページ処理時に従来は単一のファイルに出力するようにしていたが、内部処理を変更して /s オプションで各ページを単一ページ PDF としてバラバラに出力できるようにした。その結果として tc らしさがなくなったので(\catcode がなくなった笑)、別途 bcpdfcrop.bat として GitHub にて公開。

というわけで、tcpdfcrop.bat は現状では frozen とします。

@aminophen
Copy link
Author

いったん開発終了したつもりでいたが、/h オプションを追加した時点でダブルクオーテーションを除去して展開するのを忘れていて、tcpdfcrop v0.9.3 は正常に動かない場合があることに気づいた。バグがあるまま残しておくのもどうかと思ったので、急遽 v0.9.4 で修正。

tcpdfcrop は“TeX 藝人”的にはおもしろいはずなのでこのまま残しておく。ただし、バグ修正程度しかしない予定(tcpdfcrop はエラーハンドリングが甘い簡易版くらいの位置づけで…)。bcpdfcrop が充実してきたのでそちらをどうぞ。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment