pdftohtml は,xpdf を基に開発されているため,xpdf の Language Support Packages が使える.
これを利用して,pdftohtml で日本語を表示させる.
日本語の Language Support Packages
% tar -zxvf pdftohtml_0_38.tar.gz
% cd pdftohtml_0_38
% make
# cp src/pdftohtml /usr/local/bin
- Language Support Packages のインストール
% tar -zxvf xpdf-japanese.tar.gz
% cd xpdf-japanese
# mkdir -p /usr/local/share/xpdf/japanese
# cp -R *.unicodeMap *.cidToUnicode CMap /usr/local/share/xpdf/japanese
# cat add-to-xpdfrc >> /usr/local/etc/xpdfrc
% pdftohtml -enc EUC-JP [pdf]
で日本語のファイルを扱える.