MacでPDFをHTMLに変換しようと思い、いくつかのツールを試してみたところ、pdf2htmlEX
の変換精度がすごく良かったので使い方を紹介します。
pdf2htmlEXについて
https://github.com/coolwanglu/pdf2htmlEX | GitHub
インストールする
Homebrew
を使ってインストールします。
$ brew install pdf2htmlex
PDFをHTMLへ変換する
pdf2htmlex
コマンドを使います。引数には変換対象のPDFを指定します。
$ pdf2htmlex something.pdf
同じフォルダに同名のhtmlが生成されます。第二引数で生成先を指定することもできます。
$ pdf2htmlex something.pdf something.html
ヘルプを確認する
$ pdf2htmlex -h
以上です。