PDFからのデータ抽出と言えばゴーストスクリプト使うのが一般的ちゃうん