1.全角スペースが半角スペースで認識される
・全角が表示されないときは”cmapsの設定が必要”という記事を見つけたのでためしてみた
2.cmapsのdownload
# wget https://github.com/mozilla/pdf.js/releases/download/v2.13.216/pdfjs-2.13.216-legacy-dist.zip # unzip pdfjs-2.13.216-legacy-dist.zip # cd web # ls -l total 2896 drwxrwxr-x 2 root root 12288 Feb 27 19:05 cmaps -rw-r--r-- 1 root root 1016315 Nov 3 2016 compressed.tracemonkey-pldi-09.pdf -rw-r--r-- 1 root root 19355 Nov 28 14:46 debugger.js drwxrwxr-x 2 root root 4096 Feb 27 19:05 images drwxrwxr-x 111 root root 4096 Feb 27 19:05 locale drwxrwxr-x 2 root root 4096 Feb 27 19:05 standard_fonts -rw-r--r-- 1 root root 64602 Feb 27 19:04 viewer.css -rw-r--r-- 1 root root 22463 Feb 27 19:04 viewer.html -rw-r--r-- 1 root root 751414 Feb 27 19:05 viewer.js -rw-r--r-- 1 root root 1052853 Feb 27 19:05 viewer.js.map standard_fonts viewer.js #
3.lib/ ディレクトリにcmapsをcopy
4.”cMapUrl” と “cMapPacked” を追加
const data = await this.API.readFileBinary(file); const PDFJS = window.pdfjsLib; PDFJS.GlobalWorkerOptions.workerSrc = '../lib/pdf.worker.js'; loadingTask = PDFJS.getDocument({ "data" : data, "cMapUrl" : '../lib/cmaps/', "cMapPacked" : true }); loadingTask.promise.then( (pdf) => { this.API.analysisPdfText(pdf, file); });
5.ダメだった
・全角スペースは半角スペースで認識
以上