1.全角スペースが半角スペースで認識される
・全角が表示されないときは”cmapsの設定が必要”という記事を見つけたのでためしてみた
2.cmapsのdownload
# wget https://github.com/mozilla/pdf.js/releases/download/v2.13.216/pdfjs-2.13.216-legacy-dist.zip # unzip pdfjs-2.13.216-legacy-dist.zip # cd web # ls -l total 2896 drwxrwxr-x 2 root root 12288 Feb 27 19:05 cmaps -rw-r--r-- 1 root root 1016315 Nov 3 2016 compressed.tracemonkey-pldi-09.pdf -rw-r--r-- 1 root root 19355 Nov 28 14:46 debugger.js drwxrwxr-x 2 root root 4096 Feb 27 19:05 images drwxrwxr-x 111 root root 4096 Feb 27 19:05 locale drwxrwxr-x 2 root root 4096 Feb 27 19:05 standard_fonts -rw-r--r-- 1 root root 64602 Feb 27 19:04 viewer.css -rw-r--r-- 1 root root 22463 Feb 27 19:04 viewer.html -rw-r--r-- 1 root root 751414 Feb 27 19:05 viewer.js -rw-r--r-- 1 root root 1052853 Feb 27 19:05 viewer.js.map standard_fonts viewer.js #
3.lib/ ディレクトリにcmapsをcopy
4.”cMapUrl” と “cMapPacked” を追加
                const data = await this.API.readFileBinary(file);
                const PDFJS = window.pdfjsLib;
                PDFJS.GlobalWorkerOptions.workerSrc = '../lib/pdf.worker.js';
                loadingTask = PDFJS.getDocument({
                                "data"          : data,
                                "cMapUrl"       : '../lib/cmaps/',
                                "cMapPacked"    : true
                         });
                loadingTask.promise.then( (pdf) => {
                        this.API.analysisPdfText(pdf, file);
                });
5.ダメだった
・全角スペースは半角スペースで認識
以上