He leído en otro lugar ( Lectura de archivos PDF usando javascript ) cómo leer los textos en un archivo pdf y mostrarlos en la consola. Esto se hace usando el siguiente código:
var PdfReader = require("pdfreader").PdfReader; new PdfReader().parseFileItems("sample.pdf", function(err, item){ if (item && item.text) console.log(item.text); });
Mi pregunta es, en lugar de mostrar los textos en la consola usando console.log, ¿cómo los almaceno en una matriz para usarlos en una etapa posterior del script?
Inicialice una matriz sobre la función de análisis, luego envíe los elementos a la matriz:
var PdfReader = require("pdfreader").PdfReader; var arr = []; new PdfReader().parseFileItems("sample.pdf", function(err, item){ if (item && item.text){ arr.push(item.text); } }); console.log(arr);