estoy descubriendo titiritero. Quiero desechar algunos datos con él, pero esta URL devuelve un valor nulo en querySelector. Intenté hacer una captura de pantalla de la página, error: no está autorizado para acceder a este contenido. Traté de configurar el agente de especificación, pero no funciona. Probé algunas soluciones en stackoverflow, pero ninguna funcionó. aquí está mi código.
const puppeteer = require("puppeteer"); const url = "https://www.cdiscount.com/juniors/lego/lego-star-wars-75192-millennium-falcon-ultimate/f-1202809-leg5702015869935.html?idOffre=1218498437#mpos=0|mp"; async function start() { const browser = await puppeteer.launch(); //test the userAgent //console.log(await browser.userAgent()); const page = await browser.newPage(); await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) HeadlessChrome/100.0.4889.0 Safari/537.36'); await page.goto(url); await page.screenshot({path: 'headless-test-result.png'}); let data = await page.evaluate(() => { return document.querySelector("span[itemprop=price]").innerText; }); console.log("the price is " + data); await browser.close(); }start()
Aquí está el código con un enlace de ejemplo que no funciona.