Sto recuperando this page con this request library in Node.JS e analizzando il corpo utilizzando cheerio.Codifica scrape Node.JS?
Calling $.html()
sul corpo della risposta analizzato rivela che l'attributo titolo per la pagina è:
<title>Le Relais de l'Entrec?te</title>
... quando dovrebbe essere:
<title>Le Relais de l'Entrecôte</title>
Ho provato a installare le opzioni per la libreria richiesta includere encoding: 'utf8'
, ma ciò non sembra cambiare nulla.
Come conservare questi caratteri?
cheerio potrebbe anche solo esporre [questo bug] (https://github.com/cheeriojs/cheerio/issues/548), il quale emette in modo errato determinati caratteri in determinate situazioni –