Qualcuno ha integrato BeautifulSoup con ASP.NET/C# (possibilmente utilizzando IronPython o altro)? Esiste un BeautifulSoup un'alternativa o una porta che funziona bene con ASP.NET/C#BeautifulSoup e ASP.NET/C#
L'intento di progettazione per utilizzare la libreria è quello di estrarre leggibile testo da qualsiasi URL casuale.
Grazie
Come userei H AP per raschiare il testo leggibile da una pagina HTML. In BeautifulSoup, è molto facile farlo. – user300981
Ho aggiornato la mia risposta –
DocumentNode.InnerText ottiene tutto il testo all'interno dei tag
. La mia preoccupazione è che devo supportare questo per gli URL che non seguono nessuno standard. Potrebbe esserci del gunk dappertutto. HAP è abbastanza intelligente da distinguere tra testo leggibile e tag HTML irrilevanti, commenti, script client – user300981