mi è stato dato un url e voglio per estrarre il contenuto del tag <BODY>
dall'URL. Sto usando Python3. Mi sono imbattuto in sgmllib
ma non è disponibile per Python3.tag html analisi con Python
Qualcuno può guidarmi per favore con questo? Posso usare HTMLParser
per questo?
Ecco quello che ho provato:
import urllib.request
f=urllib.request.urlopen("URL")
s=f.read()
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
print("Encountered some data:", data)
parser = MyHTMLParser()
parser.feed(s)
questo mi dà errore: TypeError: Impossibile convertire oggetto 'byte' a str implicitamente
"per favore guidami": lo farà. Ricerca. È stato chiesto Molte, molte volte. Dopo aver effettuato la ricerca (nell'angolo in alto a destra), sentiti libero di porre ** domande ** specifiche in base alle risposte già fornite. –
per essere specifici possiamo analizzare url nel metodo parser.feed()? – Nerd
@ghbhatt: mostraci un esempio di ciò che ti serve. Altrimenti vedi la mia risposta è questo che stai chiedendo. – RanRag