2013-08-20 12 views
6

Ho bisogno di dividere il nome di dominio dall'intero campo dell'URL. Ho memorizzato l'url in variabile e da quella variabile ho bisogno di dividere solo il nome di dominio usando Python. Ad esempio http://www.google.com/ qui voglio dividere solo google dall'intero URL.Estrarre il nome di dominio dall'URL

+6

Cosa hai provato? Questo dovrebbe essere un google abbastanza semplice se non hai fatto nulla. –

+1

Non è un duplicato di: http://stackoverflow.com/questions/1066933/how-to-extract-domain-name-from-url?rq=1? – OldTinfoil

risposta

6

Prova urlparse:

>>> from urlparse import urlparse 
>>> urlparse('http://www.google.com/').hostname 
'www.google.com' 
>>> urlparse('http://www.google.com/').hostname.split('.')[1] 
'google' 

Inoltre, vedere i commenti utili su come le cose possono andare se si dispone di un nome di dominio complicato con sottodomini - (solo hostname.split('.')[1] non funzionerà).

Vedi anche:

+1

Questo è troppo semplicistico. E se qualcuno avesse l'url: "uk.store.myawesomeshop.com.au"? – OldTinfoil

+0

Sì, buon punto, ma in questo caso non è ovvio, quale parte del dominio è necessario. 'Uk'? 'Store'? ... – alecxe

+2

@alecxe Credo che il risultato desolante sarebbe 'myawesomeshop' –

Problemi correlati