2012-01-14 12 views

risposta

23

EDIT

Facebook ha mostrato un po 'di amore e sta ora facendo il blocco IP pubblico per chiunque di avere

http://developers.facebook.com/docs/ApplicationSecurity/#facebook_scraper https://developers.facebook.com/docs/sharing/best-practices#crawl

Facebook raschietto

Un numero o f I servizi della piattaforma come i social plugin e il grafico Open richiedono che i nostri sistemi siano in grado di raggiungere le tue pagine web. Noi riconosciamo che ci sono situazioni in cui potresti non voler queste pagine su Internet pubblico, durante i test o per altri motivi di sicurezza .

Per facilitare questo, si dovrebbe fare delle eccezioni nella vostra sicurezza sistemi per consentire Facebook per raschiare queste pagine aggiungendo le seguenti intervalli IP, preciso come di aprile 2012.

31.13.24.0/21 
31.13.64.0/18 
66.220.144.0/20 
69.63.176.0/20 
69.171.224.0/19 
74.119.76.0/22 
103.4.96.0/22 
173.252.64.0/18 
204.15.20.0/22 

Invece di IP, puoi anche utilizzare l'agente utente per il tuo firewall.

http://developers.facebook.com/docs/reference/plugins/like/

Quando ha Facebook raschiare la mia pagina?

Facebook ha la necessità di raschiare la pagina per sapere come visualizzare intorno sito.

Facebook scava la pagina ogni 24 ore per garantire che le proprietà siano aggiornate a . La pagina viene inoltre raschiata quando un amministratore per la pagina Apri grafico fa clic sul pulsante Mi piace e quando l'URL viene inserito nell'Ilenco URL Facebook . Facebook osserva le intestazioni della cache sui tuoi URL: lo guarderà "Scadenza" e "Controllo della cache" in ordine di preferenza. Tuttavia, anche se si specifica un tempo più lungo, Facebook analizzerà la tua pagina ogni 24 ore.

L'agente utente del raschietto è: "facebookexternalhit/1.1 (+ http://www.facebook.com/externalhit_uatext.php)"

+0

Facebook ha appena rilasciato alcune informazioni in merito. L'ho aggiunto alla mia risposta. – DMCS

0

Facebook non pubblica la loro gamma indirizzo sorgente crawler ufficialmente, ma si può guardare la lista di tutti i loro intervalli di indirizzi IP nella tabella di routing BGP a disposizione del pubblico:

momento stiamo usando questa lista:

  • 69.171.224.0/19
  • 74.119.76.0/22 ​​
  • 204.15.20.0/22 ​​
  • 66.220.144.0/20
  • 69.63.176.0/20
  • 173.252.64.0/18
2
  • 66.220.144.0/20

  • 66.220.144.0/21

  • 66.220.152.0/21
  • 66.220.159.0/24
  • 69.63.176.0/20

  • 69.63.176.0/21

  • 69.63.176.0/24

  • 69.63.184.0/21

  • 69.171.224.0/19

  • 69.171.224.0/20
  • 69.171.239.0/24
  • 69.171.240.0/20
  • 69.171.255.0/24
  • 74.119.76.0/22 ​​
  • 103.4.96.0/22 ​​
  • 173.252.64.0/18
  • 173.252.64.0/19
  • 173.252.70.0/24
  • 173.252.96.0/19
  • 204.15.20.0/22 ​​

  • 31.13.24.0/21

  • 31.13.64.0/18
  • 31.13.64.0/19
  • 31.13.64.0/24
  • 31.13.65.0/24
  • 31.13.66.0/24
  • 31.13.67.0/24
  • 31.13.68.0/24
  • 31.13.69.0/24
  • 31.13.70.0/24
  • 31.13.71.0/24
  • 31.13.72.0/24
  • 31.13.73.0/24
  • 31.13.74.0/ 24
  • 31.13.75.0/24
  • 31.13.76.0/24
  • 31.13.77.0/24
  • 31.13.96.0/19
+1

+1 per una risposta significativa con solo [0-9. \/\ S] –

+1

Puoi specificare dove hai ottenuto questi dati? – AndrewF

+0

Questi sono i percorsi che Facebook pubblicizza su Internet ed è stata precisa la data del post. FB non è entusiasta dell'assegnazione di destinatari statici per sempre ai propri VIP esterni come questo e in genere i clienti devono semplicemente consentire tutto lo spazio degli indirizzi per assicurarsi che, se/quando aggiungono un nuovo VIP dal proprio pool di indirizzi ipv4, possano connettersi ad esso. Questo ovviamente significa che se Facebook inizia a pubblicizzare un nuovo spazio IPv4 che questo elenco non sarà aggiornato. –

1

Facebook ora pubblica il proprio IP range.

A partire da aprile 2012, è:

31.13.24.0/21 
31.13.64.0/18 
66.220.144.0/20 
69.63.176.0/20 
69.171.224.0/19 
74.119.76.0/22 
103.4.96.0/22 
173.252.64.0/18 
204.15.20.0/22 
2

whois -h whois.radb.net -- '-i origin AS32934' | grep ^route per vedere tutte le gamme.

+2

Qual è il comando in Windows? – PussInBoots

1

Le nuove informazioni sono elencate al seguente URL & sì, hanno queste informazioni pubbliche.

Esegui questo comando per ottenere una lista aggiornata di indirizzi IP crawler usi.

whois -h whois.radb.net -- '-i origin AS32934' | grep ^route 

Come

# For example only - over 100 in total 
31.13.24.0/21 
66.220.144.0/20  
2401:db00::/32 
2620:0:1c00::/40 
2a03:2880::/32 

Quindi sì, quelli citati da DMCS, stand corretta. Volevo solo verificare che & trovasse queste informazioni.

Grazie

Problemi correlati