Non voglio che i motori di ricerca indicizzino la mia pagina di stampa. Come potrei farlo?Come impedire ai motori di ricerca di indicizzare una singola pagina del mio sito web?
risposta
È necessario un semplice file robots.txt
. Fondamentalmente, è un file di testo che indica ai motori di ricerca di non indicizzare determinate pagine.
Non è necessario includerlo nell'intestazione della pagina; Finché si trova nella directory principale del tuo sito web, verrà raccolto dai crawler.
Creare nella cartella principale del tuo sito web e mettere il seguente testo in:
User-Agent: *
Disallow: /imprint-page.htm
Si noti che si dovrebbe sostituire imprint-page.html
nell'esempio con il nome effettivo della pagina (o la directory) che si desidera per non essere indicizzato.
Questo è tutto! Se vuoi essere più avanzato, puoi dare un'occhiata a here, here o here per molte più informazioni. Inoltre, puoi trovare strumenti gratuiti online che generano un file robots.txt
per te (ad esempio, here).
Ecco un buon tutorial: http://www.javascriptkit.com/howto/robots.shtml –
Grazie Sam! Aggiunto il tuo link accanto all'altro tutorial. – Donut
Grazie mille! Devo includere robots.txt da qualche parte nell'intestazione? O basta semplicemente rilasciarlo nella radice del sito? –
È possibile impostare un file robots.txt per provare a dire ai motori di ricerca di ignorare determinate directory.
In sostanza:
User-agent: *
Disallow: /[directory or file here]
Inoltre è possibile aggiungere seguente meta tag nella testa di quella pagina
<meta name="robots" content="noindex,nofollow" />
buona idea. Ha fatto anche questo. –
Questa è una soluzione migliore rispetto all'utilizzo di robots.txt. Il motivo è che, se esegui il root di una pagina di robot, i motori di ricerca non visitano nemmeno la pagina. Se ci sono collegamenti che puntano alla pagina, non la rimuoveranno dall'indice perché non glielo hai detto. Google mostrerà la pagina senza una descrizione, perché conosce la pagina ma non sa cosa c'è nella pagina. L'unico modo per rimuoverlo esplicitamente dall'indice è dire ai motori che non vuoi che vengano visualizzati con il comando 'noindex'. – eywu
Questo è un po 'un problema (troppo tempo per la codifica) se la testa è inclusa dinamicamente come linguaggio lato server come php, che sarà lo stesso per tutte le pagine. –
Creare un file robots.txt e impostare i controlli lì.
Ecco la documentazione per Google: http://code.google.com/web/controlcrawlindex/docs/robots_txt.html
Al giorno d'oggi, il metodo migliore è quello di utilizzare un robots meta tag e impostarlo noindex,follow
:
<meta name="robots" content="noindex, follow">
<meta name="robots" content="noindex, nofollow">
sufficiente includere questa linea nel vostro <html>
Tag <head>
. Perché te lo dico perché se usi il file robots.txt per nascondere i tuoi URL che potrebbero essere pagine di accesso o altri URL protetti che non mostrerai a qualcun altro o ai motori di ricerca.
Quello che posso fare è semplicemente accedere al file robots.txt direttamente dal tuo sito Web e vedere quali URL sono segreti. Allora qual è la logica dietro questo file robots.txt?
Il buon modo è includere il meta tag dall'alto e proteggersi da chiunque.
Un robot desidera visitare un URL del sito Web, ad esempio http://www.example.com/welcome.html. Prima lo fa, è primati controlli per http://www.example.com/robots.txt, e trova: si può esplicitamente impedire:
User-agent: *
Disallow: /~joe/junk.html
si prega di visitare il collegamento sotto per i dettagli robots.txt
- 1. Posso impedire ai motori di ricerca di indicizzare un'intera directory sul mio sito web?
- 2. Metodi per impedire ai motori di ricerca di indicizzare contenuto irrilevante su una pagina
- 3. Come impedire ai motori di ricerca di eseguire la scansione dell'intero sito Web?
- 4. Come posso rendere visibili i miei record del database mysql ai motori di ricerca?
- 5. Come posso fermare i motori di ricerca indicizzando una pagina di manutenzione
- 6. Codice rubino per verificare se un sito web ha URL ottimizzati per i motori di ricerca
- 7. Solr e indicizzazione del sito Web per creare una ricerca del sito
- 8. Algoritmo di ricerca sito Web
- 9. Impostazione di una singola favicon per l'intero sito web
- 10. C'è un modo per impedire a Googlebot di indicizzare determinate parti di una pagina?
- 11. come creare un motore di ricerca per il sito web?
- 12. Quali sono i vantaggi e gli svantaggi di un sito Web che contiene una singola pagina?
- 13. rendendo possibile il contenuto generato da JavaScript per i motori di ricerca per indicizzare
- 14. Come specificare la lingua del sito web? (HTML?)
- 15. I motori di ricerca aggiungono peso ai microformati?
- 16. SEO - Google + altri link ai motori di ricerca all'interno dei tag <noscript>?
- 17. Come posso aggiungere una ricerca Google integrata al mio sito web?
- 18. Come mostrare i risultati di ricerca di Google incorporati nel mio sito web?
- 19. Come condividere il contenuto del mio sito web su facebook
- 20. come proteggere il mio sito web
- 21. I siti AJAX sono scansionabili dai motori di ricerca?
- 22. Come posso archiviare l'intestazione e il piè di pagina del mio sito Web in un'unica posizione?
- 23. Come indicizzare l'applicazione Silverlight nel motore di ricerca?
- 24. Come posso conoscere gli utenti online del mio sito web
- 25. applicazione singola pagina web riguarda
- 26. CRM gratuito per il mio sito web?
- 27. Collegamento alla pagina indice del sito web
- 28. Perché e in che modo googlebot utilizza il motore di ricerca del mio sito web?
- 29. Impedire a una pagina web di allontanarsi utilizzando JavaScript
- 30. Come impedire accessi multipli nel sito Web di PHP
https: // css-trucchi.it/snippets/html/meta-tag-to-prevent-search-engine-bots/ – zloctb