Sto sviluppando un'applicazione in rotaie che richiede di verificare se il sito web inserito ha URL di motori di ricerca generati o meno. Una soluzione che ho in mente sta usando nokogiri per analizzare l'HTML del sito e guarda nel tag link per trovare gli URL e vedere se sono adatti ai motori di ricerca. C'è un altro modo in cui questo può essere fatto? Qualsiasi aiuto sarebbe davvero grandioso.Codice rubino per verificare se un sito web ha URL ottimizzati per i motori di ricerca
risposta
Hai due problemi qui:
Come si formalmente (programmazione) definiscono ciò che un "search engine URL frienldy è". Suppongo che tu abbia già un modo per farlo. Quindi lascia ...
Come controllare tutti i collegamenti su un sito web.
Quindi per (2) Vorrei guardare qualcosa come Anemone che renderà più facile per voi a strisciare siti web completi:
Anemone è una libreria Ruby che lo rende rapido e indolore per scrivere programmi che ragno un sito web. Fornisce un semplice DSL per eseguire azioni su ogni pagina di un sito, ignorare determinati URL e calcolare il percorso più breve per una determinata pagina su un sito.
Il design multi-thread rende Anemone veloce. L'API lo rende semplice. E l'espressività di Ruby lo rende potente.
Per la ricerca per indicizzazione semplice, Anemone ti fornirà anche una serie di tutti i collegamenti su una pagina, quindi non avrai nemmeno bisogno di Nokogiri. Per cose più complesse forse vuoi combinare Anemone con qualcosa come Mechanize e Nokogiri. Questo dipende dalle tue esigenze.
Grazie per aver condiviso le informazioni su Anemone Gem, sarebbe molto utile per me. Inoltre non ho davvero trovato un modo per il (1) problema, quindi se hai aiuto su questo poi per favore condividi anche questo. –
Anemone è fantastico, risolve il mio scopo qui, Grazie –
@JimmyThakkar - Grazie per i vostri commenti. Purtroppo no non ho buone idee per i link SEO. Non è un problema facile da risolvere. Quello che vorrei fare è innanzitutto scrivere sulla carta che cos'è un buon collegamento SEO. Cioè per prima cosa crea una definizione sulla carta! Dopo di ciò puoi provare e formulare un algoritmo per questo. Ma prima devi avere le regole chiare. Forse cercare parole chiave corrispondenti sulla pagina, ecc. Tuttavia, gli esseri umani possono vedere rapidamente se un collegamento è SEO o meno. Quindi, solo implementando (2) puoi già elencare i collegamenti e scansionare rapidamente più di 100 link in pochi secondi semplicemente guardandoli. – Casper
- 1. I richiami dei motori Javascript sono ottimizzati?
- 2. come creare un motore di ricerca per il sito web?
- 3. Rubino un'espressione regolare per trovare un URL
- 4. Utilizzo di un URL Web per SUGGEST_COLUMN_ICON_1 per i suggerimenti di ricerca
- 5. Sito Web di indicizzazione/url in Ricerca elastica
- 6. Ottimizzazione dei motori di ricerca - Guida per gli sviluppatori?
- 7. Come impedire ai motori di ricerca di eseguire la scansione dell'intero sito Web?
- 8. newbie: scrittura del codice di backend per il sito web
- 9. Posso impedire ai motori di ricerca di indicizzare un'intera directory sul mio sito web?
- 10. Come impedire ai motori di ricerca di indicizzare una singola pagina del mio sito web?
- 11. Url sarà riscritto con htaccess make sito Web scoperto dal motore di ricerca?
- 12. rendendo possibile il contenuto generato da JavaScript per i motori di ricerca per indicizzare
- 13. Algoritmo di ricerca sito Web
- 14. opensourcing di un codice sito web
- 15. I siti AJAX sono scansionabili dai motori di ricerca?
- 16. C'è un modo per sapere se qualcuno ha aggiunto un segnalibro al tuo sito web?
- 17. Verifica se il sito web è contattabile
- 18. Verifica se il sito web esiste
- 19. Admob per sito web
- 20. Modo rubino per verificare se una stringa non è vuota?
- 21. Perché i motori di ricerca ignorano i simboli?
- 22. Codice per aggiungere un'intestazione host a un sito Web IIS
- 23. Traduttore per sito web
- 24. Come verificare con Selenium WebDriver se un sito utilizza Ajax?
- 25. Alternative rubino per Lucene
- 26. Utilizzare JQuery per verificare se l'elemento ha un bordo?
- 27. C'è un modo per fare automaticamente uno screenshot di un sito web attraverso un URL?
- 28. Perché i crawler dei motori di ricerca non eseguono javascript?
- 29. In che modo un sito Web evidenzia i termini di ricerca utilizzati nel motore di ricerca?
- 30. Verificare se esiste un servizio web
se si vuole veramente guardare tutti i collegamenti nella pagina, nokogiri è la strada da percorrere. come pensi di distinguere un URL SEO-friendly da uno non-SEO-friendly? –
Non ho idea di come lo farei. Analizzerò prima Anemone come suggerito da @Casper. Hai un altro modo che potrebbe funzionare per questo caso? Grazie –
Sfortunatamente no, ero solo curioso; -) –