2012-07-13 13 views
5

Voglio capire come Google non gestisce nessuno spazio tra 2 parole. Per esempio ci sono 2 parole - parola1 e parola2. Scrivo nella casella di ricerca 'word1word2', dice che intendi 'word1 word2' o semplicemente capisco di cercare 'word1 word2'. Qualche informazione su quale struttura dati e algoritmo usano? Vedo in questa risposta How to split text without spaces into list of words?, si consiglia di utilizzare la struttura dati trie.In che modo google riconosce 2 parole senza spazi?

+0

Sarebbe meglio chiedere a uno sviluppatore google. –

+1

non si tratta di strutture dati, ma principalmente di statistiche e stime di probabilità – usamec

risposta

1

Forse cercano in un dizionario usando il prefisso di parola inserito?

1

presumo è necessario disporre di uno script (utilizzando AJAX per exemple http://net.tutsplus.com/tutorials/javascript-ajax/adding-a-jquery-auto-complete-to-your-google-custom-search-engine/)

sostanza di controllare le parole in un dizionario. Lo spazio non deve essere una condizione per controllare la parola ma solo una possibilità. Ad esempio un semplice algo (davvero semplice) sarebbe: "manywords" si controlla la lettera di 3 primati, niente? Poi si controlla i 4 primi ...

ecco alcune spiegazioni su motore di ricerca Google: https://developers.google.com/search-appliance/documentation/60/admin_searchexp/ce_improving_search

Forse qui possono aiutare anche: http://tm.durusau.net/?cat=1106

4

Nella generazione candidato del correttore ortografico, è permettono un'omissione possibilità di uno spazio, proprio come si consente omissione di altre lettere .... Forse guardare la conferenza correzione ortografica qui: http://nlp-class.org/ [spiacente, auto-promozione] o introduzione di Peter Norvig: http://norvig.com/spell-correct.html

Problemi correlati