Ho scaricato il file dei titoli degli articoli di Wikipedia che contiene il nome di ogni articolo di Wikipedia. Devo cercare tutti i titoli degli articoli che potrebbero essere una possibile corrispondenza. Per esempio, potrei avere la parola "hockey", ma l'articolo di Wikipedia per l'hockey che vorrei fosse "Ice_hockey". Dovrebbe essere una ricerca senza distinzione tra maiuscole e minuscole.Il modo più efficace per trovare corrispondenze parziali di stringhe in file di grandi dimensioni (python)
Sto usando Python e c'è un modo più efficiente di eseguire una ricerca riga per riga? Effettuerò questa ricerca idealmente come 500 o 1000 volte al minuto. Se linea per linea è la mia unica opzione, ci sono alcune ottimizzazioni che posso fare all'interno di questo?
Penso che ci siano diversi milioni di righe nel file.
Qualche idea?
Grazie.
Si prega di mostrare l'input previsto. In che formato è inserito il file? non rendere le persone che vogliono aiutarti a scaricare il file da soli. – aaronasterling
è solo un semplice file di testo con ogni titolo sulla propria linea – apexdodge