Descrizione: Ho un'enorme tabella di database MySQL. La dimensione totale è di circa 10 terabyte. Contiene solo testi.Un modo per ridurre la dimensione dei testi?
Un testo di esempio da questa tabella di database:
In altri casi, alcuni paesi hanno gradualmente imparato a produrre gli stessi prodotti e servizi che in precedenza solo gli Stati Uniti e pochi altri paesi potrebbero produrre. La crescita del reddito reale negli Stati Uniti è rallentata.
Ci sono circa 50 miliardi di testi diversi.
Cosa ho provato?
Ho provato a comprimere tutti. In realtà ha funzionato, ha ridotto le dimensioni totali. Tuttavia, ho bisogno di effettuare ricerche e non posso cercare alcun dato mentre si trovano in un file zip.
Ho provato la codifica di PHP base64
. Ha fatto i miei dati di testo di esempio come:
SW4gb3RoZXIgY2FzZXMsIHNvbWUgY291bnRyaWVzIGhhdmUgZ3JhZHVhbGx5IGxlYXJuZW QgdG8gcHJvZHVjZSB0aGUgc2FtZSBwcm9kdWN0cyBhbmQgc2VydmljZXMgdGhhdCBwcmV2 aW91c2x5IG9ubHkgdGhlIFUuUy4gYW5kIGEgZmV3IG90aGVyIGNvdW50cmllcyBjb3VsZC Bwcm9kdWNlLiBSZWFsIGluY29tZSBncm93dGggaW4gdGhlIFUuUy4gaGFzIHNsb3dlZC4 =
Quello che mi piacerebbe realizzare?
Voglio ridurre le dimensioni del testo prima di inviarle a MySQL. Prima di tutto, non so come posso fare questo lavoro. Sto pensando di crittografare e decifrare i dati.
Così, qui è un esempio quello che voglio fare:
voglio crittografare i dati di testo prima di riporlo. Quindi, voglio chiamare i dati crittografati da MySQL per decodificare.
Un modo per ridurre la dimensione dei testi? Base64 non funziona per me, esiste un altro modo?
Hai bisogno di ricerca full text? In tal caso non puoi comprimerli o MySQL non sarà in grado di eseguire la scansione dei testi. Ad ogni modo, incolla qui il contenuto del tuo database. – moonwave99
Forse Lucene http://lucene.apache.org/ è quello che stai cercando. È fatto per la cosa che stai cercando di complice: cercare in grandi quantità di testo –
Sì, ho bisogno di ricerca full-text. –