Ho un client che sta distribuendo internamente grandi file binari. Stanno passando anche checksum md5 dei file e apparentemente verificando i file rispetto al checksum prima dell'uso come parte del loro flusso di lavoro.Quanto sono probabili checksum falsi positivi md5?
Tuttavia, sostengono che "spesso" si verificano corruzioni nei file in cui l'md5 sta ancora dicendo che il file è buono.
Tutto ciò che ho letto suggerisce che questo dovrebbe essere estremamente improbabile.
Sembra probabile? Un altro algoritmo di hashing fornirebbe risultati migliori? Dovrei effettivamente considerare problemi di processo come quelli che pretendono di controllare il checksum, ma non lo fanno davvero?
NB, non so ancora cosa significhi "spesso" in questo contesto. Stanno elaborando centinaia di file al giorno. Non so se si tratta di un evento giornaliero, mensile o annuale.
Fornire loro un esempio di file "corrotto" e di "buono" originale. –
È possibile che la somma md5 sia stata calcolata su un file corrotto o che il danneggiamento si sia verificato dopo che la somma è stata calcolata? Per sapere con certezza, prendi il suggerimento di Anon e ottieni un esempio di due file con lo stesso checksum. – BMitch
Quindi, da allora, hai guardato l'idea di sincronizzazione bittorrent? getsync.com] – dlamblin