Vorrei calcolare un hash di una classe Python contenente un set di dati per Machine Learning. L'hash è pensato per essere utilizzato per il caching, quindi stavo pensando a md5
o sha1
. Il problema è che la maggior parte dei dati è archiviata in array NumPy; questi non forniscono un membro __hash__()
. Attualmente eseguo uno pickle.dumps()
per ogni membro e calcola un hash basato su queste stringhe. Tuttavia, ho trovato i seguenti link che indica che lo stesso oggetto potrebbe portare a diverse stringhe di serializzazione:Come hash un oggetto di grandi dimensioni (set di dati) in Python?
quale sarebbe il metodo migliore per calcolare un hash per una classe Python contenenti gli array Numpy?
Non molto di un programmatore di python esperto, ma serializzerebbe l'oggetto e l'hashing che funzionano? – Louis