Je voudrais calculer un hachage d'une classe Python contenant un ensemble de données pour l'apprentissage automatique. Le hachage est destiné à être utilisé pour la mise en cache, donc je pensais à md5
ou sha1
. Le problème est que la plupart des données sont stockées dans des tableaux NumPy; ceux-ci ne fournissent pas un membre __hash__()
. Actuellement, je fais un pickle.dumps()
pour chaque membre et de calculer un hachage basé sur ces chaînes. Cependant, j'ai trouvé les liens suivants indiquant que le même objet pourrait conduire à différentes chaînes de sérialisation:Comment hacher un grand objet (ensemble de données) en Python?
Quelle serait la meilleure méthode pour calculer un hachage pour une classe Python contenant des tableaux Numpy?
Pas beaucoup d'un programmeur python chevronné mais, serait la sérialisation de l'objet et le hachage qui fonctionnent? – Louis