Supposons que nous migrions un ensemble de fichiers MS Office d'un disque partagé vers SharePoint (par exemple, SharePoint Online). Limité à Office 2007, donc extensions de fichiers comme DOCX, XLSX.SharePoint modifie la taille des fichiers MS Office lors de la première sauvegarde, car les métadonnées sont ajoutées. Possible de confirmer que le contenu n'a pas changé?
Nous voyons que la taille du fichier change lorsqu'il est enregistré dans SharePoint - certaines métadonnées sont ajoutées. (Bien que la taille des fichiers autres que MS Office tels que PDF ou JPEG ne change PAS).
Ces fichiers MS Office sont des «conteneurs» dans lesquels sont placés un certain nombre de composants - cette situation peut être grossièrement vue en changeant l'extension d'un fichier XLSX (par exemple) en ZIP et en l'ouvrant avec WinZip.
Pour de bonnes raisons d'intégrité sonore, nous voulons nous assurer que la partie "Contenu du fichier" n'a pas changé. Comment pouvons-nous identifier les composants dans ces conteneurs qui représentent le contenu? Ces composants sont-ils invariants quand ils sont sauvegardés dans SharePoint comme décrit?
Si tel est le cas, existe-t-il des utilitaires qui pourraient analyser une paire de ces fichiers et confirmer que le contenu est le même ou s'il a été modifié? Y a-t-il peut-être une somme de contrôle que nous pourrions générer à partir des deux fichiers et comparer.
Si un tel utilitaire n'existe pas quel type d'environnement serait le mieux pour en créer un? - pourrait-il être fait dans VB.NET et/ou C# par exemple?
Merci.
Cet article précédent portait sur le même problème, mais ne fournit pas le genre de réponse dont nous avons besoin. C# - Hash contents of MS Office documents without metadata