2010-10-15 5 views
1

J'essaie de supprimer des milliers de fichiers Excel 2007/2010 identiques. Je préférerais faire cela en utilisant des techniques de raclage. Est-il possible de gratter un fichier Excel puisque, autant que je sache, le fichier est essentiellement une sorte de format XML.Excel vers XML pour l'effacement de données

Alors, est-il possible de convertir un fichier Excel en XML ou un autre format de balisage?

+0

Quel langage d'environnement et de programmation utilisez-vous? – Oded

+0

Dans le passé, j'ai utilisé HTML Agility Pack et C# (dans un script SSIS) pour gratter les données XML; donc j'espérais convertir les fichiers Excel en XML et gratter les données des différentes balises. – ooutwire

+0

L'utilisation d'Excel avec VBA est donc hors de question? C'est une façon native de faire les choses. – Oded

Répondre

1

Le format XLSX est en fait un fichier ZIP, mais avec une extension différente. Si vous le décompressez à l'aide de votre programme zip favori, vous constaterez que les données de la feuille de calcul se trouvent dans xl \ worksheets. Chaque feuille de calcul est enregistrée en tant que document XML distinct. Vous devriez pouvoir utiliser XSLT comme suggéré par Michael pour extraire les données dont vous avez besoin.

+0

parfait! cela a résolu mon problème exactement – ooutwire

0

Les fichiers Excel 2010 sont en XML, par défaut. Alors, quel format de fichier sont vos fichiers Excel actuellement (c'est-à-dire, quelle extension ont-ils)? Votre question est quelque peu ambiguë à ce sujet. S'ils sont déjà en XML, vous pouvez utiliser XSLT pour les racler.

+0

Ils sont en XLSX; donc je demande juste comment je les convertirais du format de feuille de calcul commun au balisage XML. Il y a quelques années, je me suis souvenu avoir cliqué sur un bouton dans Excel qui m'a permis de voir le balisage au lieu de l'interface normale. – ooutwire

Questions connexes