2009-05-15 10 views
3

J'ai un fichier mht, je souhaite obtenir tout le texte de la mht. Je pensais à l'utilisation de regex, mais j'ai d'autres langues dans le mht sauf l'anglais, donc le texte lui-même contient des choses comme A7 = A98 = D6 ...extrait du texte de mht

sélectionner tout le texte d'un fichier visualisé dans votre navigateur, puis Copiez et collez-le dans un bloc-notes - c'est ce dont j'ai besoin.

Merci.

Répondre

1

Ouvrez le fichier dans Internet Explorer et enregistrez-le en tant que texte brut (UTF-8). :) Si vous avez besoin d'une solution automatisée, recherchez un convertisseur mht vers txt pour votre plate-forme ou votre langage de programmation.

En fait, vous pouvez automatiser cela en Powershell ainsi:

$ie = New-Object -ComObject "InternetExplorer.Application" 
$ie.Navigate2("file:///C:/MyFile.mht") 
$text = $ie.Document.documentElement.innerText 
+0

J'utilise C#, est-il un MHT convertisseur txt? Comment utiliser powershell avec une application C#? –

+0

Dans ce cas, vous avez besoin de la bibliothèque .NET appropriée. Vous devez étiqueter votre question avec "C#" et ".net" pour obtenir plus de réponses. –

+0

Vous pouvez également appeler Powershell à partir de votre application C#. Ce ne sera pas très rapide mais ça devrait marcher. Voir par exemple ici: http://www.codeproject.com/KB/cs/HowToRunPowerShell.aspx –