2009-05-12 8 views
0

Nous utilisons actuellement print2flash (http://print2flash.com) pour convertir les documents soumis par l'utilisateur (documents Word, RTF, PowerPoint, etc.) en documents Flash pouvant être consultés en ligne (à la docstoc et scribd).Extrait du texte de SWF

Nous souhaitons indexer le texte contenu dans ces fichiers pour l'indexation de texte intégral. Existe-t-il des outils ou des bibliothèques que nous pouvons utiliser pour accomplir cela?

Nous développons en ASP.NET/C# et avons essayé de travailler avec des outils tiers tels que SWFTools (http://www.swftools.org) mais les résultats ont été incohérents et subpar. PS: Nous aimerions faire l'indexation après que le document original a été converti en flash car cela nous donne moins de formats de fichiers à traiter.

Répondre

1

Votre meilleur pari est une bibliothèque d'analyse Flash tierce. Flash a un format très dense et c'est pénible à analyser. Cela dit, le format est bien compris. Vous pouvez trouver les spécifications officielles ici: http://www.adobe.com/devnet/swf/