Existe-t-il un bon Librateur de traitement de documents, en C ou en Python? J'essaie d'analyser des chaînes de documents - PDF, Word Doc/Docx, Excel xls/x, PPT, ODF, et aussi des formats Mac.N'importe quelle bibliothèque de lecture de documents multi-format pour Python/ou C?
Merci de recommander Des solutions qui fonctionneraient également dans l'environnement Linux/Unix.
Je commencerais ici: [C à l'aide d'analyse syntaxique strtok et sscanf] (http://www.google.com/search?hl=en&q=C+text+parsing+sscanf + et + strtok) –
Je suis à la recherche d'un lecteur multi-document lib .. ne pas écrire à partir de zéro dans C .. Clibs peuvent facilement exportés vers Python alors c'est pourquoi je suis à la recherche. –
Pouvez-vous expliquer pourquoi downvote? –