2009-04-23 5 views
0

Existe-t-il un module python facile à utiliser qui permet la validation de texte en anglais ou en finnois?Validation de texte en anglais et/ou en finnois

Ce serait bien si je pouvais juste vérifier les mots existent dans le dictionnaire défini par l'utilisateur et éventuellement vérifier que la grammaire est un peu d'accord.

Je prévois d'implémenter une validation de fantaisie pour un contenu de répertoire que j'ai fait il y a longtemps. Cela implique des trucs simples comme vérifier que les scripts de configuration ne vont pas tomber en panne et que tout va bien. Tout est assez facile sinon.

Pour le validateur, je devrais être capable d'entrer des fichiers entiers ou des chaînes de texte unicode.

Répondre

2

Je ne suis pas sûr de ce que vous essayez de faire, mais si vous cherchez quelque chose qui peut dire «c'est un anglais valide» ou «c'est un finlandais valide», alors vous regardez une classe des problèmes qui sont très probablement insolubles.

Si ce n'est pas le cas, utilisez un dictionnaire et/ou une fréquence de lettres et une analyse bayésienne pour déterminer si le texte donné est de type anglais ou finlandais. Si vous essayez de détecter automatiquement une langue, il s'agit probablement du meilleur itinéraire, bien que vous rencontriez des problèmes avec du texte en plusieurs langues.

Questions connexes