Je travaille sur un projet et j'ai besoin d'un outil ou d'une API pour détecter des fragments de phrase dans un texte volumineux. Il existe de nombreuses solutions telles que OpenNLP pour détecter des phrases dans un fichier donné. Cependant, je n'ai pas trouvé de solution explicite au problème de trouver des mots, des phrases ou des combinaisons de caractères d'événements qui n'appartiennent à aucune phrase grammaticalement correcte.Comment détecter automatiquement des fragments de phrase dans un fichier texte
Toute aide sera grandement appréciée.
Merci,
Lorderon
Salut Rene. Merci pour votre réponse. Je ne sais pas si les n-grammes pourraient m'aider. Comment seriez-vous sûr que 5 grammes ou même 3 grammes ne sont parfois pas une seule phrase? J'essaie juste de comprendre cela parce que je ne suis pas un linguiste computationnel. En outre, comment je vérifierais si les faux positifs ne sont pas grands quand j'ai un gros texte de données. – Lorderon