J'ai du texte qui ressemble à ceci: -Comment puis-je identifier des phrases dans un texte?
"I am an engineer. I am skilled in ASP.NET. I also know Node.js.But I don't have much experience. "
Ici, « ASP.NET » et « Node.js » doivent être traités comme des mots. De plus, il n'y a pas d'espace avant "Mais je ...", mais cela devrait être traité comme une phrase séparée.
Le résultat attendu est:
["I am an engineer"," I am skilled in ASP.NET","I also know Node.js","But I don't have much experience"]
Est-il possible de le faire?
Utilisez NLTK ou tout autre package PNL pour fractionner des paragraphes arbitraires en phrases. Regex n'est pas le meilleur outil pour cela. Sauf si vous avez des commentaires très spécifiques. –