2017-09-19 3 views
-2

Comment puis-je découper un document (par exemple, un paragraphe, un livre, etc.) en phrases.Comment diviser un document par des phrases avec Spacy

Par exemple, "The dog ran. The cat jumped" en ["The dog ran", "The cat jumped"] avec spacy?

+1

avec python de base: 'my_string.split ("")' – Julien

+0

@Julien voir la question mise à jour. Je ne voulais pas dire littéralement "Le chien a couru, le chat a sauté". Considérez "M. Baxter a mangé un cornichon." –

Répondre

1

De spacy's github support page

from __future__ import unicode_literals, print_function 
from spacy.en import English 

raw_text = 'Hello, world. Here are two sentences.' 
nlp = English() 
doc = nlp(raw_text) 
sentences = [sent.string.strip() for sent in doc.sents]