2017-04-21 3 views

Répondre

1

CorenNLP a des modèles insensibles à la casse que vous pouvez utiliser pour l'anglais seulement. Ils les appellent caseless models. Lisez l'avertissement là-bas si vous utilisez la version 3.6.0

Quelques points mentionnés dans le lien:

  1. Vous pouvez régler le cas des lettres dans votre texte et utilisez les modèles normaux. Vous pouvez utiliser TrueCaseAnnotator pour cela.
  2. Pour former votre propre cas des modèles peu sensibles CoreNLP vous pouvez spécifier un préprocesseur jeton qui ignore la casse

    wordFunction = edu.stanford.nlp.process.LowercaseFunction