J'ai essayé d'extraire ngrams à partir de modèles qui sont extraits de documents texte, modèles ont un nombre différent de termes. par exemple: si le motif p = {t1, t2, t3} et nous devons extraire ngr
J'utilise l'utilitaire de ligne de commande ngram-count de SRILM pour tenter de calculer un modèle de trigramme pour un sous-ensemble du corpus de Gutenberg. La ligne de commande est: -order 3 -kndisc