n-gram

    2La chaleur

    1Répondre

    J'ai essayé d'extraire ngrams à partir de modèles qui sont extraits de documents texte, modèles ont un nombre différent de termes. par exemple: si le motif p = {t1, t2, t3} et nous devons extraire ngr

    0La chaleur

    1Répondre

    J'utilise l'utilitaire de ligne de commande ngram-count de SRILM pour tenter de calculer un modèle de trigramme pour un sous-ensemble du corpus de Gutenberg. La ligne de commande est: -order 3 -kndisc

    0La chaleur

    1Répondre

    J'utilise NGramFilterFactory. Mon schéma est donné ci-dessous <fieldType name="c_text" class="solr.TextField"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <