Dans son enthousiasme à stemm tokens into lexemes, le moteur de recherche de texte intégral de PostgreSQL réduit également les noms propres. Par exemple:Empêcher la génération de noms propres dans PostgreSQL?
essais=> select to_tsquery('english', 'bortzmeyer');
to_tsquery
------------
'bortzmey'
essais=> select to_tsquery('english', 'balling');
to_tsquery
------------
'ball'
(1 row)
Au moins pour le premier, je suis sûr que ce n'est pas dans le dictionnaire anglais! Quelle est la meilleure façon d'éviter ce faux enracinement?
Je suppose que c'est l'étape précédente, "parer des documents en jetons" qui fait cela, car il sent l'utilisation d'un algorithme plutôt que d'un dictionnaire. –
Vous pouvez utiliser le dictionnaire 'simple' pour éviter le bourrage. 'select to_tsquery ('simple', 'bortzmeyer');' et 'select to_tsquery ('simple', 'balling'); – davmor