J'ai un contenu d'article de nouvelles qui est en cours d'indexation en utilisant Lucene et interrogé en utilisant Zend_Lucene en PHP. Le contenu fait fréquemment référence aux chaînes de télévision britanniques (par exemple BBC One) mais je sais que nos utilisateurs entreront souvent un terme de recherche "BBC 1" ou "BBC1" plutôt que "BBC One".Comment gérer les nombres comme des mots et des nombres ("un" vs "1") dans Zend_Lucene
Existe-t-il une approche «standard» pour traiter ce problème de recherche de nombres-comme-mots plutôt que de nombres-comme-nombres? Mes choix semblent être de modifier le terme de recherche chaque fois que je vois des nombres, par exemple, je change un terme de recherche de "BBC1" en "BBC 1 One" (ou quelque chose de similaire) - ou je modifie le indexé contenu afin que les nombres soient convertis en mots et vice-versa et les deux versions stockées dans l'index.