4

J'ai un client qui teste l'intégralité du texte (exemple ci-dessous) sur un nouveau site Oracle UCM. La chaîne de texte aléatoire qu'ils ont choisi de tester était 'test only'. Qui a échoué; de mes tests, il semble que 'only' soit un mot réservé, car il n'est jamais renvoyé à partir d'une recherche en texte intégral (il est renvoyé à partir des recherches de métadonnées).Où puis-je trouver une liste de mots «Stop» pour la recherche de texte intégral Oracle?

J'ai passé la matinée à chercher oracle.com et j'ai trouvé this qui semble assez complet, mais qui n'est pas "seulement".

Donc, ma question est donc, est «seulement» un mot réservé. Où puis-je trouver une liste complète de mots réservés pour la recherche en texte intégral Oracle (10g)?

Exemple de chaîne de recherche de texte intégral;

(<ftx>test only</ftx>) 


mise à jour. J'ai fait d'autres tests. Il semble ignorer les mots qui indiquent des lieux ou des moments; seulement, certains, jusqu'à, quand, quand, où, là, ici, près, ça, qui, à propos, ça, eux.

Est-ce que quelqu'un peut le confirmer? Je ne peux pas trouver cela sur Oracle n'importe où.


Mise à jour 2. Réponse post J'ai cherché 'stop' mots pas 'réservé'. Mise à jour du titre de la question et des balises à refléter.

Répondre

3

Je parie que le système tente d'ignorer automatiquement les mots qui se posent. Cela expliquerait pourquoi vous ne pouvez pas trouver «seulement» mais «onnly» peut être trouvé. Pouvez-vous rechercher 'a', 'an', ...

La liste que vous avez donnée des mots qui ne fonctionnent pas ressemble à des mots très courants qui souvent ne sont pas les mots primaires dans une phrase. Compte tenu de cela, ils ne sont pas susceptibles d'être des mots que vous recherchez sur une recherche en texte intégral.

Quelles sont les chances que vous cherchiez un article qui inclut le mot 'that' et l'inclusion de ce mot est le seul fait que vous avez sur l'article?

Je pense que j'ai trouvé votre liste .... Ironiquement de la page wiki de la dernière compagnie que j'ai commencé ..: http://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29

2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist: 
• CTX_DDL.ADD_STOPWORD 
• CTX_DDL.REMOVE_STOPWORD 
• CTX_DDL.ADD_STOPTHEME 
• CTX_DDL.ADD_STOPCLASS 
When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect. 

liste par défaut des mots vides:

a he out up 
be more their at 
had one will from 
it than and is 
only when corp not 
she also in says 
was by ms to 
about her over 
because most there 
has or with 
its that are 
of which could 
some an inc 
we can mz 
after his s 
been mr they 
have other would 
last the as 
on who for 
such any into 
were co no 
all if so 
but mrs this 

Mise à jour - Une belle livre blanc d'Oracle qui comprend la façon dont le texte intégral des œuvres de recherche peuvent être téléchargés à partir de: http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf Ils mentionnent les mots vides et le fait qu'il y est une liste par défaut, mais ne mentionne pas les mots eux-mêmes.

Bonne chance!

+0

Cela résume bien ce que j'étais après. Quelques-uns des articles énumérés apparaissent toujours, mais c'est toujours la meilleure liste que j'ai vue. Merci Jacob. – Tyronomo

0

Mots-clés réservés: http://www.toadworld.com/KNOWLEDGE/KnowledgeXpertforOracle/tabid/648/TopicID/SQL15/Default.aspx cliquez sur "Mot-clé réservé" à gauche.

"Only" est dans la liste. Je ne suis pas sûr de ce qui se passe dans votre cas, mais je ne peux pas imaginer qu'Oracle ne supportera pas le mot uniquement dans la recherche en texte intégral. Dans de nombreux cas de texte intégral, vous devez rechercher un mot. Cela pourrait-il être le problème que vous rencontrez?

Cheers, Jacob

+0

Merci pour le lien. J'ai testé avec juste seulement, pas de chance. Je peux trouver 'onnly', 'bonly', 'solitaire', etc, mais jamais seulement. Il devient plus étrange, la recherche de 'sur%' retournera 'acheter en ligne' pas 'seulement'. D'autres combinaisons font de même. – Tyronomo

+0

J'ai essayé tout sur cette liste, la plupart fonctionnait bien. Les quelques qui ne m'ont pas amené à la mise à jour, merci! – Tyronomo

4

réponses supplémentaires:

SELECT * 
FROM DR$STOPWORD 
LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID

Dans la re sultats, les champs SPL_* proviennent de la table système DR$STOPLIST et les SPW_* champs de la table DR$STOPWORD

  • A partir d'un schéma utilisateur, stoplists définis par l'utilisateur et les mots vides peuvent être récupérées par
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;
Questions connexes