J'utilise Lucene pour Java et j'ai besoin de comprendre ce que fait le moteur lorsque j'exécute des requêtes obscures. Prenez la requête suivante:Opérateurs imbriqués/require dans les requêtes de recherche Lucene
+(foo -bar)
Si j'utilise QueryParser pour analyser l'entrée, je reçois un objet BooleanQuery qui ressemble à ceci:
org.apache.lucene.search.BooleanQuery:
org.apache.lucene.search.BooleanClause(required=true, prohibited=false):
org.apache.lucene.search.BooleanQuery:
org.apache.lucene.search.BooleanClause(required=false, prohibited=false):
org.apache.lucene.search.TermQuery: foo
org.apache.lucene.search.BooleanClause(required=false, prohibited=true):
org.apache.lucene.search.TermQuery: bar
quoi ressemble Lucene pour? Est-ce que les documents DOIVENT contenir 'foo' mais NE PEUVENT PAS contenir 'bar'? Que faire si je recherche:
-(foo +bar)
sont ces documents qui ne peuvent pas contenir « foo » et ne peut pas contenir « bar »? Ou peut-être ceux qui ne peuvent pas contenir «foo» mais DOIVENT contenir «barre»?
Si elle aide tout, voici ce que je faisais jeter un regard dans les résultats QueryParser:
QueryParser parser = new QueryParser("contents", new StandardAnalyzer());
Query query = parser.parse(text);
debug(query, 0);
public static void debug(Object o, int depth) {
for(int i=0; i<depth; i++) System.out.print("\t");
System.out.print(o.getClass().getName());
if(o instanceof BooleanQuery) {
System.out.println(":");
for(BooleanClause clause : ((BooleanQuery)o).getClauses()) {
debug(clause, depth + 1);
}
} else if(o instanceof BooleanClause) {
BooleanClause clause = (BooleanClause)o;
System.out.println("(required=" + clause.isRequired() + ", prohibited=" + clause.isProhibited() + "):");
debug(clause.getQuery(), depth + 1);
} else if(o instanceof TermQuery) {
TermQuery term = (TermQuery)o;
System.out.println(": " + term.getTerm().text());
} else {
throw new IllegalArgumentException("Unknown object type");
}
}
Merci, cela fait sens ! –