2010-07-11 6 views
1

J'ajouté document PDF à SolrComment faire une requête PDF dans Solr?

curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div" -F "[email protected]" 

et je voudrais l'interroger pour mot "erreurs"

http://localhost:8983/solr/select/?q=errors&version=2.2&start=0&rows=10&indent=on

-je obtenir aucun résultat.

Cependant, si je l'interroge pour le mot "java", je reçois une page (le texte PDF ajouté) et dans le texte visible il y a le mot "erreurs".

P.S. Im nouveau à Lucene et Solr et je ne comprends pas pourquoi chaque mot dans ce pdf est consultable.

+1

Essayez extractOnly = true pour voir ce que Solr extrait du fichier PDF. –

Répondre

2

Jetez un oeil à cette question similaire et answer

Essayez d'utiliser l'analyseur pour voir quels mots sont insérés dans l'index.

Questions connexes