J'ajouté document PDF à SolrComment faire une requête PDF dans Solr?
curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div" -F "[email protected]"
et je voudrais l'interroger pour mot "erreurs"
http://localhost:8983/solr/select/?q=errors&version=2.2&start=0&rows=10&indent=on
-je obtenir aucun résultat.
Cependant, si je l'interroge pour le mot "java", je reçois une page (le texte PDF ajouté) et dans le texte visible il y a le mot "erreurs".
P.S. Im nouveau à Lucene et Solr et je ne comprends pas pourquoi chaque mot dans ce pdf est consultable.
Essayez extractOnly = true pour voir ce que Solr extrait du fichier PDF. –