Comment faire une requête PDF dans Solr?

curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div" -F "[email protected]"

et je voudrais l'interroger pour mot "erreurs"

-je obtenir aucun résultat.

Cependant, si je l'interroge pour le mot "java", je reçois une page (le texte PDF ajouté) et dans le texte visible il y a le mot "erreurs".

P.S. Im nouveau à Lucene et Solr et je ne comprends pas pourquoi chaque mot dans ce pdf est consultable.

2010-07-11 IAdapter

Essayez extractOnly = true pour voir ce que Solr extrait du fichier PDF. –

Jetez un oeil à cette question similaire et answer

Essayez d'utiliser l'analyseur pour voir quels mots sont insérés dans l'index.

2010-07-12 12:28:23

Répondre