J'espère utiliser Solr pour exécuter des recherches à partir d'informations analysées à partir de fichiers XML. Ces fichiers XML ne sont pas dans le format de document de Solr, en tant que tel je dois les analyser et obtenir les champs dont j'ai besoin de cette façon. Je connais la programmation Java et je me demandais si SolrJ serait une méthode plus simple que l'utilisation de Data Import Handler. Je considère parcourir chaque fichier XML que j'ai et analyser les champs dont j'ai besoin de chacun. Y a-t-il un inconvénient à une méthode par rapport à l'autre? J'imagine depuis que je connais Java, il peut être plus facile d'analyser le XML de cette façon?Apache Solr, SolrJ vs Gestionnaire d'importation de données pour l'analyse XML
Je vais probablement avoir besoin de plusieurs conditions et expressions régulières. Si quelque chose, un moyen fiable d'obtenir mes champs de XML relativement non structuré.
Comment SolrJ fonctionnerait-il avec l'interface? C'est-à-dire, si je indexe en utilisant SolrJ, puis-je faire mes requêtes à travers l'interface encore?
Et DIH est probablement plus rapide que d'ajouter tous les documents avec SorlJ –