Est-il possible de gérer de grandes listes d'entiers dans des documents?Solr avec grandes listes entières
Les recherches se feront exclusivement par correspondance exacte. La plupart des documents auraient ~ 100 entrées de liste, certains seraient ~ 1k et < 10 avec jusqu'à 25k.
Addition: Quel est le meilleur schéma pour les grandes listes?
Mon idée était un champ indexé, non stocké, à valeurs multiples. Le type pourrait être TrieLongField avec precisionStep = "0". Une autre idée était de stocker les données en texte brut avec un tokenizer de mot.
sonne bien, merci! Avez-vous de l'expérience si Solr se comporte avec ce type de champs dans les documents? c'est-à-dire beaucoup plus d'utilisation de RAM ou d'effets similaires. – edlerd
J'ai changé d'avis, vous perdez des performances en convertissant l'int en une clé de dictionnaire si vous stockez en texte brut, surtout si vous avez beaucoup de valeurs entières possibles. :) Je n'ai jamais fait ce que vous proposez mais SOLR devrait bien fonctionner ... c'est plus simple que de chercher du texte :) –