Nous avons un grand ensemble d'objets qui incluent des propriétés de composition et de nom, deux valeurs de chaîne contenant des valeurs avec beaucoup de duplication, ce qui serait une structure de données appropriée pour stocker les chaînes qui peuvent être recherchées et petites ?Stockage de chaînes statiques consultable
Les données incluent de nombreux produits chimiques et noms de produits qui sont en double ou qui ne diffèrent que légèrement. Je voudrais être en mesure de stocker le contenu de la chaîne des objets dans un format compressé qui peut également être recherché.
J'ai expérimenté avec Tries pour créer un index de recherche rapide sur les noms, mais cela s'ajoute actuellement au stockage de chaque donnée de chaîne d'objets.
Ces données sont statiques et distribuées en tant que fichier binaire distinct avec l'application.
Avez-vous envisagé de l'implémenter dans une base de données? –
@CC Les données proviennent d'une DB mais pour la performance, les données étant statiques, nous l'installons sur le client, un DB en mémoire peut-être une solution mais il faudrait être .net (vraiment C#) pour passer le bureaucratie interne –