Je ne suis pas sûr que cette question ait déjà été posée par le passé. J'écris un webcrawler, destiné à extraire des informations de plusieurs sites Web pour les promotions, les prix et les descriptions de produits.Choix de la base de données pour la sémantique des pages analysées
Quel choix de base de données serait idéal pour faire une comparaison en mémoire sur les données des promotions et des prix, basée sur l'identification du même produit à partir de plusieurs sites Web.
Je sais que le design va être complexe pour le Scraper, le HTMLDataProcessor et le Storage pour le wrangling. Mais, je cherche une solution pour le choix de la couche de données.
Appréciez l'aide à ce sujet.
J'ai fait un choix d'ElasticSearch. – uniqrish