Nous avons un travail SQL analytique par lots - exécuté une fois par jour - qui lit les données de 2 tables source conservées dans un SGBDR puissant. Les tables source sont énormes (> 100 To) mais ont moins de 10 champs combinés. La question que je me pose est que les 2 tables sources peuvent être conservées dans un fichier plat compressé et indexé, de sorte que toute l'opération peut être beaucoup plus rapide et économiser sur le stockage et peut être exécutée sur un serveur à basse spécification. Aussi, pouvons-nous exécuter des requêtes SQL sur ces fichiers plats compressés et indexés? Toute indication sur la façon de s'y prendre serait extrêmement utile.fichiers à plat indexés
Répondre
La plupart des stratégies d'optimisation optimisent la vitesse ou la taille, et échangent les uns contre les autres. En général, les solutions de SGBDR optimisent la vitesse, au détriment de la taille, par exemple en créant un index, en prenant plus de place et, en retour, en accélérant l'accès aux données.
Il est donc peu probable que vous souhaitiez optimiser à la fois la vitesse et la taille - vous devrez presque certainement échanger les unes contre les autres. Deuxièmement, si vous voulez exécuter des requêtes de type «sql-like», je suis à peu près certain qu'un SGBDR est la meilleure solution, en particulier avec d'énormes ensembles de données. Il se peut que les données sous-jacentes se prêtent à une optimisation spécifique - par exemple, si vous pouvez créer un schéma d'indexation personnalisé basé sur des masques binaires pour créer des entiers et utiliser ces entiers pour accéder aux données à l'aide d'opérateurs booléens, peut être en mesure de battre les performances d'un indice SGBDR.
Merci Neville. Les requêtes "sql like" permettent d'évaluer si nous pouvons réutiliser nos jobs SQL existants par rapport à un fichier plat indexé mais pas trop important. Le point principal est de savoir comment créer de tels fichiers plats indexés et compressés. – user1065024
- 1. Traiter les fichiers à plat
- 2. fichiers indexés par date de production
- 3. Mise à jour des fichiers indexés Apache Lucene
- 4. Trier le tableau de fichiers plat
- 5. comment imprimer une fenêtre de liste de fichiers à plat
- 6. des répertoires de hachage indexés
- 7. Scanner à plat WIA
- 8. Carte plusieurs itinéraires indexés
- 9. Objets IBOutletCollection mal indexés
- 10. UILabels indexés Objective-C
- 11. iPhone. attributs indexés
- 12. Tableau plat à tableau multidimensionnel
- 13. Array hiérarchique à plat Tableau
- 14. fichier oracle à fichier plat
- 15. Importation de fichier plat!
- 16. ADF dans le scanner à plat
- 17. Efficacité des espaces réservés indexés
- 18. RoR: Performance des champs indexés
- 19. Hiérarchie à partir de Données à plat
- 20. Est-ce que le fichier plat blog SEO friendly?
- 21. importation relative à l'intérieur paquet plat
- 22. Créer JSON imbriqué à partir csv plat
- 23. source de données fichier plat
- 24. Orbeon: oracle et vue à plat
- 25. Convertir les arguments en liste à plat?
- 26. Visual C++ compiler binaire à plat
- 27. BorderStyle.Fixed3D rend à plat sur Windows 8
- 28. Lire le fichier à plat de matlab
- 29. XSLT foreach répétition de nœuds à plat
- 30. SQLite ou fichier texte à plat?
SQLite utilise un seul fichier plat portable pour stocker les objets d'une base de données unique. Il supporte les index et une interface SQL. Mais la taille maximale de la base de données allowd est seulement de 14 To. – Raihan
Vous pouvez utiliser des fichiers texte basés sur JSON ou YAML pour stocker vos tables. La taille maximale du fichier peut être aussi grande que votre système d'exploitation le permet. Il y a Java/Ruby et beaucoup d'autres interfaces de programmation pour JSON et YAML. Mais je ne pense pas que les impements supportent encore l'indexation. Et il n'y a pas d'interface SQL. – Raihan