Je travaille sur une solution SSIS pour datawarehouse pour extraire les clés de substitution des clés d'application correspondantes, j'utilise la tâche de recherche de SSIS, mais le problème avec cette tâche est qu'il met en cache la table de consultation complète dans sa mémoire. Et la taille de ma table de consultation est énorme, c'est-à-dire 20 millions de disques. Donc, si vous pouvez suggérer des moyens ou des alternatives pour la tâche de rechercheAlternative pour la tâche de recherche dans SSIS
Répondre
Faites un LEFT JOIN avec vos données de recherche lorsque vous apportez les données dans le package SSIS, puis évaluez ce dont vous avez besoin.
Si la table de recherche est dans une source différente, vous pouvez faire un LEFT JOIN dans SSIS, mais cela va également mettre en cache des lignes. Je pense que le JOIN peut être légèrement plus rapide qu'un Lookup.
Faut-il scanner la totalité de la table? C'est à dire. pouvez-vous spécifier votre recherche en tant que vue de base de données sur la table, ou même la spécifier comme résultat d'une requête SQL (Utiliser les résultats d'une requête SQL)
Je ne considère pas une table avec 20 millions d'enregistrements trop grande pour Chercher. Vous pouvez faire un peu de filtrage et en sélectionnant uniquement les colonnes requises dans la recherche, vous pouvez l'optimiser pour utiliser une petite quantité de mémoire. Par exemple, si vous avez une colonne clé de type int et une colonne varchar de taille 10 nécessaire pour la recherche, un enregistrement prendra 4 + 10 octets et 20millions vont à 20Mx (4 + 10) ~ = 280MB qui ne peut pas être considéré comme trop élevé. Toujours si vous voulez réduire l'utilisation de la mémoire, vous devrez utiliser des jointures.
Assurez-vous de ne sélectionner que les colonnes dont vous avez besoin dans la table de correspondance, ne mettez pas en cache les colonnes inutiles. Trouvez un peu de temps pour jeter un oeil à MS "Project "Real" qui utilise SSIS dans les applications à haut volume de données et discute des meilleures pratiques.
- 1. SSIS Webservice Tâche
- 2. Problème de validation dans SSIS XML Tâche
- 3. Utilisation/implémentation de la fonction exsl node-set() dans la tâche XML de SSIS Tâche
- 4. Recherche de chemins d'accès sources à l'aide de la tâche de recherche de tâche
- 5. Vérifiez numérique dans DerivedColumn flux de données Tâche dans SSIS
- 6. SSIS - clé de substitution de recherche pour parent
- 7. Compilez par programme une tâche de script dans SSIS
- 8. Traitement des erreurs de tâche de script SSIS Dataflow
- 9. SSIS 2005 Délai de tâche de processus Problème
- 10. Tâche de transfert SSIS qui gère les modifications de schéma
- 11. SSIS recherche floue avec plusieurs sorties par erreur de recherche
- 12. Définition du délai d'expiration d'une tâche de script SSIS 2005
- 13. Pouvez-vous exécuter une tâche SSIS à partir de .net?
- 14. Ignorer les erreurs dans la tâche Exécuter le package dans SSIS
- 15. Get erreur FileNotFoundException quand appeler un ActiveX dans la tâche de script SSIS
- 16. Dictionnaire, énumération ou autre alternative pour implémenter une priorité d'une tâche dans MVC?
- 17. Comment parcourir la tâche de boucle foreach?
- 18. Qu'advient-il du jeu de résultats si la table de recherche dans la tâche de recherche est vide?
- 19. Ruby alternative pour Lucene
- 20. Effectuer une tâche dans JSP à l'aide d'une recherche Hashmap
- 21. Obtention de l'ID de la tentative de tâche pour la tâche Hadoop en cours d'exécution
- 22. Panne intermittente pour s'engager package SSIS dans la transaction DTC
- 23. Erreur de gravité dans SSIS
- 24. Pagination dans pour la recherche
- 25. Utilisation de la comparaison alternative dans HashSet
- 26. SSIS - Exécution d'une recherche sur une autre table pour obtenir la colonne correspondante
- 27. mysql_insert_id alternative pour postgresql
- 28. Biztalk alternative pour l'automatisation de la gestion des systèmes?
- 29. Meilleure alternative pour c + ancienne fonctionnalité?
- 30. Conception de packages SSIS
mais le problème est la table de recherche est dans une source différente et la mise en cache de l'exécution de la table pour une telle grande table semble être une option payante – paranjai