background preloader

Data Management - ETL

Facebook Twitter

ETL, les questions à se poser. ETL, acronyme de Extraction, Transformation, Loading, est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) jusqu'à l'entrepôt de données (modèles multidimensionnels). Ce système ne se contente pas de charger les données, il doit les faire passer par un tas de moulinettes pour les dé-normaliser, les nettoyer, les contextualiser, puis de les charger de la façon adéquate. Nous verrons par la suite ce que chaque mot veut dire. Il est important de savoir que la réalisation de l'ETL constitue 70% d'un projet décisionnel en moyenne. Et ce n'est pas pour rien, ce système est complexe et ne doit rien laisser s'échapper, sous peine d'avoir une mauvaise information dans l'entrepôt, donc des données fausses, donc inutilisables.

Avant de commencer, visualisez le schéma d'un entrepôt et sa façon de fonctionner (gérer l'historique, dimensions, faits, etc.). Si vous cherchez des méthodes de conceptions d'ETL, et bien il n'y en a pas. III-A. Informatica. Talend - The Open Source Integration Company. InfoSphere DataStage. Intégrer tous les types de données sur des plateformes mainframe et distribuées IBM InfoSphere DataStage intègre des données sur de multiples systèmes en utilisant une structure parallèle à hautes performances et prend en charge la gestion étendue des métadonnées et la connectivité d'entreprise.

Cette plate-forme est évolutive et permet une intégration plus souple de tous les types de données, y compris les volumes massifs de données au repos (basés sur Hadoop) ou en mouvement (basés sur les flux), sur les plateformes mainframe et distribuées. Fonctionnalités et avantages de InfoSphere DataStage Puissante plateforme ETL évolutive—permet de collecter, d'intégrer et de transformer de gros volumes de données, quelle que soit la complexité des structures.

Support du big data et d'Hadoop—vous permet d'accéder directement à des volumes massifs de données sur un système de fichiers distribué. En savoir plus Fermer Puissante plateforme ETL évolutive Support du big data et d'Hadoop Facilité d'emploi. SAP BusinessObjects Data Integrator : assurez la fiabilité des données à l'échelle de l'entreprise – intégration des données.