L’ETL (Extract Transform Loading), recouvre à la fois des outils informatiques et des processus d’alimentation. Il s’agit d’une solution clé dans l’intégration d’applications, surtout la Business Intelligence, le support à la décision et le datawarehousing. Applications, outils et processus ETL sont des briques d’une infrastructure de SI dont la valeur ajoutée et le retour sur investissement s’expriment dans le temps en accompagnant l’évolution du système d’information global ou du système de business intelligence.
Les solutions ETL gèrent toutes les étapes de la collecte des données dans les systèmes d'information hétérogènes : SGBD, ERP, applications spécifiques, bases hiérarchiques..., depuis le nettoyage des données collectées, la consolidation et la mise en concordance des données éparses jusqu’à leur distribution auprès des applications cibles ou des systèmes décisionnels. Le processus ETL est une opération de migration de données qui consiste aussi à augmenter la valeur ajoutée de l’information et à la rendre aisément consommable pour les systèmes de business intelligence. Un processus ETL se décompose en trois phases : l'extraction, la préparation/transformation et le chargement.
Il s’agit d'aller chercher les données là où elles se trouvent. La solution ETL peut se connecter aux différentes applications, bases de données ou fichiers. Plusieurs technologies sont utilisables : - Les passerelles fournies par les éditeurs de bases de données
- Les utilitaires de réplication, utilisables si les systèmes de production et décisionnels, sources et cibles, sont homogènes
- Les outils spécifiques d'extraction
La transformation et le contrôle des données
Les solutions ETL sont des ateliers spécialisés dans la migration de données. La transformation des données est leur fonctionnalité principale. Ces solutions doivent fournir une fonction permettant de vérifier qu’une donnée est cohérente par rapport aux données déjà existantes dans la base cible. Ils doivent aussi fournir d’excellents outils pour convertir les données. Enfin, ils doivent être conçus pour manipuler de gros volumes de données. L’étape de contrôle s’effectue par application de règles adaptées sur les flux de données entrant. Bien souvent les incohérences ne sont découvertes que dans cette phase.
Le chargement et le transfert des données
Le chargement prend en compte la gestion du format final des données.
On distingue deux approches : - Le transfert de fichiers : l’ETL transporte les données du système source vers le système cible via un moteur.
- Le transfert de base à base. Dans ce cas, les outils travaillent en mode connecté, d’une source de données à une cible. Les données sont extraites ensemble à la source, puis transférées à la cible en y appliquant éventuellement des transformations à la volée. Un seul processus, plus rapide, a ainsi l’avantage de pouvoir à la fois effectuer les transferts et toutes les autres opérations d’alimentation, sans rupture. Ces processus sont spécifiques aux différentes bases et sont plus difficiles à normaliser.
|
Le téléchargement du guide ETL est gratuit.
Nombre de pages : 50 Nombre de critères technologiques : 127 Format : PDF - 446 Ko Sommaire et page de téléchargement...
Contribuer ?Vous maîtrisez un sujet, vous souhaitez faire partager une expérience récente, vous souhaiter compléter un point dans un document… Vous êtes les bienvenus pour participer à l’évolution des documents publiés. |