En termes simples, un data mart est un entrepôt de données dont la portée est limitée et dont les données peuvent être obtenues en résumant et en sélectionnant les données à partir de l'entrepôt de données ou à l'aide d'extraits, de transformations et de chargements distincts à partir du système de données source.
Tableau de comparaison
Base de comparaison | Entrepôt de données | Data Mart |
---|---|---|
De base | L'entrepôt de données est indépendant de l'application. | Le magasin de données est spécifique à l'application du système d'aide à la décision. |
Type de système | Centralisé | Décentralisée |
Forme de données | Détaillé | Résumé |
Utilisation de la dénormalisation | Les données sont légèrement dénormalisées. | Les données sont fortement dénormalisées. |
Modèle de données | De haut en bas | De bas en haut |
La nature | Durée de vie flexible, orientée données et longue durée. | Durée de vie limitée, orientée projet et courte. |
Type de schéma utilisé | Constellation de faits | Étoile et flocon |
Facilité de construction | Difficile à construire | Simple à construire |
Définition d'entrepôt de données
Le terme entrepôt de données désigne un groupe de données à variation temporelle, orientée sujet, non volatile et intégré qui aide le processus de prise de décision de la gestion. Sinon, il s'agit d'un référentiel d'informations rassemblées à partir de sources multiples, stockées dans un schéma unifié, sur un site unique permettant l'intégration de divers systèmes d'application. Une fois que ces données sont collectées, elles sont stockées pendant une longue période. Elles ont donc une longue durée de vie et permettent d'accéder à des informations historiques .
Par conséquent, l'entrepôt de données fournit à l'utilisateur une seule interface intégrée aux données à travers laquelle l'utilisateur peut écrire facilement des requêtes d'aide à la décision. Data Warehouse aide à transformer les données en information. La conception d'un entrepôt de données comprend une approche descendante.
Il rassemble des informations sur des sujets couvrant l'ensemble de l'organisation, tels que les clients, les ventes, les actifs, les articles et, par conséquent, sa gamme s'étend à l'ensemble de l'entreprise. Généralement, le schéma de constellation de faits est utilisé dans celui-ci, qui couvre une grande variété de sujets. Un entrepôt de données n'est pas une structure statique et évolue constamment.
Définition de Data Mart
Un magasin de données peut être appelé en tant que sous-ensemble d'un entrepôt de données ou d'un sous-groupe de données à l'échelle de l'entreprise correspondant à un certain ensemble d'utilisateurs. L'entrepôt de données implique plusieurs magasins de données logiques et départementaux qui doivent être persistants dans leur illustration de données pour assurer la robustesse d'un entrepôt de données. Un data mart est un ensemble de tableaux qui se concentrent sur une tâche unique. Ils sont conçus selon une approche ascendante.
Comme les schémas étoile et flocon sont orientés vers la modélisation à sujet unique, ils sont couramment utilisés dans le data mart. Bien que le schéma en étoile soit plus populaire que le schéma en flocon de neige. Selon la source de données, les magasins de données peuvent être classés en deux types: des magasins de données dépendants et indépendants .
Différences clés entre Data Warehouse et Data Mart
- L'entrepôt de données est indépendant de l'application alors que le magasin de données est spécifique à l'application du système d'aide à la décision.
- Les données sont stockées dans un seul référentiel centralisé dans un entrepôt de données. Par contre, data mart stocke les données de manière décentralisée dans la zone utilisateur.
- L'entrepôt de données contient un formulaire détaillé de données. En revanche, le magasin de données contient des données résumées et sélectionnées.
- Les données d'un entrepôt de données sont légèrement dénormalisées, tandis que dans le cas d'un magasin de données, elles sont fortement dénormalisées.
- La construction de l'entrepôt de données implique une approche descendante . À l'inverse, lors de la construction d'un magasin de données, l'approche ascendante est utilisée.
- Data Warehouse est flexible, orienté informations et existant depuis longtemps. Au contraire, un data mart est restrictif, orienté projet et a une existence plus courte.
- Le schéma de constellation de faits est généralement utilisé pour la modélisation d'un entrepôt de données, tandis que le schéma en étoile du magasin de données est plus populaire.
Conclusion
Data Warehouse offre une vue d'entreprise, un système de stockage unique et centralisé, une architecture inhérente et une indépendance des applications, tandis que Data Mart est un sous-ensemble d'un entrepôt de données qui fournit une vue par département, un stockage décentralisé. Comme l'entrepôt de données est très grand et intégré, il présente un risque élevé d'échec et de difficulté à le construire. D'autre part, le magasin de données est facile à construire et le risque de défaillance associé est également moindre, mais le magasin de données peut connaître une fragmentation.