Recommandé, 2024

Choix De L'Éditeur

Différence entre la table de faits et la table de dimensions

La table de faits et la table de dimensions sont les facteurs essentiels pour créer un schéma . Un enregistrement de table de faits est une combinaison d'attributs de différentes tables de dimension. Le tableau de faits aide l'utilisateur à analyser les dimensions de l'entreprise, ce qui l'aide à prendre des décisions pour améliorer son entreprise. D'autre part, les tables de dimensions aident la table de faits à collecter les dimensions le long desquelles les mesures doivent être prises.

Le point qui distingue la table de faits et la table de dimensions est que la table de dimensions contient des attributs le long desquels des mesures sont prises dans la table de faits . Il existe d'autres facteurs qui créent des différences entre la table de faits et la table de dimensions pour pouvoir les visualiser. Jetons un coup d'œil au tableau de comparaison présenté ci-dessous.

Tableau de comparaison

Base de comparaisonTable de faitsTableau de dimension
De baseLa table de faits contient la mesure le long des attributs d'une table de dimension.La table de dimension contient les attributs le long desquels la table de faits calcule la métrique.
Attribut & RecordsLa table de faits contient moins d'attributs et plus d'enregistrements.La table de dimension contient plus d'attributs et moins d'enregistrements.
Taille de la tableLa table de faits grossit verticalement.La table des dimensions croît horizontalement.
CléLa table de faits contient une clé primaire qui est une concaténation des clés primaires de toutes les tables de dimension.Chaque table de dimension contient sa clé primaire.
CréationUne table de faits peut être créée uniquement lorsque les tables de dimension sont terminées.Les tables de dimensions doivent d'abord être créées.
SchémaUn schéma contient moins de tables de faits.Un schéma contient plus de nombre de tables de dimension.
Les attributsLa table de faits peut contenir des données sous forme numérique et textuelle.La table de dimension contient toujours des attributs au format textuel.

Définition du tableau de faits

Une table de faits est une table contenant les mesures associées aux attributs des tables de dimensions. Il peut contenir les informations au niveau le plus bas possible. Certaines tables de faits contiennent uniquement des données récapitulatives, appelées tables de faits agrégées . La table de faits contient presque les données horodatées . Laissez-nous discuter des caractéristiques d'une table de faits.

Clé concaténée
La table de faits contient la clé concaténée qui est la concaténation des clés primaires de toutes les tables de dimension. La clé de table de faits concaténée doit identifier de manière unique la ligne dans une table de faits.

Grain de données
Le grain de données indique la profondeur à laquelle la table de mesures a été stockée. Le grain de données doit être au plus haut niveau possible.

Mesures additives
Les attributs de la table de faits peuvent être totalement additifs ou semi-additifs . Les mesures totalement additives sont celles qui peuvent facilement être résumées pour toutes les dimensions du tableau. Par exemple, quantity_ordered, est un attribut qui peut être résumé pour toutes les dimensions. Par exemple, nous pouvons soustraire la quantité totale_order, pour un client particulier, une région, une date, une marque, etc. Les mesures semi-additives sont celles qui peuvent être résumées le long de certaines dimensions de la table de faits, mais pas de toutes les dimensions. De même, le montant du solde ne peut pas être résumé dans la dimension temporelle, car il évolue dans le temps.

Données clairsemées
Parfois, nous pouvons voir la table des enregistrements de fait qui a des attributs avec des mesures nulles . Par exemple, il peut ne pas y avoir d’ordre en vacances. Ainsi, les attributs pour cette date auront des mesures nulles. Nous ne sommes pas obligés de stocker des mesures pour ce type d’enregistrements, car ils ne fournissent aucune information.

Dimensions dégénérées
Parfois, vous pouvez rencontrer certaines dimensions de la table de fait, qui ne sont pas du tout additives. Par exemple, order_number, customer_id, vous ne pouvez pas ajouter ces types de dimensions. Cependant, dans le cas où vous auriez besoin de rechercher une commande passée par un client particulier au cours de ce mois; alors vous aurez besoin de customer_id pour relier votre recherche. Ces types si les attributs ou les dimensions de la table de faits sont appelés Dimension dégénérée .

Définition de la table de dimension

La table de dimension est un composant clé de Start Schema.Une table de dimension contient les attributs qui représentent les dimensions, le long desquelles la mesure est effectuée dans la table de faits. Nous discuterons ensuite de certaines caractéristiques d’un tableau de dimensions.

Attributs et clés
Chaque table de dimension doit avoir une clé primaire qui identifie de manière unique chaque enregistrement de la table. Il est communément observé que la table de dimension contient de nombreux attributs. Par conséquent, il semble être large, c’est-à-dire que lorsque vous créez une table de dimension, vous la verrez s’étendre horizontalement .

Valeurs d'attribut
Les valeurs des attributs de la table de dimension sont rarement numériques. La plupart du temps, vous constaterez que les valeurs des attributs sont au format textuel . Par exemple, nom du produit, marque, catégorie, sous-catégorie, etc.

Relation entre attributs
Souvent, vous pouvez observer que les attributs que vous rencontrez dans une table de dimension ne sont pas directement liés. Comme, Product_brand n'a rien à faire avec le package_date mais les deux attributs peuvent être les attributs de la table de dimensions du produit.

Normalisation
La table de dimension n'est pas censée être normalisée . En effet, la normalisation d'une table créerait de nombreuses tables intermédiaires. Lorsqu'une requête sélectionne un attribut dans la table de dimension et récupère les mesures le long de celle de la table de faits, la requête doit parcourir les tables intermédiaires qui deviennent inefficaces. Par conséquent, les tables de dimension ne sont pas normalisées.

Forer, rouler
Les attributs de la table de dimension vous permettent d’obtenir les détails en passant d’un niveau supérieur d’attributs agrégés à un niveau inférieur. Par exemple, si vous souhaitez trouver le total des ventes dans une région, vous pouvez effectuer une recherche approfondie pour trouver les ventes par État, ville, code postal. Vous pouvez même cumuler pour trouver le total des ventes en commençant par le zip, puis par ville et par la suite.

Hiérarchie multiple
La table de dimension offre souvent plusieurs hiérarchies. Par exemple, nous avons une table de dimension de produit pour un magasin. Nous avons maintenant deux départements marketing et comptabilité.

Le service marketing examine en détail les attributs de la table des dimensions du produit dans une certaine hiérarchie afin d’obtenir des mesures pour la table des faits.

D'autre part, le service de la comptabilité explorera les attributs de la table des dimensions du produit dans la hiérarchie afin d'obtenir des mesures pour la table de faits.

Ainsi, la table de dimension doit avoir plusieurs hiérarchies ou niveaux d'agrégation d'attributs pour permettre à l'utilisateur de parcourir l'une des hiérarchies suivantes.

Records
Bien qu'une table de dimension comporte trop d'attributs, elle contient moins d'enregistrements.

Principales différences entre la table de faits et la table de dimensions

  1. La table de faits contient la mesure le long des dimensions / attributs d'une table de dimensions.
  2. La table de faits contient plus d'enregistrements et moins d'attributs que la table de dimensions, alors que la table de dimensions contient plus d'attributs et moins d'enregistrements.
  3. La taille de la table de faits augmente verticalement, alors que celle de la table de dimensions augmente horizontalement.
  4. Chaque table de dimension contient une clé primaire pour identifier chaque enregistrement de la table, tandis que la table de faits contient une clé concaténée qui est une combinaison de toutes les clés primaires de toutes les tables de dimension.
  5. La table de dimension doit être enregistrée avant la création de la table de faits.
  6. Un schéma contient moins de tables de faits mais plus de tables de dimensions.
  7. Les attributs de la table de fait sont numériques aussi bien que textuels, mais les attributs de la table de dimension ont uniquement des attributs textuels.

Conclusion:

Les deux sont également importants pour la création d'un schéma, mais la table de dimension doit être enregistrée avant la table de faits. Comme il est impossible de créer une table de faits sans dimensions.

Top