Modele en etoile vs flocon

| 0

Mon opinion personnelle est cette approche produit de meilleures performances, surtout si les colonnes sont fortement indexées et les requêtes sont sélectives. Une approche typique de modèle de schéma de Star devrait ressembler à l`image ci-dessous, sur cet exemple de modèle de géographie et de dimensions temporelles pourrait être candidats à un certain degré de normalisation des données. Le schéma de flocon de neige est dans la même famille que le modèle logique de schéma d`étoile. En fait, le schéma d`étoile est considéré comme un cas particulier du schéma de flocon de neige. Le schéma de flocon fournit quelques avantages sur le schéma d`étoile dans certaines situations, y compris: comme mentionné, la normalisation est une différence clé entre les schémas d`étoile et de flocon de neige. En ce qui concerne cela, il y a quelques choses à savoir: le schéma d`étoile et le schéma de flocon de neige sont des modèles relationnels utilisés pour organiser des entrepôts de données et/ou des Marts de données. Peu importe leur similitude, ils démontrent deux approches différentes et ont leurs propres avantages et inconvénients. Personnellement, j`irais avec le schéma de flocon de neige lors de la mise en œuvre d`un entrepôt de données (pour économiser de l`espace de stockage) et avec le schéma d`étoile pour les données Marts (pour rendre la vie plus facile pour les utilisateurs professionnels). De toute façon ce n`est pas un dogme, de nos jours les machines sont si puissantes, la mémoire est devenue beaucoup moins cher et les disques SSD sont devenus la règle, il peut même être plus rapide à utiliser une approche normalisée ensemble (flocon de neige) et de faire des tables de mémoire résident (fonctionnalité SQL Server) comme une fois ils sont en mémoire, il peut être plus rapide de les rejoindre que de charger des données à partir d`un non-mémoire résident dénormalisé table. Si les dimensions sont petites se joindre à eux peut être très rapide.

Vous pouvez même avoir les deux approches en même temps, dans Oracle, vous pouvez avoir une approche de flocon de neige pour un ensemble de tables et, en arrière-plan, utiliser une vue matérialisée qui joint des tables. Selon le plan d`explication des requêtes, Oracle utilisera la meilleure approche de recherche (joindre des tables ou accéder directement à la vue matérialisée). C`est pourquoi les développeurs devraient bien séparer la théorie de la logique de modélisation des cas du monde réel et connaître vos outils le mieux que vous pouvez. Certaines fonctionnalités de l`outil peuvent vraiment faire la différence en ce qui concerne ETL ou les données explorant les temps de fonctionnement. Ce schéma de flocon stocke exactement les mêmes données que le schéma d`étoile. La table de faits a les mêmes dimensions que dans l`exemple de schéma en étoile. La différence la plus importante est que les tables de dimension dans le schéma de flocon de neige sont normalisées. Fait intéressant, le processus de normalisation des tables de dimension est appelé snowflaking. La simplicité d`un schéma d`étoile suffira dans beaucoup de conceptions et il a certainement l`avantage de moins de jointures pour construire et entretenir. Cependant, il y a des cas qui appelleront pour une conception de flocon de neige. Certains outils de Reporting OLAP fonctionnent plus efficacement avec une conception de flocon de neige. Les jointures à plusieurs niveaux disponibles dans une conception de flocon de neige peuvent également simplifier l`agrégation.

Par exemple, si la dimension de date est enneigée en jour, mois et année et qu`un agrégat mensuel est généré, cette dimension de mois existante peut facilement être utilisée par la table d`agrégats. Le schéma d`étoile et le schéma de flocon de neige sont des manières d`organiser des Marts de données ou des entrepôts entiers de données utilisant des bases relationnelles. Les deux utilisent des tables de dimension pour décrire les données agrégées dans une table de faits. Les schémas d`étoile et de flocon de neige sont similaires au cœur: une table de faits centrale entourée de tables de dimension. La différence est dans les dimensions elles-mêmes. Dans un schéma d`étoile, chaque dimension logique est dénormalisée en une seule table, tandis que dans un flocon de neige, au moins certaines des dimensions sont normalisées. (s`il vous plaît envisager pour plus d`informations détaillées, vous pouvez également visiter la page d`accueil Teradata ou LearnDataModelling page d`accueil) Lors du choix d`un schéma de base de données pour un Data Warehouse, les schémas flocon et étoile tendent à être des choix populaires. Cette comparaison traite de l`adéquation des schémas Star vs flocon de neige dans différents scénarios et leurs caractéristiques. Pour obtenir le même résultat du schéma de flocon de neige, nous devons utiliser cette requête: Quelles sont les principales différences dans le schéma de flocon de neige et d`étoile et où devraient-elles être appliquées? Le modèle de schéma Star est utile pour l`analyse des métriques, par exemple «quel est le revenu d`un client donné?» Dans les deux articles précédents, nous avons considéré les deux modèles d`entrepôt de données les plus courants: le schéma d`étoile et le schéma de flocon de neige.