MasterDBA Cours 9: Snowflake Architecture PDF
Document Details
Uploaded by AffectionateHeliotrope9042
Université Paris-Cité
Tags
Summary
Ce document présente les concepts clés et l'architecture de Snowflake, une plateforme de données avancée. Il aborde des sujets comme le stockage, le traitement des données, et les connexions à Snowflake.
Full Transcript
Diapositive 1: Concepts Clés & Architecture Data Cloud de Snowflake o Plateforme de données avancée : Snowflake offre une plateforme de données de pointe fournie en tant que service autogéré. o Service autogéré : Snowflake s'occupe de tout, des mises à jour à...
Diapositive 1: Concepts Clés & Architecture Data Cloud de Snowflake o Plateforme de données avancée : Snowflake offre une plateforme de données de pointe fournie en tant que service autogéré. o Service autogéré : Snowflake s'occupe de tout, des mises à jour à la maintenance, ce qui permet aux utilisateurs de se concentrer sur l'analyse des données. o Solutions de stockage, traitement, et analyse des données : Les solutions Snowflake sont conçues pour être plus rapides, plus faciles à utiliser et plus flexibles que les offres traditionnelles. Diapositive 2: Plateforme de Données Caractéristiques o Pas de technologie de base de données existante ou de plateforme "big data" : Snowflake n'est pas construit sur des technologies existantes comme Hadoop. o Nouveau moteur de requêtes SQL : Snowflake propose un moteur de requêtes SQL innovant. o Architecture innovante conçue pour le cloud : Snowflake est nativement conçu pour fonctionner dans le cloud. Diapositive 3: Service Autogéré Snowflake en tant que service autogéré o Pas de matériel à gérer : Ni matériel physique ni virtuel à gérer. o Pas de logiciel à installer ou configurer : L'installation et la configuration logicielle sont gérées par Snowflake. o Maintenance et mises à jour gérées par Snowflake : Les utilisateurs n'ont pas à se soucier de la maintenance. o Infrastructure entièrement cloud : Snowflake fonctionne entièrement sur des infrastructures cloud publiques. o Non disponible en infrastructures cloud privées : Snowflake ne peut pas être exécuté sur des infrastructures cloud privées ou sur site. Diapositive 4: Architecture de Snowflake Architecture Hybride o Combinaison de architectures à disque partagé et à rien partagé : Utilise un dépôt central de données pour le stockage tout en traitant les requêtes avec des clusters MPP. o Utilisation de clusters de traitement massivement parallèle (MPP) : Chaque nœud dans le cluster stocke une partie des données localement. o Simplicité de gestion des données et avantages de performance : Combine la simplicité de gestion des données d'une architecture à disque partagé et les avantages de performance d'une architecture à rien partagé. Diapositive 5: Couches Clés de l'Architecture Stockage des Données o Format interne optimisé et compressé : Les données sont réorganisées et compressées dans un format optimisé par Snowflake. o Gestion complète par Snowflake : Snowflake gère tous les aspects du stockage des données, y compris la taille des fichiers, la compression, et les métadonnées. Traitement des Requêtes o Utilisation de "entrepôts virtuels" : Les requêtes sont traitées par des clusters de calcul indépendants appelés entrepôts virtuels. o Clusters de calcul indépendants : Chaque entrepôt virtuel est indépendant et n'affecte pas les performances des autres. Services Cloud o Coordination des activités sur Snowflake : Les services cloud coordonnent les activités, de la connexion à l'exécution des requêtes. o Gestion des services comme authentification, infrastructure, métadonnées, etc. : Services de gestion, incluant l'authentification, la gestion des métadonnées, et l'optimisation des requêtes. Diapositive 6: Connexion à Snowflake Méthodes de Connexion o Interface utilisateur web : Accès à toutes les fonctionnalités de gestion et d'utilisation de Snowflake via une interface web. o Clients en ligne de commande (e.g., SnowSQL) : Accès complet aux fonctionnalités de gestion et d'utilisation. o Pilotes ODBC et JDBC : Connexion de Snowflake à d'autres applications comme Tableau. o Connecteurs natifs et tiers : Développement d'applications pour la connexion à Snowflake via des connecteurs natifs (e.g., Python, Spark) ou tiers (e.g., Informatica, ThoughtSpot).