Snowflake

A travers, ce tutoriel pas-à-pas nous souhaitions vous montrer comment stocker et visualiser des données dans Snowflake.

Ici, on utilisera l’interface web de Snowflake, mais notez qu’il est également possible de réaliser les actions à partir du terminal de l’éditeur qui est SnowSQL.
Avant de commencer, il est essentiel de disposer d’un compte Snowflake

Snowflake propose une version d’essai en s’inscrivant simplement sur le lien suivant :  https://trial.snowflake.com/

Au moment de choisir l’édition, choisissez l’édition Entreprise pour disposer d’un grand nombre de fonctionnalités.

Pour connaître la différence entre les différentes versions, suivez le lien suivant: https://docs.snowflake.com/fr/user-guide/intro-editions.html#enterprise-edition

Télécharger le fichier “csv” dans lequel chaque ligne sera stockée dans Snowflake.
Ce fichier regroupe les commandes d’une enseigne d’une grande distribution.
Le fichier .csv est composé de six colonnes séparées par des “;”

 

Stockage des données du fichier csv dans Snowflake

Pour stocker et interroger les données dans Snowflake, il sera nécessaire de créer une base de données, une table et un entrepôt de données virtuel.

Connexion à l’interface web Snowflake

Lors de l’inscription, vous vous êtes connecté une première fois sur l’interface web Snowflake avec un lien URL personnel.
Le format du lien URL à le squelette suivant:  https://cp76690.europe-west4.gcp.snowflakecomputing.com
Les lettres surlignées correspondent au nom de compte. Il est unique.
Connectez-vous à votre interface web Snowflake depuis votre lien personnel: https://<nom_de_compte>.snowflakecomputing.com/console#/data/stages?databaseName=MYDATABASE
Renseigner le nom d’utilisateur et le mot de passe

 

stocker et visualiser des données dans Snowflake facilement

 

Après la connexion, vous devriez arriver sur l’un des onglets disponible, de l’interface Web Snowflake :

 

stocker et visualiser des données dans Snowflake facilement

 

Pour charger les données, une base de données et une table sont nécessaires. Aussi, il y aura besoin d’un entrepôt virtuel pour fournir les ressources de calcul nécessaires pour effectuer les tâches.
Les parties qui suivent vous explique comment créer ça.

Stocker et visualiser des données dans Snowflake : création d’une base de données

Cliquer sur le bouton  puis cliquer sur le bouton  pour créer une nouvelle base de données.
Sur la nouvelle fenêtre, renseigner un nom à la base de données en écrivant DEMO_BDD puis cliquer sur Finish.
Cliquer sur Show SQL, si vous souhaitez voir la requête SQL.

 

stocker et visualiser des données dans Snowflake facilement

 

 

Chaque base de données créée dans Snowflake contient un schéma par défaut qui s’appelle public.

 

Stocker et visualiser des données dans Snowflake : création d’une table

Cliquer sur le nom de la table DEMO_BDD pour rentrer dans la base de données.
Puis, cliquer sur le bouton pour créer une nouvelle table.

 

stocker et visualiser des données dans Snowflake facilement

Dans la nouvelle fenêtre, remplir le champ Table Name en renseignant le nom Commandes.
Garder le schéma PUBLIC
Ajouter les colonnes comme sur l’image ci-dessous en cliquant sur le bouton .
Les colonnes correspondent à ceux présentent dans le fichier csv.

ok

Cliquer sur Show SQL, si vous souhaitez voir la requête SQL.
Cliquer sur Finish

Stocker et visualiser des données dans Snowflake : Création d’un entrepôt de données virtuel

Pour créer un entrepôt virtuel, naviguez vers l’onglet Datawarehouses en cliquant sur le bouton  dans le menu en haut à gauche de l’interface.
Cliquer sur le bouton pour créer un nouveau Datawarehouse.
Sur la nouvelle fenêtre, dans le champ Name, écrire DEMO_ENTREPOT pour nommer le datawarehouse.
Dans le menu déroulant suivant, choisir X-SMALL pour le champ size. Pour avoir plus d’information sur les tailles des entrepôts de données, suivre le lien suivant: https://docs.snowflake.com/en/user-guide/warehouses-overview.html

L’utilisation des datawarehouses dans Snowflake consomme des crédits. Grâce à l’utilisation de ces crédits Snowflake peut facturer le client. Ainsi, le client ne paye que ce qu’il utilise. L’utilisation d’un entrepôt de données permet pour la suite du tutoriel d’exécuter des requêtes.

Dans le champ Maximum Clusters, choisir 1.
Garder le champ Scaling Policy à STANDARD
Changer le champ Auto Suspend à 5 minutes. Après 5 minutes d’inactivité, l’entrepôt s’arrête.
Maintenir coché le champ Auto Resume.
Cliquer sur le bouton Finish.

 

ok

Stocker et visualiser des données dans Snowflake : préparation et chargement du fichier de données dans Snowflake

Pour prendre en charge les données du fichier csv par Snowflake, il faut intégrer les données dans une zone de préparation interne de l’outil. Ensuite, charger les données dans Snowflake.
Le chargement à partir d’une zone de préparation externe est pratique si les fichiers de données sont stocké dans des services de stockage sur cloud comme par exemple Amazon S3, Google Cloud Storage ou Microsoft Azure).

Dans cette partie, le tutoriel explique le téléchargement du fichier vers une zone de préparation de table interne, puis le chargement des données dans la base de données.

Aller dans l’onglet Databases en cliquant sur le bouton .
Sélectionner la base de données Demo_BDD. Ensuite, sélectionner la table COMMANDES
Cliquer sur le bouton pour charger les données du fichier dans la zone de préparation des fichiers puis dans la table cible.
Dans la nouvelle fenêtre, choisir l’entrepôt de données que vous avez créé “DEMO_ENTREPOT” puis cliquer sur Next.

 

 

ok

Choisir l’emplacement où est sauvegardé le fichier csv pour le charger dans l’interface. Cliquer sur Select Files puis sélectionner le fichier commandes.csv.

 

stocker et visualiser des données dans Snowflake facilement

 

Cliquer sur Next
Cliquer sur le bouton  pour créer un modèle de format de fichier csv.
Dans la nouvelle fenêtre, paramétrer comme sur l’image ci-dessous:

 

ok

 

Interrogation des données

Visualisation des données chargées :

Pour vérifier et visualiser les données précédemment chargées, cliquez sur l’onglet Worksheets
Sur le worksheet, exécuter la requête: use DEMO_DB pour utiliser la base de données créée précédemment.

Résultat :

 

 

 

 

Ensuite, exécuter la requête suivante pour voir les données dans la table commande.

SELECT * FROM “DEMO_BDD”.”PUBLIC”.”COMMANDES”;

 

 

Au cours de ce tutoriel, vous avez appris à créer une base de données, une table, et un entrepôt virtuel. Puis à charger les données dans un espace de préparation avant de le charger dans la table.
Snowflake permet d’administrer les données d’une nouvelle façon dans le cloud mais les fondamentaux restent les mêmes que ce qu’on a l’habitude de faire sur une machine physique.

D’autres tutoriels expliquant la création et l’intégration de données sont aussi disponibles sur le site :

N’hésitez pas à regarder la vidéo de ce tutoriel sur notre chaîne Youtube.

 


AlexisDepuis plus de 15 ans maintenant, je travaille sur des sujets liés à la BI et à l’amélioration des processus. J’ai participé à un grand nombre de projets en tant que leader technique sur de nombreuses technologies. De nature pédagogue, je donne également des cours de langage de programmation.

N’hésitez pas à me faire un retour sur cet article ou à me contacter sur LinkedIn pour échanger sur ces sujets!

Alexis

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Abonnez-vous à notre newsletter

Saisissez votre adresse e-mail pour vous abonner à ce blog et recevoir les derniers articles publiés!