Ce document a pour objectif de montrer pas à pas comment importer 2 fichiers CSV sous Talend en créant une jointure pour transformer les données de ces deux fichiers.
Avant de commencer, quelques prérequis sont nécessaires :
- Télécharger et installer Talend
- Avoir deux fichiers permettant d’effectuer une jointure
Création des métadonnées pour transformer des données dans Talend
- Sous Talend, effectuez un clic droit sur «fichier délimité » sous Métadonnées puis renseignez les éléments dans la fenêtre qui s’ouvre. Cliquez sur Next ensuite.
- Sélectionnez le fichier et changez le format en « Windows ». Cliquez ensuite sur « Next ».
- Cochez « Définir les lignes d’en-têtes comme nom de colonnes » puis rafraîchissez l’aperçu. Cliquez ensuite sur « Next ».
- Changez le nom, définissez la clé primaire du fichier puis cliquez sur « Finish »
- La création des métadonnées est terminée pour un fichier. Recommencez pour le deuxième fichier.
Création d’une jointure pour transformer des données dans Talend
- Effectuez un clic droit sur « Jobs » et sélectionnez « Créer un job »
- Remplissez les éléments de la fenêtre qui s’ouvre puis cliquez sur finish. Le job va ainsi être créé
- Glissez les éléments suivants dans la fenêtre du job et reliez-les entre eux :
- Les métadonnées liées aux 2 fichiers (composant : tFileInputDelimited)
- Les composants tMap et tFileOutputDelimited
Un premier composant tMap transforme et dirige les données à partir d’une ou plusieurs source(s) et vers une ou plusieurs destination(s).
Le second composant tFileInputDelimited lit un fichier ou un flux de données ligne par ligne avec des champs simples séparés. Le dernier composant tFileOutputDelimited transmet des données vers un fichier délimité. |
- Paramétrons la jointure de la façon suivante dans le composant tMap :
- La jointure va utiliser le champ « ID_COMMANDE » comme clé de jointure. Nous pouvons définir le modèle de jointure en « Inner Join ».
- Dans ce même composant, nous allons définir les colonnes qui seront dans le fichier CSV :
- Il faut dans un premier temps concaténer les colonnes « Transporteur » et « Lieu_Entrepôt» qui se trouvent dans les deux fichiers pour créer une colonne unique.
- Ensuite, changer le format du champ « DATE_LIVRAISON » en l’inversant et en changeant le délimiteur.
- Puis, nous allons ajouter les autres colonnes dans le fichier.
- Cliquez sur « OK » puis dans le composant «tFileOutputDelimited », changez le nom du fichier de sortie et ajoutez les entêtes au fichier.
- Exécutez le job puis rendez vous dans le dossier dans lequel le fichier est généré.
- Le fichier de sortie a été généré : nous avons bien fusionné les deux fichiers. De plus, la colonne « FILIALE » a bien été créé et le changement de format de date a bien été pris en compte
Ce tutoriel pas à pas est désormais terminé, vous savez maintenant comment transformer des données dans Talend.
D’autres tutoriels sur Talend sont disponibles sur le blog :
Une vidéo démo est également disponible sur notre chaîne YouTube.
Depuis plus de 15 ans maintenant, je travaille sur des sujets liés à la BI et à l’amélioration des processus. J’ai participé à un grand nombre de projets en tant que leader technique sur de nombreuses technologies. De nature pédagogue, je donne également des cours de langage de programmation.
N’hésitez pas à me faire un retour sur cet article ou à me contacter sur LinkedIn pour échanger sur ces sujets!
Alexis
Laisser un commentaire