Energie & Ressources

Veolia

Transformations et analyses de données de consommateurs d’eau pour Veolia

Contexte

Dans le cadre de son programme Publication de données Consommateurs, Veolia Eau a sollicité Astrakhan pour mettre en œuvre un certain nombre d’extractions de données à destination des collectivités.
Veolia a par la suite prolongé la mission, pour intégrer une équipe transverse dédiée à la transformation, structuration et analyse des données clients consommateurs suite à la migration de certaines données vers une plateforme Cloud, ouvrant la voie à de nombreux projets en interne.

Nos réalisations

● Mise en place d’un programme d’extraction automatique d’un ensemble de données du Data Warehouse vers des fichiers XML structurés de différentes manières
● Intégration et traitement de données textuelles
● Implémentation d’un pipeline de transformation de données textuelles
● Création d’un pipeline de nettoyage et de mise en forme de données clients dans un projet de migration vers un logiciel de CRM
● Conception et création de vues d’objets métier et d’indicateurs
● Mise en place d’un proof of concept de segmentation de données clients anonymisées en vue de proposer un service d’envoi de factures par e-mail

Bénéfices Client

Notre intervention a permis à Veolia Eau de migrer ses données vers des outils plus récents et mieux adaptés à ses besoins :
● Automatisation des extractions de données aux formats demandés par différentes collectivités
● Intégration et nettoyage de données textuelles non formatées
● Migration de données clients vers un outil cible
● Formatage de données dans le data warehouse
● Segmentation de données clients (profils type)

Notre valeur ajoutée

● Astrakhan a contribué au développement et à l’automatisation de processus de data engineering adaptés aux plateformes Cloud leaders du marché
● Astrakhan possède un savoir-faire sur la manipulation et l’analyse de tous types de données, qu’elles soient entre autres textuelles ou numériques
● Astrakhan propose des prestations portant sur toute la chaîne de la donnée, notamment en data science et en data engineering