Définition et enjeux du Data Catalog
Définition
Aujourd’hui, il existe plusieurs définitions de ce qu’on appelle un « Data Catalog ». Mais que désigne t-on par ce terme ?
Le groupe de mots « Data Catalog », à travers l’association de ses deux termes constitutifs, semble faire référence à deux notions, celle de la « Data » et du « Catalog ». Le terme « Catalog » désigne généralement une liste d’items avec une description associée. Celui de « Data » semble, quant à lui correspondre à la description d’une notion, d’une caractéristique, d’une liste de valeurs ou d’une quantité de quelque chose. Celle-ci peut être associée ou non à une ou plusieurs implémentations.
Vous trouverez dans notre prochain livre blanc la définition du Data Catalog établie par les experts d’Astrakhan.
Les enjeux du Data Catalog
Le Data Catalog peut être une application ou un assemblage applicatif constitué entre autres, d’un module de modélisation de processus métier autour de la donnée, d’une couche d’intégration de données ou encore d’un moteur de recherche.
Aujourd’hui, il est utilisé par les entreprises pour :
● Effectuer un inventaire et organiser les données disponible de leur système,
● Centraliser et répertorier les termes métier et les données techniques,
● Tracer les données et permettre de maîtriser le cycle de vie des données,
● Faire le lien entre différents niveaux de modélisation
● Permettre la recherche de données avec un vocabulaire métier.
Il peut également permettre d’opérer des règles de gestion adaptées à différentes catégories de données.
Ces fonctionnalités qui permettent, de par l’utilisation du Data Catalog par les entreprises, de tirer le meilleur parti de la valeur qu’apporte la donnée.
Data Catalog : pourquoi il est si important ?
L’utilisation du Data Catalog représente un enjeu crucial pour les entreprises. Identifier une tendance amène Astrakhan à questionner l’ensemble des actions et initiatives présentant une dépendance à l’usage du Data Catalog.
Avant de venir rejoindre la longue liste de produits sur étagère proposée par certains éditeurs, une implémentation de Data Catalog, plus centrée sur le(s) produit(s) de l’éditeur, était proposée comme complément (voire comme option) du produit et/ou de la plateforme proposée.
La tendance actuelle se voulant plus en faveur de modèles de programmation statistique afin d’établir et/ou d’opérationnaliser une analyse, une description ou une prédiction à partir d’un modèle utilisant les données de l’entreprise, on peut très bien imaginer la dépendance croissante de ces initiatives vis à vis de la métadonnée.
Cette dépendance semble se caractériser entre autres par le niveau d’unification sémantique et de conformité de la donnée (Data Quality, Data Governance, MDM) pour le modèle envisagé (BI, Analytics, AI, Machine Learning…) ainsi que par l’usage de la donnée par la technologie (plateforme cloud, ETL, stockage de grandes quantités sous des systèmes de fichiers, analyseur de logs, système de stockage de données opérationnels…).
De même et sans doute pour répondre aux impasses des programmes et/ou projets de gouvernance de données confrontées à la constitution d’un inventaire dans le cadre de ces initiatives, cette métadonnée (longtemps ignorée par les promoteurs de solution application driven et/ou digital) se retrouve propulsée au-devant de la scène car porteuse d’un nouveau type de solution logicielle permettant d’intégrer facilement des solutions existantes à la sémantique d’un nouveau besoin.
Enfin, la « transformation digitale » et toutes ses formes de pénétration dans l’entreprise semblent déterminer une profusion de drivers de valeur (expérience client, nouveaux business models, fluidification des opérations, cybersécurité…) et différentes formes de management associée à l’usage de ces technologies. Ces deux points présentent un dénominateur commun : la dépendance à une information cohérente.
Data Catalog : un livre blanc pour mieux comprendre
L’usage du Data Catalog s’impose désormais dans les entreprises, surtout dans les grands groupes. Pour cette raison, Astrakhan dédie son prochain livre blanc au thème Data Catalog. Dans ce livre blanc, nous abordons les thèmes suivants :
● Usages du Data Catalog et valeur ajoutée pour les domaines de l’entreprise
● L’usage du Data Catalog par les équipes qui utilisent la donnée
● Le retour d’expérience d’un client qui utilise le Data Catalog
● Perspectives d’évolution avec le data Catalog
Nous apportons notamment une définition unique pour tout comprendre sur le Data Catalog. Pour en connaître davantage sur le Data Catalog, sur ses avantages et ses limites, nous vous invitons à patienter encore un petit peu. Promis, le Livre Blanc arrive très vite ! Restez à l’écoute !