Intégrer la valeur de la donnée : Data Governance

Intégrer la valeur de la donnée : Data Governance

Auteur : Tarik Rida (Manager Business Data chez Astrakhan) - Date de publication : janvier 25, 2021

Certaines entreprises peuvent retarder l’implémentation d’une gouvernance des données en pensant que celle-ci n’a aucun intérêt d’un point de vue business, qu’il s’agit uniquement d’une problématique IT. Pourtant, la Data Governance n’a pas qu’une seule corde à son arc et peut servir des intérêts multiples : transformation du risque en avantage concurrentiel, nouvelle forme de management ou encore intégration de la valeur de la donnée. Mais comment peut-on définir la Data Governance et dans quels buts peut-elle être mise en oeuvre ?

Data vs. Governance

La Data Governance fait l’objet de diverses définitions avancées par un ensemble d’acteurs aux intérêts divers (éditeurs, associations d’expertise, intégrateurs, cabinets de conseil, communautés…), elle semble sujette à des tentatives de justification à travers des business case ou différents articles, mais finalement quel est l’intérêt d’associer la notion de « gouvernance » à celle de la « donnée » ? 

La « Governance » est définie, selon la TOGAF®, comme une discipline de pilotage, de gestion et de supervision d’un domaine (métier, opérationnel ou système d’information, donnée, entreprise …) permettant de fournir les résultats attendus, on constate très souvent que les entreprises s’approprient les gouvernances introduites par différents framework et parfois textes réglementaires (COBIT, NIST, HIPAA, GDPR …) afin de les accompagner dans une initiative de gestion de risque (cybersécurité, conformité réglementaire…), des frameworks jouant souvent le rôle d’intermédiaire entre le domaine du logiciel et celui de la réglementation (directive, loi, régulation) et/ou de la qualité (norme et/ou standard).

Dans un contexte d’entreprise, la « Data » fait souvent référence à un indicateur, une quantité, une référence (nomenclatures, codes, listes d’abréviation, …) ou à une notion métier  (Client, Commande…) associée ou non à une application/implémentation (ex Table « Client » dans un système CRM ou sur le post-it d’une table d’un service commercial) et perçue, à tort, indépendante de son contexte, comme réutilisable par un ou plusieurs domaine de l’organisation.

L’association de ces deux termes semble donc désigner à ce stade un type de gouvernance propre au domaine de la donnée, une gouvernance responsable du pilotage (stratégie), de la gestion et de la supervision des risques (processus et procédures) associés à l’usage de la donnée par d’autres domaines (métiers, opérationnels ou système d’information, entreprise …) dans le cadre de leurs initiatives (ex ↓risques de non-conformité…).

Transformation du risque en avantage concurrentiel

Certains acteurs semblent formuler cette gestion de risques à travers l’introduction d’une organisation, d’un système de responsabilité, de politiques et standards associés à l’usage d’une donnée (politiques de données) évoluant dans une « chaine de valeur de la donnée », de manière implicite toute forme de réutilisation de la donnée par les initiatives de l’entreprise s’instancie dans le cadre de cette stratégie (et de son portefeuille technologique).

« Data Governance is the specification of decision rights and an accountability framework to ensure the appropriate behavior in the valuation, creation, consumption and control of data and analytics. It includes the processes, roles and policies, standards and metrics that ensure the effective and efficient use of information in enabling an organization to achieve its goals. »

Gartner

« Data Governance is the exercise of authority and control (planning, monitoring, and enforcement) over the management of data assets « 

Data Management Association (DAMA)

D’autres, laissant le soin de la définition de la valeur de la donnée (actif) à l’initiative de l’entreprise, paraissent agnostiques dans leur composition de la « chaine de valeur de la donnée ». Ils semblent s’aligner sur celle introduite par les fonctions de gestion de données disponibles dans l’entreprise (Data Governance, Data Quality, BI, analytics, Data Architecture, Data Modeling …).

Ces initiatives peuvent avoir des drivers de valeurs autres que ceux de la cybersécurité et/ou de la conformité réglementaire, elles ciblent désormais le développement d’avantages concurrentiels (ex ↑productivité, ↑investissement, ↑customer centricity, ↑ connaissance client, transformation, ↓risque …). Leurs business case semblent de moins en moins circonscrits à un silo technologique de l’entreprise (contexte applicatif) et de plus en plus déterminés par la réutilisation de la donnée par une solution d’entreprise (contexte spécifique).

Dans cette optique, la responsabilité première du CDO dans l’établissement d’une data governance semble être celle de la protection (risque) et du développement de  la valeur (avantages concurrentiels) de l’entreprise, une responsabilité engagée sur l’usage fait des données par ses domaines métier ainsi que par la technologie (application et solution du SI), une technologie ayant principalement été utilisée jusqu’à présent dans la production de solutions en silo mais désormais en position de produire des solutions dépendantes de la réutilisation de la donnée.

Change management et valeur de la donnée

Certaines organisations verront dans l’expression « Data Governance » une nouvelle forme de management, prétextant l’utilisation d’une discipline ou d’une technologie, destinée à la gestion et à l’exploitation des données issues des applications du système d’information. Dans ce contexte, applications et « change request » sont érigés comme seuls et uniques représentants de la valeur métier, une valeur justifiant de leurs investissements technologiques, les données n’étant qu’un sous-produit de ces investissements.

En ces lieux, la Data Governance, loin d’être infiltrée par des transfuges du SI assurant la promotion des architectures « applications driven », saura répondre à de nouveaux besoins en perpétuant l’architecture des silos à l’infini, et bien entendu accessoirement pérenniser ces investissements technologiques ainsi que ceux associés à leurs technologies d’intégration.

D’autres sans doute plus confiantes sur leur perception de la valeur (productivité, finance, confiance client, risques …) à travers l’usage et la réutilisation de la donnée, reconnaitront leur dépendance à l’usage d’une donnée de qualité, unifiée et perpétuellement réutilisable en dehors (et contrairement à celui) du contexte fixé lors de sa production initiale (e.g. application, processus et/ou système d’information opérationnels/décisionnels, …).

Leurs initiatives capturent désormais la valeur par le biais de solutions ,non plus exclusivement restreintes à une évolution ou réutilisation technologique (systèmes, applications, outils…), mais plutôt déterminées par une réutilisation de la donnée associée à ces mêmes technologies. Concrètement cela se traduit par la manifestation de différents types d’exigences (disponibilité, précision, cohérence, privacy…) sur la qualité de donnée de ces initiatives, des initiatives aussi bien réservées à la résolution d’impacts (métier, opérationnels, non-conformité réglementaire…) qu’au développement d’avantages concurrentiels (innovation data driven, pilotage de performance, améliorations opérationnelles, conformité, sécurité, confidentialité, transformation, analytiques, applicatives …), sans oublier celle du démonstrateur de valeur préalable à tout investissement technologique (systèmes/applications/intégration).

Après avoir reconnu que gérer un risque ou développer un avantage compétitif dépend de l’usage d’une donnée de qualité, ces organisations s’appuient sur une fonction jouant un rôle :

dans l’élaboration de solutions (application driven et/ou data driven) réutilisant la donnée et des technologies envisagées pour leurs initiatives,

dans la communication de l’usage et la gestion de la donnée dans le cadre de ces solutions

d’arbitrage dans le processus d’acquisition de la technologie.

Une communication efficace est la clé de la gestion du changement. Expliquer comment de bonnes techniques de gestion de la qualité de l’information améliorent l’efficacité et la performance organisationnelles est la première étape pour impliquer les métiers et assurer leur soutien et leur parrainage.

Intégration de la valeur de la donnée

Intégrer la valeur proposée par ces initiatives, sans se restreindre à un portefeuille de technologies aussi légitimes soient-elles, requiert une fonction veillant à la réutilisation de la donnée par la solution de l’initiative, une fonction responsable de :

● La formulation de politiques de données de la solution (ex rétention de données sur une période de 2 ans),

● La supervision de la conformité des données à ces politiques (ex KPIs de rétention, data reporting, inspection …)

Ces politiques déterminent des règles sur le cycle de vie de la donnée (création, acquisition, stockage, intégrité, sécurité, usage …) supportant l’activité opérationnelle (processus et/ou systèmes) mais également stratégique, et cela à travers la planification des usages de données (stratégie de données) de ces initiatives par l’entreprise.  

Cette fonction, la Data Governance, ne pourrait envisager la solution sans l’implémentation des politiques de données par d’autres fonctions de gestion du SI et/ou de données (Data Architecture, Data Science, Analytics, Big Data Analytics, Data Storage, Data Quality, Data Warehousing, Data Integration …), des fonctions associées à l’architecture, la conception et à l’implémentation de ces solutions.

Enfin, la formulation de ces politiques s’inscrit dans un contexte de transformation de la stratégie de l’entreprise en stratégie de données, ou l’entreprise reconnait sa dépendance à l’usage de la donnée et s’engage vers un état de transformation perpétuel désormais dirigé par la donnée et la technologie.