Usages et patterns de la Data Virtualisation

Usages et patterns de la Data Virtualisation

Auteur : Srikanth Ramanoudjame - Date de publication : novembre 30, 2020

Lorsque vous souhaitez étudier un phénomène récurent vécu par votre entreprise, que ce soit pour comprendre l’événement en lui-même ou les circonstances qui l’ont engendré, vous devrez manipuler plusieurs sortes de données provenant de bases diverses et variées auxquelles vous devrez appliquer différents traitements. L’exercice peut s’annoncer périlleux et il serait souhaitable de faciliter une telle étude et de la rendre la plus fructueuse possible. Découvrez comment la Data Virtualisation peut vous aider dans ce type de projet.

 

Vous utilisez sans doute des techniques d’études statistiques d’aide à la décision pour un ensemble d’applications dans votre entreprise (prévisions de ventes, optimisation de campagnes de communication, monitoring pour l’excellence opérationnelle…).
Dans ce but, vous voudrez étudier des évènements et leurs enregistrements, mais aussi les circonstances autour de ces évènements. Pour pouvoir comprendre un phénomène récurent, le cas échéant pouvoir le reproduire ou encore l’éviter.

Pour ce faire, vous allez utiliser des données de plusieurs types (transactionnelles, de référence, Master Data…), des systèmes différents (bases de données opérationnelles d’un département, base de données internes à une application, bases de référence pour toute l’entreprise…) et des techniques de traitement de l’information différentes également (MDM-DQM, analyse statistique descriptive et exploratoire…).

Comment pouvez-vous préparer ces corrélations de données de nature et de caractéristiques différentes pour maximiser la plus-value de leur analyse ? Quels sont les patterns d’intégration impliquant des données décisionnelles et transactionnelles ? Pour quels usages peuvent-ils être utilisés ?

Abstraire la couche d’accès aux systèmes de stockage sources pour combiner et recomposer à la volée des vues sur les données

Les outils de Data Virtualisation (l’un des produits du marché est exposé dans un précédent article sur la Data Virtualisation) ne répliquent pas les données physiques sur une base de données buffer dédiée à l’outil. En proposant des vues basées sur une uniformisation sémantique des données, ils n’imposent pas un modèle de données contraignant lors de l’accès aux données et permettent plus de liberté au moment d’un requêtage.
En effet, la couche de stockage intermédiaire, logique (patterns de Datalake ou de DataWarehouse logiques), permet de composer plus facilement des vues entre par exemple, des données de granularité fine (par exemple des enregistrements d’incidents sur une chaîne de production à la maille journalière) et d’autres de précision inférieure (par exemple des indicateurs de Business Intelligence agrégés au mois).

De ce fait, dans le cadre par exemple de monitoring pour l’excellence opérationnelle, il devient entre autres possible de mettre en lumière des données opérationnelles d’incidents sur une chaîne de production de vos fournisseurs avec des indicateurs décisionnels de leur performance.

Enrichir les données par leur contexte

Les données décisionnelles sont donc susceptibles, de manière complémentaire à d’autres données transactionnelles, d’apporter des éléments de contexte à des évènements, permettant ainsi de mieux comprendre ces évènements pour apporter une plus-value métier (pattern de Data Marts virtuels).

Par exemple, si vous constatez une progression des ventes d’un de vos produits sur une région géographique en particulier, vous allez sans doute vouloir comprendre ce qui a conduit à cette progression et les circonstances qui l’ont rendue possible (ventes promotionnelles, campagnes publicitaires…). Ce qui vous conduira à corréler les données d’évènements de ventes avec entre autres des Master Data Produit, ou encore les données de reporting sur l’évolution des prix de vente des produits concurrents.

Intégrer des données synchronisées à différentes fréquences et à partir de sources de données différentes

image puzzle article usages et patterns data virtualisation

Votre SI connaîtra périodiquement des évolutions (ce peut être l’ajout d’une application, l’intégration du SI et des données d’un groupe tiers, etc…), la data virtualisation peut dans ce cas à nouveau vous aider, via des patterns d’applications à vue unique et de vision 360°, dans la démarche d’intégration de données :

• En éliminant la problématique de migration de données
• En accélérant le processus de normalisation sémantique des données
• En accélérant la mise à disposition transparente des données nouvellement intégrées, indépendamment de leur localisation.

Améliorer la qualité des données mises à disposition du métier

Une problématique importante de l’intégration de données à travers les systèmes d’un SI est celui de la consistance des données en question, notamment la question de fréquence de mise à jour, et la fraîcheur des données de votre système de stockage intermédiaire.
En effet, cette couche intermédiaire doit être en mesure de garantir la mise à disposition de données à jour à tous ses clients.

Les outils de Data Virtualisation évitent ce problème en manipulant encore une fois, des données directement dans leurs systèmes sources et en proposant uniquement des vues composant données et services.

Pour résumer…

La Data Virtualisation peut simplifier et optimiser vos projets d’intégration de données.
En effet, les outils qui l’implémentent permettent de mettre en place des patterns d’intégration moins évidents qu’avec des techniques d’intégration classique.
Elle permet entre autres d’intégrer de manière plus efficace des données de natures différentes avec des granularités diverses – typiquement les données transactionnelles et décisionnelles – au moyen de la mise en place d’une couche sémantique unifiée.

Cependant les patterns d’intégration de données au moyen de Data Virtualisation connaissent également certaines limites induites par le procédé lui-même.
En effet, les données sources n’étant pas répliquées, cela implique une dépendance aux systèmes sources et leur niveau de disponibilité. Des solutions existent pour contourner ces difficultés (mise en cache) qu’il faudra étudier au moment de la mise en œuvre.

Références :
https://www.denodo.com/en/page/data-virtualization-use-cases-and-patterns

Sources :
Davis, J. R., & Eve, R. (2011). Data Virtualization: Going Beyond Traditional Data Integration to Achieve Business Agility. Nine Five One Press.