Dans le cadre du livre blanc “Data Management : le remède contre la fraude au virement”, Trustpair donne la parole à Fanny Rabouille, co-titulaire de la Chaire Digital, Organization & Society à la Grenoble Ecole de Management, visant à étudier l’impact du numérique sur les individus (et citoyens), les organisations et la société.
Dans cet article, Fanny Rabouille partage son expertise et nous éclaire sur les notions de Data Management et de Big Data en entreprise.
A propos de Fanny Rabouille :
Membre de la Direction des Programmes à Grenoble Ecole de Management, Fanny Rabouille a précédemment travaillé pendant 20 ans dans le service informatique. Ayant rejoint GEM il y a une dizaine d’années, elle a été en charge de différents programmes autour du numérique :
- Management des Systèmes d’Information et du Numérique, qui forme des personnes capables d’embrasser les problématiques de management autour des SI,
- Digital Strategy Management, qui a trait à tout ce qui touche la communication et la stratégie digitale des entreprises.
Aujourd’hui, Fanny Rabouille est Directrice du programme Mastère Spécialisé Big Data : analyse, management et valorisation responsable, partagé avec l’ENSIMAG. L’objectif du programme est de former des personnes hybrides, c’est-à-dire leur apporter ces notions de valeur, de gouvernance de la donnée, d’éthique, de juridique et de gestion de projets autour des processus de décision, une vision métier et business des technologies autour du Big Data, ainsi que toutes les compétences techniques liées à la Data Science.
Qu’entend-on par Big Data ?
Quand on parle de Big Data, un terme popularisé par John Mashey, informaticien chez Silicon Graphics dans les années 1990, on parle initialement de la notion des “5V”, présenté en 2001 par Douglas Laney :
- Volume : les entreprises sont amenées à traiter avec une multitude de données et de sources,
- Variété : les données peuvent se matérialiser sous forme de texte, chiffres, vidéo, son, de données présentes sur les réseaux sociaux, et même de l’Internet Optings,
- Vitesse : toutes ces données arrivent en continu, et il faut savoir les traiter en temps réel pour qu’elles ne perdent pas en qualité,
- Véracité : ou fiabilité des données, qui est une notion très importante,
- Valeur : chaque donnée à une valeur potentielle pour l’entreprise et lui permet de développer son business.
Il est essentiel de rappeler que le Big Data ne fait pas que référence à la donnée. Avec cette notion, on parle aussi :
- d’infrastructures informatiques adaptées à la gestion de ces volumes de données conséquents ;
- de techniques de programmation ;
- de techniques d’apprentissage ;
- d’outils spécifiques qui aident à la gestion des données ;
- de modèles statistiques, car les algorithmes qui traitent ces gros volumes de données sont des modélisations statistiques qu’il faut savoir comprendre et gérer ;
- de prise de décision stratégique et business ;
- d’éthique et de morale ;
- de confiance dans l’algorithme et l’Intelligence Artificielle ;
- de nouvelles compétences pour traiter les données et gérer les outils.
Que signifie la notion de Data Management ?
“Plus que la gestion des données, le Data Management implique une réelle stratégie de maîtrise des données dans l’entreprise.”
Les corporates doivent se poser plusieurs questions pour bien définir leur stratégie :
- Quels sont les processus que j’emploie pour communiquer, collecter, structurer, gérer et utiliser mes données ?
- Quelles sont les normes et les outils que je vais utiliser ?
- Comment intégrer ces données à mon Système d’Information ?
Si auparavant, les bases de données des entreprises se contentaient aux données financières, RH, achat, produit, etc., l’arrivée de logiciels spécialisés et la multiplication des sources de données représentent un enjeu concernant l’intégration de ces données dans les Systèmes d’Information des entreprises.
Aussi, les corporates doivent assurer l’accessibilité et la fiabilité de leurs données. Si les entreprises s’appuient sur des données non-fiables, les traitements réalisés via des algorithmes seront incohérents.
Finalement, la sécurisation des données est un point primordial. Pour preuve les récentes attaques de ransomware, qui consiste à voler les données d’une entreprise et de les lui rendre à condition de payer une rançon, sont devenues une menace au cœur des préoccupations.
Quels sont les enjeux du Data Management ?
Les entreprises doivent identifier plusieurs points stratégiques avant de lancer un projet:
- Quelles sont les données à récupérer ?
- Comment vérifier qu’elles soient bonnes ?
- Comment identifier les données erronées ou obsolètes pour nettoyer sa base ?
- Comment assurer la fiabilité des données tout au long de leur cycle de vie ?
Quelle est la différence entre le Big Data et le Data Management ?
“Le Big Data et le Data Management sont deux niveaux différents. Avec le Data Management, on est davantage dans la gouvernance de la donnée et la stratégie d’entreprise. Le Big Data est une notion plus globale, et progressivement remplacée par l’Intelligence Artificielle.”
Comment assurer une bonne gouvernance des données en entreprise ?
Il est obligatoire de veiller à ce que la donnée soit en phase avec la loi RGPD, et donc conforme aux mesures de protection individuelle et personnelle.
“La gouvernance des données en entreprise est un sujet très important. Jusqu’à maintenant, les données étaient en silo et non connectées entre elles. L’objectif est de “désiloter” ces données tout en assurant qu’elles soient correctement traitées. »
“Désiloter” les données a pour effet de les rendre accessibles par tous les collaborateurs, ce qui impacte directement l’organisation de l’entreprise. Les projets autour de la data et de l’extraction de valeur passent par un travail mené conjointement par tous les départements de l’entreprise.
Par exemple, la Direction financière va être amenée à travailler avec la DSI, les RH et les Achats. Tous les départements doivent travailler ensemble pour arriver à mener des projets qui ont de la valeur et qui favorisent le business de l’entreprise.
“La gouvernance des données a un réel impact sur l’organisation de l’entreprise : elle doit être poussée par l’ensemble des managers afin que chaque département travaille main dans la main et non chacun de son côté.”
Les modes de management des données en entreprise ont-ils évolué ?
“Les entreprises doivent penser davantage à la notion de données intelligentes, ou Smart Data, plutôt que Big Data. C’est-à-dire assurer une donnée propre, fiable, cohérente, avec une notion d’usage défini et qui soit traitée en direct.”
Par exemple, les étudiants travaillent tous les ans sur des projets intégratifs proposés par des entreprises. Tous se rendent compte qu’ils passent une très grande partie de leur temps à nettoyer les données car elles sont :
- incohérentes
- non complètes
- non-fiables
- pas utiles
Favoriser une donnée intelligente permet aux algorithmes de traiter les données en direct, sans qu’elles soient transmises d’une base à une autre ou hébergées dans un Data Lake. Une méthode similaire au principe d’Edge Computing, qui revient à traiter les données à côté de l’équipement, et qui a pour avantage de prévenir du temps de latence lié au traitement de la donnée.
“Les entreprises conservent un volume de données colossal dont elles ne se servent pas toujours, qui prennent de la place dans leur Data Center et qui consomment beaucoup d’énergie. Elles perdent énormément de temps à les nettoyer.”
Pouvez-vous nous en dire plus sur l’Intelligence Artificielle ?
“Faire de l’Intelligence Artificielle revient à faire du Big Data, à savoir traiter un important volume de données.”
Mais les algorithmes d’IA utilisent des techniques plus approfondies basées sur le Machine Learning et Deep Learning, ou réseau de neurones. Les entreprises qui font du Big Data font finalement de l’IA sans le savoir, comme Monsieur Jourdain avec la prose.
Si elles partagent plus ou moins les mêmes technologies, la notion d’usage est quant à elle différente. L’IA permet par exemple la reconnaissance faciale et vocale contrairement au Big Data.
La notion d’éthique indissociable de la technologie
“Si la notion juridique et de conformité – RGPD – est importante, la prise en compte de l’humain et de l’éthique est primordiale !”
Par exemple, nous avons mené un projet avec une entreprise américaine internationale spécialisée dans l’IT, qui voulait faire un algorithme Big Data pour améliorer la gestion de la rémunération de ses distributeurs. Si tous les étudiants ont bien cadré la partie technique du projet – identification des algorithmes et des modèles statistiques – ils ne se sont pas forcément posés la question de l’impact de ces technologies sur les personnes en charge de leur gestion.
L’éthique est une vraie dimension philosophique et morale qui doit amener les entreprises à se poser les questions :
- Quel est l’impact de l’algorithme sur les personnes qui l’utilisent ?
- Ai-je le droit de faire cette action et est-ce que je suis moralement en accord avec ?
Il y a par exemple un énorme sujet éthique autour de la reconnaissance faciale.
Par rapport au Data Management, peut-on parler de nouveaux métiers en entreprise ?
Il y a évidemment des nouveaux métiers qui vont émerger, comme le Data Scientist et le Data Analyst. Le plus proche de la donnée aujourd’hui est le Data Engineer.
Parler de monter en compétences est aussi adapté, mais la marche est assez haute. Tous les informaticiens ne peuvent pas s’approprier les métiers liés au Big Data. Cela nécessite un certain apprentissage des outils ou méthodologies spécifiques. On ne traite pas de la donnée à grande échelle comme on traite de la donnée d’un ERP.
“Lorsqu’on parle de Big Data ou de Data Management, on peut parler de monter en compétences, mais c’est essentiellement des nouveaux métiers qui émergent.”
Comment assurer la sécurité des données en entreprise ?
“La cybersécurité a pris un coup dans l’aile quand les entreprises ont commencé à être mobiles.”
Du moment où on a parlé d’informatique, le sujet de la sécurité cyber a émergé. Le sujet s’est popularisé aujourd’hui car les collaborateurs sont devenus mobiles, et que les objets connectés sont plus largement utilisés.
Accessibles via ordinateur ou smartphone, et avec la démocratisation du télétravail, les données sont déplacées et utilisées via différents réseaux informatiques. Cela créer des failles de sécurité dans les systèmes d’information des entreprises.
“La cybersécurité est une affaire d’usage et de formation. Il faut sensibiliser et donner les moyens aux collaborateurs, même quand ils travaillent à l’extérieur, de sécuriser leur accès internet. La plupart des problèmes liés à la cybersécurité viennent d’une faute humaine.”
Par exemple, si un escroc arrive à s’initier dans un réseau d’hôpital et à dérober des données médicales, cela empêche l’hôpital victime de fonctionner normalement et met à mal l’ensemble des patients.
“Plus il y a de multiplication de la donnée, plus il y a de multiplication des usages et de technologies associées, et plus il y a des problématiques de cybersécurité.”
Qui porte le sujet de la cybersécurité en entreprise ?
“Chaque collaborateur doit se sentir impliqué dans les sujets de cybersécurité. Toutes les nouvelles technologies permettant de créer de nouveaux usages doivent être encadrées et pensées pour faire face à ces risques cyber.”
Au final, la cybersécurité est un peu comme le numérique responsable : elle doit être pensée en amont pour assurer une sécurité forte des données, tout comme pour assurer une faible empreinte écologique.
Qu’entendez-vous par numérique responsable ?
Le numérique responsable est une notion très importante à prendre en compte au sein des entreprises aujourd’hui.
“Ce n’est pas la peine de collecter de si grands volumes de données s’ils ne sont pas utilisés par la suite ou deviennent obsolètes. Nettoyer les emails, les fichiers et les bases de données sont aussi un enjeu pour les entreprises d’un point de vue écologique, même si la plus grande source de pollution reste la fabrication des équipements.”
Pour conclure :
Le Data Management est un sujet très important en entreprise !
“Assurer la fiabilité des données est un enjeu primordial. Il réside dans la maîtrise des données dans le temps, et de l’ensemble des dispositifs mis en place pour assurer leur cohérence.”
Ainsi, la cybersécurité est liée à la notion d’usage : la formation des collaborateurs est essentielle. Et si aujourd’hui les entreprises disposent d’un volume de données important, il faut savoir assurer leur sécurité, bien qu’une donnée sécurisée à 100% n’existe pas.