Il y a quelques semaines, Kenneth Cukier, spécialiste en économie et en relations internationales et data editor pour The Economist, nous expliquait en quoi les big data étaient aujourd’hui une question de vie ou de mort pour les entreprises. Lors d’une rencontre RSLN exceptionnelle organisée dans le cadre des Techdays Ideas 2014, le spécialiste est venu mettre en lumière les enjeux inhérents à la maîtrise des Big Data dans le monde. Et ils ne sont pas des moindres : selon lui, les masses de données que nous accumulons refaçonnent tous les secteurs du monde, de la santé à l’économie en passant par les transports.
C’est en commençant par un rapide sondage que Kenneth Cukier a mis en exergue l’importance prise par les Big Data dans le débat public ces dernières années. Si des dizaines – si ce n’est la totalité - de mains se sont levées à la question : « aviez-vous déjà entendu parler des Big Data il y a un an ? », elles n’étaient plus qu’une poignée à signaler leur connaissance de ce sujet il y a cinq ans.
En l’espace de quelques années en effet, les capacités de stockage et de manipulation des données ont été démultipliées et ont propulsé les Big Data au cœur des débats : nouveau pétrole pour certains, elles permettraient de prédire le futur pour d'autres. Mais c'est quoi au juste les Big Data ? Pour Kenneth Cukier :
« C’est avant tout une question de taille : il s’agit d’énormes masses. Ensuite, on peut considérer que ce sont des informations. Mais ce qui les caractérise, c’est l’échelle à laquelle elles se développent et agissent. Le changement a donc d’abord été quantitatif. Aujourd'hui il est qualitatif. »
La collecte de larges jeux de données par les entreprises et administrations est désormais courante, voire même automatique. Les données permettent de mesurer les variations économiques et d’avoir un regard global sur les marchés. Elles sont aussi à la source des spéculations financières, permettent de mettre à nu les effets de la drogue dans une société, révèlent les foyers de développement de certaines maladies... En bref, elles concernent tous les pans de la société.
Une opportunité pour les start-ups
Si elles s’imposent aujourd’hui comme une priorité pour les entreprises qui doivent les dompter pour se positionner sur leur marché, ce sont de petites start-ups à l’image de Farecast qui en ont saisi les enjeux en premier. Créée par un ingénieur informaticien américain à l’université de Washington, la petite entreprise avait pour but de prédire les prix des billets d’avion en collectant les données sur leurs fluctuations précédentes, disponibles dans un fichier central accessible à tous. Le fondateur a ainsi pu déterminer quel moment était le plus opportun pour acheter un billet d’avion et a permis à tous les utilisateurs de son service d’économiser de l’argent. Et les masses de données enregistrées étaient impressionnantes puisqu’il s’agissait de près de vingt millions d'enregistrements de vol par an, soit la quasi-intégralité des vols domestiques aux Etats-Unis.
Un service que les compagnies de vol n’auraient jamais imaginé voir naître de leurs données ouvertes. En 2009, la start-up a finalement été rachetée pour cent millions de dollars car elle avait su montrer sa capacité à créer un service innovant en exploitant ces grandes masses de données.
Mais Kenneth Cukier le précise, pour que les Big Data nous apprennent quelque chose, il est essentiel de savoir les interroger :
« Ces big data sont des sommes d’informations considérables, mais il faut savoir les écouter, les analyser de la bonne manière. »
La boule de cristal des données
A l’image de certains grands chercheurs comme Eric Horvitz, qui nous affirmait en mai 2013 que les Big Data nous permettraient de prédire l’avenir, Kenneth Cukier n’a pas manqué d’expliquer leur potentiel dans les pronostics faits sur le monde :
« L’apprentissage statistique par exemple, promet de dégager de grandes tendances dans de nombreux secteurs, et de prédire en quelque sorte ce qui pourrait se passer, ce qui va de facto révolutionner certains domaines d'activité. »
Pour appuyer son propos, le data editor a pris l’exemple du séquençage du génôme humain :
« A mesure que les technologies évoluent, elles sont de moins en moins chères. Le séquençage du génome humain n’était réalisé que dans une vingtaine de pays il y a dix ans. Cela prenait des jours et pour des sommes astronomiques. Aujourd’hui, on peut le faire dans un laboratoire en 2 ou 3 jours et pour quelques milliers de dollars. Ce type de mesure nous permet d’envisager une cartographie globale de la population par exemple. Ce n’est pas l’histoire de la révolution que va connaitre la santé que je raconte ici, c’est celle qui va bouleverser toutes les facettes de la société. »
Autre exemple fourni par Kenneth Cukier : celui de la société de livraisons UPS. A l’aide de capteurs placés dans ses véhicules, l’entreprise a développé la « maintenance prédictive » : elle mesure le bruit du véhicule ou encore ses vibrations, ce qui permet d’anticiper quand une pièce risque de se casser.
Il ne s’agit plus ici de tirer des conclusions en isolant des extraits dans des jeux de données, mais de se servir de celles-ci dans leur ensemble pour dégager des tendances. La grande chaîne de magasins Walmart aux Etats-Unis se révèle un bon exemple en la matière : en croisant les données financières de chacun de ses magasins avec les données météorologiques du nord-est des Etats-Unis, les dirigeants ont pu découvrir une corrélation entre les tempêtes, les ventes de lampes torche et celles… de petits gâteaux sucrés. Une information qui leur a permis de repositionner leurs stocks dans les magasins afin de répondre au mieux à la demande des consommateurs.
Contre la déification des Big Data
Mais Kenneth Cukier ne se cantonne ni à une vision prophétique ni à une approche déterministe des données. Dans un monde qui tendrait vers la mesure ou la « data-ification » du moindre aspect de nos vies, le spécialiste met en garde :
« Désormais nous sommes des êtres quantifiés, tout est mesuré par des données, notre localisation ou encore ce qu’on mange par exemple. Les données elles-mêmes et leur accès est essentiel mais les Big Data ne prennent de la valeur que si on les interprète et on les utilise à notre avantage. C’est l’état d’esprit qui prédomine. Il faut faire attention à la déification des données. »
L’accès, la propriété et la transparence de celles-ci s’imposent également comme des enjeux à débattre aujourd’hui. Comme l'expert nous le déclarait dans une précédente interview :
« C'est une question que nous nous posons constamment : comment en savoir un maximum sur les gens pour mieux les servir tout en protégeant leur vie privée. »
Les bases du débat sont posées.