Mar.
02
Sep

MEDIAPART

Connexion utilisateur

Vers une nouvelle science?

Il n'est pas excessif de penser que l'humanité vit depuis quelques mois une révolution technoscientifique qui sera aussi importante que celle de l'atome et de l'espace. Il s'agit de ce que l'on appelle désormais aux Etats-Unis la « science des données » (data science ou big data science).

Comme nous l'avions indiqué, notamment dans un éditorial du 11 juin 2013, il s'agit d'un phénomène qui a pris toute son ampleur en Amérique et qui renforce considérablement le poids géopolitique de celle-ci dans le monde, en dépit d'une concurrence accrue des autres grands puissances. Il découle de la domination acquise par les Etats-Unis, depuis au moins une trentaine d'années, dans les technologies de l'information entendues au sens large, composants, ordinateurs, réseaux, logiciels – tous domaines rappelons-le où la France des années 70 aurait pu tenter de faire jeu égal avec l'Amérique, compte-tenu de ses compétences initiales, mais qu'elle a laissé péricliter par manque de vision géostratégique.

L'explosion toute récente de la science des données tient nous l'avons vu à l'alliance délibérée de deux forces considérables, l'une militaire et l'autre civile. Concernant le domaine militaire, il s'agit des centaines de milliards de dollars consacrés, sous l'égide de la National Security Agency (NSA), à la mise en place des centres de stockage des informations recueillies dans le monde entier selon les techniques dorénavant éprouvées de l'espionnage sous toutes ces formes, appliquées aux réseaux numériques et à ceux qui s'en servent. Le coût du stockage est désormais considéré comme inférieur aux profits résultant de la valorisation des données stockées. La consigne est donc dorénavant de tout mettre en mémoire. Ceci n'est pas rien, si l'on admet que 5 quintillions de bits sont ainsi produits en 2 jours par les utilisateurs des réseaux numériques.

Concernant le domaine civil, il s'agit des investissements également considérables consacrés à la mise en mémoire des données recueillies par les entreprises du web (Google, Facebook, Twitter, Skype...), toutes américaines, auprès des milliards d'utilisateurs qui leur confient gratuitement leurs données personnelles, en échange d'un certain nombre de services en ligne.

Stocker ces données ne serait pas très utiles si, dans le même temps, le gouvernement (NSA, CIA) et les entreprises du web n'avaient pas consacré des moyens également considérable à recruter des milliers d'ingénieurs et autres spécialistes de l'Internet (Quants). L'objet en est de transformer ces océans de données bruts en armes de pouvoir. Le terme de Quant désignait initialement les spécialistes en analyse quantitative utilisée en finance. Il s'agit de mathématiques financières, souvent dérivées de la physique et des probabilités, servant à mettre au point et utiliser des modèles permettant aux gestionnaires de fonds et autres spécialistes financiers de traiter deux problèmes essentiels: l'analyse des actifs et l'évolution des portefeuilles en fonction des risques et rentabilités observés ou prévus. On voit aisément qu'en dehors de la finance ces techniques sont particulièrement nécessaires au renseignement militaire et politique, pour analyser la pertinence des données recueillies et l'intérêt stratégique des cibles.

Les deux jambes de la grande marche en avant américaine

La force des Etats-Unis dans ce domaine tient à la puissance de ses universités et de ses entreprises high tech, dont la Silicon Valley a été longtemps une source quasi exclusive. La Silicon Valley a drainé toute la matière grise mondiale disponible en ces domaines, y compris en provenance de la Chine qui s'efforce actuellement de reprendre son indépendance. Des crédits paraissant aujourd'hui encore illimités (au regard des restrictions budgétaires frappant tous les autres secteurs), permettent de recruter et faire travailler ces experts. Le budget de la NSA, bien que confidentiel, est évalué à 8 ou 10 milliards de dollars par an. Quant aux profits perçus par les entreprises privées du web, et tout de suite réinvestis, ils sont au moins équivalents.

Ainsi s'est instauré un va-et-vient permanent entre la NSA et les entreprises américaines du web. Ce va-et vient concerne autant l'encadrement supérieur que les équipes techniques. Les sociétés ont recruté des directeurs de la NSA ou de la CIA, tandis que se faisait en même temps le mouvement inverse. Il s'est construit de la sorte en quelques années, voire en quelques mois, un potentiel humain irremplaçable, militaire et civil. Aucune autre puissance au monde n'a bénéficié de moyens aussi convergents pour se doter d'une force de frappe.

Ceci ne veut pas dire que tous ces brillants spécialistes, souvent eux-mêmes recrutés au sein des communautés de hackers, adhérent sans objections à des politiques de mise en tutelle du reste de l'humanité. Ils manifestent de temps à autres quelques réserves, concernant notamment concernant les dangers d'un espionnage généralisé, pouvant éventuellement se retourner contre eux et leurs convictions citoyennes. La découverte récente du programme PRISM, éclairée par les révélations de Edward Snowden, a suscité quelques états d'âme.

Mais Snowden n'a pas fait d'émules à ce jour. Dans l'ensemble la logique globale du système l'emporte, d'autant plus qu'un sentiment nationaliste toujours fort, doublé d'un mépris certain pour le reste du monde, continue à inspirer la toute jeune élite ainsi constituée. La coopération entre la défense et les compagnies du web, bien qu'officiellement contenue dans le cadre de mandats judiciaires explicites, se fait en fait sans difficultés, tant sur le plan des échanges scientifiques que concernant la fourniture de données privées.

C'est la construction progressive de cette nouvelle science du data mining et des données qui motive désormais tous ces chercheurs. Toute nouvelle science génère de nouveaux enthousiasmes, comme ce fut le cas il y a quelques décennies dans le nucléaire et le spatial. La science des données apparaît ainsi à la fois comme source de profits abondants et source de connaissances quasi-illimitées sur le monde. Les chercheurs semblent éprouver une foi sans faille en la validité des résultats de leur pratique, même lorsqu'elle s'étend désormais à des thèmes aux bases théoriques encore incertaines, comme le diagnostic génétique appliqué en médecine, en éducation, en criminologie, en sports et dans bien d'autres domaines sociaux.

Ainsi en médecine , les généticiens adeptes de la nouvelle science des données espèrent pouvoir préciser par des faits d'observations concrets les hypothèses encore largement théoriques faites actuellement concernant le rôle déterminant des gènes et séquences de gènes. Pour prendre un exemple un peu caricatural, on pourra vérifier telle hypothèse relative aux prédispositions génétiques de l'obésité ou du diabète chez un individu donné en compilant les données concernant les achats de celui-ci en produits gras ou sucrés. Inutile de préciser que de telles recherches risqueront de prouver a posteriori ce que l'on voulait a priori démontrer.

Quoiqu'il en soit, l'objectif sera d'abord de collationner avec des méthodes d'intelligence artificielle améliorée les milliards de données brut provenant des sources traditionnelles ou récentes, pages web, recherches effectués à partir des moteurs, signaux émis par de multiples capteurs ou objets intelligents, smartphones, GPS, caméras de surveillance. Il faudra ensuite en tirer de nouveaux faits d'observation et d'expérimentation à partir desquels seront formulées des hypothèses puis des lois. Un nouveau type de « réel », se superposant à celui aujourd'hui connu, deviendra alors matière à exploration théorique pour les nouveaux scientifiques. Chaque science ayant besoin de faits d'observation constamment renouvelés, ce sera sur des faits puisés dans les réseaux numériques que s'appuiera la nouvelle science des données.

Mais dira-t-on, toute science, pour rester fidèle à son idéal d'universalité, doit être ouverte. Chacun doit pouvoir accéder librement aux faits d'observation et, au delà, à l'entité observée, qu'elle soit naturelle ou pas. Or manifestement, même si les big data sont en principe accessibles à tous, les recueillir et les interpréter nécessite, nous l'avons montré dans d'autres articles, un dispositif mondial organisé piloté quant à ses finalités dernières par des organismes relevant de la défense et de la sécurité. Les tiers n'ont accès qu'à ce que ces organismes décident de diffuser. De plus, ces mêmes organismes sont majoritairement américains. Ils le resteront longtemps, vu les investissements qu'ils ont consentis pour être et demeurer les premiers. Si science des données il doit y avoir, ce sera donc dans l'ensemble une science américaine – ressemblant par bien des aspects à une propagande de guerre. Mais qu'importent diront les alliés de l'Amérique. Cette dernière n'a-t-elle pas depuis des décennies pris le contrôle de la plupart des domaines scientifiques, sans guère susciter de réactions du reste du monde. Ceci pour notre bien, évidemment.

Ajoutons qu'en termes de nouveaux financements et emplois, les perspectives sont considérables. 24 milliards de dollars seront consacrés à ce secteur en 2016, selon une estimation d'IDC. Le McKinsey Global Institute a pour sa part estimé que les Etats-Unis devront avoir besoin vers 2020 de 140 à 190.000 nouveaux experts en techniques analytiques. S'y ajouteront 1.500.000 spécialistes dotés de connaissances approfondies en gestion et exploitation des données. On conçoit que des pays menacés par un sous-emploi chronique, Etats-Unis en premier lieu, considèrent toutes ces perspectives avec le plus grand intérêt. Il est peu probable que des appels à une prudence inspirée par l'éthique y trouvent beaucoup d'échos.



Newsletter