Article
Vers
une nouvelle science ?
Jean-Paul Baquiast et Christophe
Jacquemin - 22/06/2013

Il
n'est pas excessif de penser que l'humanité vit depuis
quelques mois une révolution technoscientifique qui
sera aussi importante que celle de l'atome et de l'espace.
Il s'agit de ce que l'on appelle désormais aux Etats-Unis
la "science des données" (data science
ou big data science). Comme nous l'avions indiqué,
notamment dans un éditorial
du 11 juin 2013, il s'agit d'un phénomène
qui a pris toute son ampleur en Amérique et qui renforce
considérablement son poids géopolitique dans
le monde, en dépit d'une concurrence accrue des autres
grands puissances. Il découle de la domination acquise
par les Etats-Unis, depuis au moins une trentaine d'années,
dans les technologies de l'information entendues au sens large,
composants, ordinateurs, réseaux, logiciels... Tous
domaines où, rappelons-le, la France des années
70 aurait pu tenter de faire jeu égal avec l'Amérique,
compte tenu de ses compétences initiales, mais qu'elle
a laissé péricliter par manque de vision géostratégique.
L'explosion toute récente de la science des données
tient à l'alliance délibérée de
deux forces considérables, l'une militaire et l'autre
civile.
Concernant le domaine militaire, et
sous l'égide de la National Security Agency (NSA),
il s'agit des centaines de milliards
de dollars consacrés à la mise en place des
centres de stockage des informations. Ces dernières
- issues du monde entier - sont recueillies selon les techniques
dorénavant éprouvées de l'espionnage
sous toutes ces formes, appliquées aux réseaux
numériques et à ceux qui s'en servent. Le coût
du stockage est désormais considéré comme
inférieur aux profits résultant de la valorisation
des données stockées. La consigne est donc dorénavant
de tout mettre en mémoire. Ceci n'est pas rien, si
l'on admet que 5 quintillions de bits (1030 bits)
sont ainsi produits en deux jours par les utilisateurs des
réseaux numériques.
Concernant le domaine civil, il s'agit des investissements
également considérables consacrés à
la mise en mémoire des données recueillies par
les entreprises du web (Google, Facebook, Twitter, Skype...),
toutes américaines, auprès des milliards d'utilisateurs
qui leur confient gratuitement leurs données personnelles,
en échange de certains services en ligne.
Stocker
ces données ne serait pas très utiles si, dans
le même temps, le gouvernement (NSA, CIA) et les entreprises
du web n'avaient pas consacré des moyens également
considérable à recruter des milliers d'ingénieurs
et autres spécialistes de l'Internet (Quants).
L'objet en est de transformer ces océans de données
bruts en armes de pouvoir. Le terme de Quant désignait
initialement les spécialistes en analyse quantitative
utilisée en finance. Il s'agit de mathématiques
financières, souvent dérivées de la physique
et des probabilités, servant à mettre au point
et utiliser des modèles permettant aux gestionnaires
de fonds et autres spécialistes financiers de traiter
deux problèmes essentiels : l'analyse des actifs
et l'évolution des portefeuilles en fonction des risques
et rentabilités observés ou prévus. On
voit aisément qu'en dehors de la finance, ces techniques
sont particulièrement nécessaires au renseignement
militaire et politique pour analyser la pertinence des données
recueillies et l'intérêt stratégique des
cibles.
Les deux jambes de la grande marche
en avant américaine
La
force des Etats-Unis dans ce domaine tient à la puissance
de ses universités et de ses entreprises high tech,
dont la Silicon Valley a été longtemps une source
quasi exclusive. La Silicon Valley a draîné toute
la matière grise mondiale disponible en ces domaines,
y compris en provenance de la Chine qui s'efforce actuellement
de reprendre son indépendance.
Des crédits paraissant aujourd'hui encore illimités
(au regard des restrictions budgétaires frappant tous
les autres secteurs), permettent de recruter et faire travailler
ces experts. Le budget de la NSA, bien que confidentiel, est
évalué à 8 ou 10 milliards de dollars
par an. Quant aux profits perçus par les entreprises
privées du web, et tout de suite réinvestis,
ils sont au moins équivalents.
Ainsi s'est instauré un va-et-vient permanent entre
la NSA et les entreprises américaines du web. Ce va-et
vient concerne autant l'encadrement supérieur que les
équipes techniques. Les sociétés ont
recruté des directeurs de la NSA ou de la CIA, tandis
que se faisait en même temps le mouvement inverse. En
quelques années, il s'est construit de la sorte un
potentiel humain irremplaçable, militaire et civil.
Aucune autre puissance au monde n'a bénéficié
de moyens aussi convergents pour se doter d'une telle force
de frappe.
Ceci ne veut pas dire que tous ces brillants spécialistes,
souvent eux-mêmes recrutés au sein des communautés
de hackers, adhèrent sans objections à des politiques
de mise en tutelle du reste de l'humanité. Ils manifestent
de temps à autre quelques réserves, concernant
notamment les dangers d'un espionnage généralisé,
pouvant éventuellement se retourner contre eux et leurs
convictions citoyennes. La découverte récente
du programme PRISM, éclairée par les révélations
de Edward Snowden, a suscité quelques états
d'âme.
Mais Snowden n'a pas fait d'émules à ce jour.
Dans l'ensemble, la logique globale du système l'emporte,
d'autant plus qu'un sentiment nationaliste toujours fort,
doublé d'un mépris certain pour le reste du
monde, continue à inspirer la toute jeune élite
ainsi constituée. Bien
qu'officiellement contenue dans le cadre de mandats judiciaires
explicites, la coopération
entre la défense et les compagnies du web se fait cependant
sans difficultés, tant sur le plan des échanges
scientifiques que concernant la fourniture de données
privées.
C'est la construction progressive de cette nouvelle science
du data mining et des données qui motive désormais
tous ces chercheurs. Toute nouvelle science génère
de nouveaux enthousiasmes, comme ce fut le cas il y a quelques
décennies dans le nucléaire et le spatial. La
science des données apparaît ainsi à la
fois comme source de profits abondants et source de connaissances
quasi-illimitées sur le monde. Les chercheurs semblent
éprouver une foi sans faille en la validité
des résultats de leur pratique, même lorsqu'elle
s'étend désormais à des thèmes
aux bases théoriques encore incertaines, comme le diagnostic
génétique appliqué en médecine,
en éducation, en criminologie, en sports et dans bien
d'autres domaines sociaux.
Ainsi en médecine, les généticiens adeptes
de la nouvelle science des données espèrent
pouvoir préciser par des faits d'observations concrets
les hypothèses encore largement théoriques concernant
le rôle déterminant des gènes et séquences
de gènes. Pour prendre un exemple un peu caricatural,
on pourra vérifier telle hypothèse relative
aux prédispositions génétiques de l'obésité
ou du diabète chez un individu donné en compilant
les données concernant les achats de celui-ci en produits
gras ou sucrés. Inutile de préciser que de telles
recherches risqueront de prouver a posteriori ce que l'on
voulait a priori démontrer.
Quoi qu'il en soit, l'objectif sera d'abord de collationner
avec des méthodes d'intelligence artificielle améliorée
les milliards de données brutes provenant des sources
traditionnelles ou récentes : pages web, recherches
effectués à partir des moteurs, signaux émis
par de multiples capteurs ou objets intelligents, smartphones,
GPS, caméras de surveillance. Il faudra ensuite en
tirer de nouveaux faits d'observation et d'expérimentation
à partir desquels seront formulées des hypothèses
puis des lois. Un nouveau type de "réel",
se superposant à celui aujourd'hui connu, deviendra
alors matière à exploration théorique
pour les nouveaux scientifiques. Chaque science ayant besoin
de faits d'observation constamment renouvelés, ce sera
sur des faits puisés dans les réseaux numériques
que s'appuiera la nouvelle science des données.
Mais
dira-t-on, toute science, pour rester fidèle à
son idéal d'universalité, doit être ouverte.
Chacun doit pouvoir accéder librement aux faits d'observation
et, au-delà, à l'entité observée,
qu'elle soit naturelle ou pas. Or manifestement, même
si les big data sont en principe accessibles à tous,
les recueillir et les interpréter nécessite,
nous l'avons montré dans d'autres articles, un dispositif
mondial organisé piloté quant à ses finalités
dernières par des organismes relevant de la défense
et de la sécurité. Les tiers n'ont accès
qu'à ce que ces organismes décident de diffuser.
De plus, ces mêmes organismes sont majoritairement américains.
Ils le resteront longtemps, vu les investissements qu'ils
ont consentis pour être et demeurer les premiers. Si
science des données il doit y avoir, ce sera donc dans
l'ensemble une science américaine ressemblant
par bien des aspects à une propagande de guerre. Mais
qu'importent diront les alliés de l'Amérique.
Cette dernière n'a-t-elle pas depuis des décennies
pris le contrôle de la plupart des domaines scientifiques,
sans guère susciter de réactions du reste du
monde. Ceci
pour notre bien, évidemment.
Ajoutons qu'en termes de nouveaux financements et emplois,
les perspectives sont considérables : selon une estimation
d'IDC, 24 milliards de dollars seront consacrés à
ce secteur en 2016. Le McKinsey Global Institute a pour sa
part estimé que les Etats-Unis auront besoin de 140
à 190.000 nouveaux experts en techniques analytiques
vers
2020. S'y ajouteront 1.500.000
spécialistes dotés de connaissances approfondies
en gestion et exploitation des données. On conçoit
que des pays menacés par un sous-emploi chronique,
Etats-Unis en premier lieu, considèrent toutes ces
perspectives avec le plus grand intérêt. Il est
peu probable que des appels à une prudence inspirée
par l'éthique y trouvent beaucoup d'échos.