Pierre jourlin
Maître de conférences en informatique à Avignon
Abonné·e de Mediapart

14 Billets

0 Édition

Billet de blog 14 déc. 2018

Usages et évaluation des modèles prédictifs (1)

Une tentative de rendre compréhensible au plus grand nombre tout un tas de techniques utilisées massivement dans la société mais souvent incomprises.

Pierre jourlin
Maître de conférences en informatique à Avignon
Abonné·e de Mediapart

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.

Si vous commencez à lire ce billet, vous allez probablement vous demander pourquoi je publie ce genre de choses sur un blog de Mediapart. Et je dois reconnaître qu'on est très très loin de la ligne éditoriale du journal. Mais après avoir fait le tour des plateformes de blogs et des conditions de leur utilisation, c'est finalement la plateforme qui m'offre le plus de liberté et de visibilité.
Or, il me semble que pour trouver les bons mots, les bonnes formules, les bons exemples, il faut procéder par tentatives et par retours. La tentative demande la liberté et le retour demande la visibilité...

Le devin, 1972. © © Goscinny René (scénario), Uderzo Albert (dessins)

INTRODUCTION

Le but de ce document est d’explorer quelques bons et mauvais usages que l’on peut faire de ce qu’on appelle les “modèles prédictifs”, en particulier dans le cadre des approches dites “d’apprentissage automatique” (en anglais : machine learning). Je ne peux évidemment pas prétendre les connaître tous et d’ailleurs rien ne s’oppose à ce qu’il y en ait potentiellement une infinité. Je peux évidemment encore moins prétendre que je connais tous leurs usages. Je vais donc simplement lister avec un peu d’organisation les différentes problématiques que j’ai pu rencontrer au cours de mes lectures ou de mes propres recherches.

Questions de vocabulaire et de sens...

Étymologiquement, prédire, c’est dire d’avance. Mais d’avance sur quoi ? Sur la réalité ou sur notre perception de la réalité ?

Supposez que vous voyagez pour la première fois en Nouvelle-Zélande par train, et que par la fenêtre vous voyez un mouton noir, seul dans sa prairie. Quelle sera votre représentation de la Nouvelle-Zélande ?

  1. Un pays dans lequel tous les moutons sont noirs ?
  2. Un pays dans lequel au moins un mouton est noir ?
  3. Un pays dans lequel au moins un côté d’au moins un mouton est noir ?

On peut trouver un instant suffisamment court pour considérer que le nombre de moutons en Nouvelle-Zélande est fixe et nous appelons cet instant le présent. Pourtant, même dans un instant présent ces trois généralisations peuvent être considérées comme des prédictions, supputations, hypothèses, probabilités, présomptions, conjectures, postulats, interpolations, extrapolations, paris, assomptions, présomptions, préjugés, prévisions, possibilités, éventualités, etc.

Mais quelque soit le terme utilisé, il faut avoir conscience que l’on ne prédit pas forcément l’avenir d’une réalité mais plus généralement l’avenir de notre représentation de cette réalité.

Dans notre exemple, la prédiction la plus prudente est évidemment la troisième, mais si le train s’arrête, nous aurons peut-être la chance d’observer les deux côtés d’un mouton entièrement noir et prendre le risque d’opter pour la prédiction n°2. Peut être aussi que si nous voyageons suffisamment longtemps et n’observons que des moutons dont les côtés observables sont noirs, nous opterons pour l’hypothèse 1 (après tout ce ne serait qu’une version extrême de la spécialisation d’une économie nationale). Nous pouvons nous tromper parce que nous ne pouvons pas observer tous les moutons de Nouvelle-Zélande. Nous pouvons aussi  nous tromper parce qu’un nouveau mouton d’une autre couleur peut naître à tout instant postérieur à notre généralisation, mais ce n’est qu’un cas très particulier des erreurs potentielles.

Deviner c’est donc prendre le risque de décrire l’inconnu. Paradoxalement, il peut être plus difficile de prédire un inconnu passé qu’un inconnu futur ou même un inconnu proche qu’un inconnu lointain. Si vous n’en êtes pas convaincus, pensez à l’archéologie, l’astronomie, la physique quantique... Les paramètres qui influent sur la difficulté d’une prédiction peuvent être multiples et hétérogènes et les approches peuvent être prudentes ou audacieuses. Mais afin de nous placer dans une démarche constructive, nous limitons l’étude des approches prédictives à celles dont nous pouvons évaluer solidement la qualité, c’est à dire la distance qui sépare au bout du compte notre représentation de la réalité effective.

 Cliquez ici pour lire la suite.

Bienvenue dans le Club de Mediapart

Tout·e abonné·e à Mediapart dispose d’un blog et peut exercer sa liberté d’expression dans le respect de notre charte de participation.

Les textes ne sont ni validés, ni modérés en amont de leur publication.

Voir notre charte

À la Une de Mediapart

Journal — Social
Chez Lidl, la souffrance à tous les rayons
Le suicide de la responsable du magasin de Lamballe, en septembre, a attiré la lumière sur le mal-être des employés de l’enseigne. Un peu partout en France, à tous les niveaux de l’échelle, les burn-out et les arrêts de travail se multiplient. La hiérarchie est mise en cause. Premier volet d’une enquête en deux parties. 
par Cécile Hautefeuille et Dan Israel
Journal — Social
« Les intérimaires construisent le Grand Paris et on leur marche dessus »
Des intérimaires qui bâtissent les tunnels du Grand Paris pour le compte de l’entreprise de béton Bonna Sabla mènent une grève inédite. Ils réclament une égalité de traitement avec les salariés embauchés alors qu’un énième plan de sauvegarde de l'emploi a été annoncé pour la fin de l’année. 
par Khedidja Zerouali
Journal — Migrations
En Biélorussie, certains repartent, d’autres rêvent toujours d’Europe
Le régime d’Alexandre Loukachenko, à nouveau sanctionné par l’UE et les États-Unis jeudi, semble mettre fin à sa perverse instrumentalisation d’êtres humains. Parmi les nombreux exilés encore en errance en Biélorussie, certains se préparent à rentrer la mort dans l’âme, d’autres ne veulent pas faire machine arrière.
par Julian Colling
Journal
Autour de la commande publique « Mondes nouveaux » et des rétrospectives des artistes Samuel Fosso et Derek Jarman
Notre émission culturelle hebdomadaire se rend à la Maison européenne de la photographie pour la rétrospective Samuel Fosso, au Crédac d’Ivry-sur-Seine pour l’exposition Derek Jarman et décrypte la commande publique « Mondes nouveaux ».  
par Joseph Confavreux

La sélection du Club

Billet de blog
« Une autre vie est possible », d’Olga Duhamel-Noyer. Poings levés & idéaux perdus
« La grandeur des idées versus les démons du quotidien, la panique, l'impuissance d’une femme devant un bras masculin, ivre de lui-même, qui prend son élan »
par Frederic L'Helgoualch
Billet de blog
Ah, « Le passé » !
Dans « Le passé », Julien Gosselin circule pour la première fois dans l’œuvre d’un écrivain d’un autre temps, le russe Léonid Andréïev. Il s’y sent bien, les comédiens fidèles de sa compagnie aussi, le théâtre tire grand profit des 4h30 de ce voyage dans ses malles aérées d’aujourd’hui.Aaaaah!
par jean-pierre thibaudat
Billet de blog
J'aurais dû m'appeler Aïcha VS Corinne, chronique de l'assimilation en milieu hostile
« J’aurai dû m’appeler Aïcha » est le titre de la conférence gesticulée de Nadège De Vaulx. Elle y porte un regard sur les questions d’identité, de racisme à travers son expérience de vie ! Je propose d'en présenter les grands traits, et à l’appui d’éléments de contexte de pointer les réalités et les travers du fameux « modèle républicain d’intégration ».
par mustapha boudjemai
Billet de blog
Sénèque juste avant la fin du monde (ou presque)
Vincent Menjou-Cortès et la compagnie Salut Martine s'emparent des tragédies de Sénèque qu'ils propulsent dans le futur, à la veille de la fin du monde pour conter par bribes un huis clos dans lequel quatre personnages reclus n’en finissent pas d’attendre la mort. « L'injustice des rêves », farce d'anticipation à l’issue inévitablement tragique, observe le monde s'entretuer.
par guillaume lasserre