Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog

ou encore : faut il apprendre à l'IA à tenir compte des absences de données ?

Voici une petite anecdote transmise par Laurent Habart.

Lors de la Seconde Guerre mondiale, l'aviation américaine se demanda comment blinder ses avions pour qu'ils soient moins exposés aux balles allemandes.
Ils identifièrent donc l'emplacement des orifices de toutes les balles reçues.
Le moteur était l'endroit le moins exposé ; le fuselage un des plus touchés.
La réponse était claire : c'est le fuselage qu'il fallait renforcer.
C'est alors qu'Abraham Wald entra en scène.
Abraham Wald était statisticien. Il se demanda pourquoi les relevés d'impact étaient moins fréquents sur le moteur.
Il supposa que c'était... parce que les avions touchés à cet endroit ne revenaient pas !
Les données collectées portaient sur les avions revenus, pas tous les avions.
Et a fortiori les plus significatifs pour l'objet de la recherche : ceux qui succombaient aux balles.
C'est donc là que l'armée, sur ses conseils, décida de les renforcer.
Avoir des données, c'est bien.
En ces temps de complexité, il paraît même que c'est essentiel.
Mais savoir les lire, c'est encore mieux.
Et savoir les lire signifie souvent, en premier lieu, questionner l'origine de leur émission et les moyens de leur recueil.
Peser leur valeur et chercher ce qu'elles ne disent pas.

 

Et comme le font remarquer d’autres experts, l’absence de donnée est en soi une donnée, qu’il faut savoir prendre en compte. Et ça, l’IA ne semble pas en être capable…

 

 

Partager cet article
Repost0
Pour être informé des derniers articles, inscrivez vous :