Apprentissage non supervisé : comment sont formées les IA qui différencient les aigles des avions

Apprentissage non supervisé : comment sont formées les IA qui différencient les aigles des avions

Salon Big Data & IA 2023, Paris – Certes, l’IA générative occupe de nombreuses réunions en entreprise. Au point peut être de faire oublier que les travaux en matière d’IA progressent loin du buzz de ChatGPT. L’apprentissage non supervisé par exemple est une technique des plus prometteuses. Cette déclinaison de l’apprentissage automatique – dit aussi Machine Learning – où les données ne sont pas étiquetées (contrairement à l’apprentissage supervisé) extrait des classes ou groupes d’objets présentant des caractéristiques communes sans l’aide d’un superviseur.

L’ambition de cette technique est de découvrir les structures sous-jacentes à ces données non étiquetées, et c’est un moyen d’expérimenter jusqu’où l’intelligence artificielle peut amener en terme de performance. Armand Joulin, chercheur en intelligence artificielle, a sur ce point présenté lors du Salon Big Data & IA un travail sur la formation des IA de reconnaissance visuelle grâce à une technique d’apprentissage non supervisé. Une technique déjà utilisée par Meta pour la reconnaissance vocale.

“La reconnaissance d’image par une IA a débuté par l’apprentissage supervisé” rappelle t-il. “Avec cette technique, on donne une image a une machine, et on lui demande de faire une tâche avec cette image, comme reconnaître un sujet. Pour ce faire, on labelise les images et on apprend à la machine à reconnaitre les labels”.

publicité

Comment faire de la reconnaissance d’objet sur de la vidéo ?

“C’est une méthode très efficace mais coûteuse en temps. Elle a aussi des limitations, car passer par exemple de la reconnaissance d’image à de la vidéo demande de reformer une IA”. Et en plus des caméras, les smartphones modernes embarquent de plus en plus de capteur, comme de l’infrarouge. “Là aussi, faire de la reconnaissance d’image infrarouge demande de fabriquer une nouvelle IA” indique le chercheur.

Surtout, la classification n’est qu’un des cas d’usage de la reconnaissance visuelle. La détection de copie dans le cadre de la lutte contre le plagiat, le transfert de style ou encore le captionning sont autant de tâches que l’on peut demander à une machine… à condition de la former à chaque fois à cette tâche spécifique, avec un nouveau réseau neuronal.

Armand Joulin tente donc de trouver une méthode pour qu’une machine apprenne des fonctions que l’on peut utiliser partout, sans avoir à entraîner de nouveaux réseaux de neurone. Et il pose deux prérequis

  • Au moment de l’apprentissage de la machine, il faut “l’éduquer” sur différents supports (vidéo, photo, selfie, radio,…)
  • Il faut une tache simple, comme par exemple écrire un texte à partir d’une image.

“Mais le problème dit-il, c’est que on décrit souvent de la même manière deux images légèrement différentes”. D’où l’idée de demander à la machine de décrire non pas ce qui est lui est présenté sur une image, mais de décrire les différences entre deux visuels. Pour ce faire, le chercheur fait comparer de nombreuses images à l’IA et lui apprend ainsi à noter les différences.

 

Reconnaître une photo de chat c’est bien, mais reconnaître les différences entre deux photos de chats pour les décrire, c’est bien mieux.

Cette technique, dite de “no supervision”, est plus performante que l’apprentissage supervisé, assure t-il.

 

Avec cette technique de discrimination, l’IA peut classer, sans label, les images par ce qui leur est différent ou semblable. C’est une forme de classification non supervisée.

“Avec cette technologie, la machine repère la partie la plus discriminative de ce que l’on lui propose image ou vidéo” détaille t-il.

 

L’IA peut reconnaître des différences, mais aussi des ressemblances sur des supports très différents. C’est une des capacités des IA formées avec de l’apprentissage non supervisé.

“Nous avons dépassé le cap de ce que les IA ne peuvent pas faire”

Et il est possible de lui demander aussi quels sont les points communs, entre des avions et des oiseaux sur des médias différents, comme des photos et des vidéos, mais aussi avec des objets en 3D.

“Avec ce système, il est possible d’avoir de la reconnaissance d’objet sur de la vidéo, l’IA identifie les différences et les similarités entre les avions et les aigles” dit-il.

Et de conclure : “Nous avons dépassé désormais le cap de ce que les IA ne peuvent pas faire en matière de reconnaissance visuelle”.

Leave a Reply

Discover more from Ultimatepocket

Subscribe now to keep reading and get access to the full archive.

Continue reading