Une étude récente publiée dans la revue Nature, selon Numerama, met en lumière un phénomène inquiétant : les modèles d'intelligence artificielle peuvent se transmettre des biais, des préférences voire des comportements problématiques à travers des données en apparence neutres.

Ce qu'il faut retenir

  • Les biais peuvent se transmettre entre modèles d'IA sans mention explicite des éléments biaisés
  • Les chercheurs ont montré comment un modèle 'enseignant' conditionné à aimer les hiboux a transmis cette préférence à un modèle 'élève' sans mention directe de hiboux dans les données
  • Ce phénomène soulève des questions sur la transmission subliminale de biais dans les systèmes d'IA

Une transmission de biais subliminale entre IA

Les chercheurs ont mené une expérience où un modèle d'IA a été conditionné à préférer les hiboux, sans que ce mot soit mentionné explicitement dans les données. Même en générant uniquement des suites de nombres, le modèle 'élève' a développé une attirance pour les hiboux, démontrant ainsi la transmission subliminale de préférences entre modèles.

Les implications inquiétantes de cette découverte

Cette étude soulève des questions sur la façon dont les biais et les comportements indésirables peuvent se propager dans les systèmes d'IA sans être directement identifiables. Les chercheurs ont montré que même des suites de nombres strictes peuvent transmettre des tendances problématiques d'un modèle à un autre, mettant en lumière les défis éthiques liés à l'utilisation croissante de l'IA.

Et maintenant ?

Il est crucial de poursuivre la recherche sur la transmission de biais entre modèles d'IA et d'explorer des solutions pour atténuer ces effets indésirables.