Les éditeurs d'intelligence artificielle sont souvent peu loquaces sur l'origine des textes utilisés pour l'entrainement de leurs IA, soulevant des soupçons quant à la provenance de ces données. Selon Le Monde, cette opacité entoure la source des montagnes de textes nécessaires à la formation de ces technologies.
Ce qu'il faut retenir
- Les éditeurs d'IA ne divulguent pas clairement les sources de leurs données d'entrainement.
- Des questions subsistent sur l'origine des textes utilisés pour former les intelligences artificielles.
Des pratiques d'entrainement opaques
Les éditeurs d'IA maintiennent un mutisme relatif quant aux corpus de textes qui alimentent l'entrainement de leurs systèmes. Cette discrétion suscite des interrogations sur la nature et la provenance des données utilisées.
Les enjeux de transparence
Face à ces soupçons, la question de la transparence dans le domaine de l'IA se pose avec acuité. Les utilisateurs et les observateurs du secteur appellent à une plus grande clarté sur l'origine des textes exploités pour développer ces technologies.
