Alors qu'elle a fleuri en 2023, elle continue de dominer l'internet et les discussions autour d'elle en 2024. C'est vrai, nous parlons une fois de plus de l'IA. Plutôt que d'ouvrir les boîtes de Pandore autour de l'utilisation de l'IA dans l'art ou de l'idée qu'elle prenne le travail des gens, nous examinons aujourd'hui comment l'IA se trompe elle-même en étant trop dominante sur Internet.
Selon une étude réalisée par une équipe de chercheurs d'Amazon Web Services (merci, Forbes), environ 57 % de tous les textes publiés sur le Web sont générés par l'IA ou ont été soumis à un algorithme d'IA avant d'être mis en ligne. Avec une telle quantité de texte généré par l'IA, on craint qu'elle ne soit en train de tuer l'Internet, et lui-même.
Au fur et à mesure que l'IA scrute l'Internet pour obtenir davantage de données, les chercheurs ont découvert qu'elle finissait par récupérer d'autres contenus générés par l'IA et qu'elle basait ses propres recherches sur ces contenus comme s'il s'agissait de faits avérés. Cela peut entraîner la perte d'un grand nombre de faits réels, car l'IA se débarrasse souvent de données moins connues au profit de ce qui est le plus propagé. Cela conduit à l'effondrement du modèle, c'est-à-dire lorsque l'IA se nourrit tellement de ses propres données synthétiques qu'elle perd toute emprise sur la réalité, recyclant ses propres données et ne se fiant plus qu'à elles. Pour assurer l'avenir de l'IA, nous devrons peut-être conserver un ensemble de contenus non liés à l'IA sur Internet pour qu'elle puisse les utiliser.