Un tiers des nouveaux sites web sont générés par IA : l'étude qui alerte sur la transformation du web

transformation numérique ChatGPT IA générative Internet Archive contenu en ligne études technologiques qualité de l'information Dead Internet Theory

Une équipe de chercheurs issus de Stanford, de l'Imperial College London et de l'Internet Archive a mené une étude révélant qu’un tiers des sites web créés depuis 2022 sont générés par intelligence artificielle (IA). Leurs conclusions, publiées dans un article intitulé *« L’impact du texte généré par IA sur Internet »*, dressent un portrait inédit de la transformation du web sous l’influence des outils comme ChatGPT.

Les travaux s’inscrivent dans la lignée de la Dead Internet Theory, une hypothèse selon laquelle une part croissante d’Internet serait désormais contrôlée par des bots. Les chercheurs ont analysé l’évolution des contenus en ligne depuis le lancement de ChatGPT fin 2022, une période marquée par une adoption massive de l’IA générative.

« La vitesse à laquelle l’IA a pris le contrôle du web est stupéfiante », déclare Jonáš Doležal, chercheur en IA à Stanford et coauteur de l’étude. « En seulement trois ans, une part significative d’Internet, autrefois façonnée par des humains, est désormais définie par des algorithmes. Nous assistons, à mon sens, à une révolution du paysage numérique en un temps record. »

L’étude a également évalué six critiques récurrentes concernant le texte généré par IA :

Réduction de la diversité des points de vue
Propagation de la désinformation due aux hallucinations
Uniformisation du ton (plus aseptisé et optimiste)
Manque de citations ou de sources fiables
Diminution de la densité sémantique
Apparition d’une monoculture rédactionnelle

Pour mener cette analyse, les chercheurs se sont appuyés sur les archives de l’Internet Archive, en étudiant des échantillons de sites web publiés entre août 2022 et mai 2025. Chaque URL a été récupérée via la Wayback Machine, et le texte extrait a été analysé à l’aide de l’outil Pangram v3, spécialisé dans la détection de contenus générés par IA.

Parmi les méthodes employées, les chercheurs ont notamment vérifié la véracité des affirmations factuelles présentes sur les sites identifiés comme générés par IA. Pour cela, des vérificateurs humains ont été chargés d’évaluer la fiabilité des informations. Une autre approche a consisté à mesurer la présence de liens externes, afin de déterminer si les contenus générés par IA citent correctement leurs sources.

Les résultats préliminaires suggèrent une tendance inquiétante : l’IA semble favoriser des contenus plus concis, moins nuancés et parfois moins rigoureux sur le plan factuel. Ces observations alimentent le débat sur l’équilibre entre innovation technologique et préservation de la qualité de l’information en ligne.

Source : 404 Media

← Précédent

L'ancien juge Breyer rassure sur l'usage du "docket d'urgence" par la...

Défense des Lions : Kerby Joseph et Brian Branch de retour après leurs blessures

15:52 · 15 mai 2026

ArXiv interdit aux chercheurs pendant un an pour soumission de contenu IA non vérifié

ArXiv, the open-access repository of preprint academic research, will ban authors of papers for a year if they submit obviously AI-generated work. Lat...

15:19 · 15 mai 2026

Les coulisses du blog : musique, IA et révélations sur ICE

This is Behind the Blog, where we share our behind-the-scenes thoughts about how a few of our top stories of the week came together. This week, we dis...

13:00 · 15 mai 2026

La Mayo Clinic utilise l'IA pour enregistrer les échanges aux urgences

Mayo Clinic, the massive U.S. hospital network, is using what it describes as “Ambient Listening” to record patient interactions with nurses, includin...

20:35 · 14 mai 2026

L'IA avancée, une révolution dans la guerre selon un haut responsable du Pentagone

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 mai 2026

Cybersécurité : l'identité numérique devient cruciale face à l'essor de l'IA

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

18:00 · 14 mai 2026

L'arrêt brutal de l'USAID en 2025 a déclenché une vague de violences en Afrique, révèle une étude

🌘Subscribe to 404 Media to get The Abstract, our newsletter about the most exciting and mind-boggling science news and studies of the week. The sudde...

14:23 · 14 mai 2026

Foxconn victime d’une cyberattaque : des usines nord-américaines perturbées

Foxconn, one of the world’s largest manufacturers of electronics sold by major tech vendors, is recovering from a cyberattack that disrupted some of t...

13:30 · 14 mai 2026

Une application d'IA analyse les selles : son créateur propose à la vente une base de données de 150 000 images de selles

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

Cybersécurité

Un tiers des nouveaux sites web sont générés par IA, révèle une étude

L'ancien juge Breyer rassure sur l'usage du "docket d'urgence" par la...

Défense des Lions : Kerby Joseph et Brian Branch de retour après leurs...

Cybersécurité

Un tiers des nouveaux sites web sont générés par IA, révèle une étude

L'ancien juge Breyer rassure sur l'usage du "docket d'urgence" par la...

Défense des Lions : Kerby Joseph et Brian Branch de retour après leurs...

Articles connexes

ArXiv interdit aux chercheurs pendant un an pour soumission de contenu IA non vérifié

Les coulisses du blog : musique, IA et révélations sur ICE

La Mayo Clinic utilise l'IA pour enregistrer les échanges aux urgences

L'IA avancée, une révolution dans la guerre selon un haut responsable du Pentagone

Cybersécurité : l'identité numérique devient cruciale face à l'essor de l'IA

L'arrêt brutal de l'USAID en 2025 a déclenché une vague de violences en Afrique, révèle une étude

Foxconn victime d’une cyberattaque : des usines nord-américaines perturbées

Une application d'IA analyse les selles : son créateur propose à la vente une base de données de 150 000 images de selles