L’enthousiasme initial autour de l’écriture automatisée par intelligence artificielle, déclenché par le lancement de ChatGPT fin 2022, semble marquer le pas. Une analyse récente de l’agence de marketing digital Graphite indique que la proportion d’articles, billets de blog et listes principalement générés par IA s’est stabilisée autour de 50 % depuis plus d’un an.

Un phénomène qui ne s’est pas généralisé

Contrairement aux craintes d’une domination massive des contenus automatisés sur le web, les données montrent que l’IA n’a pas pris le contrôle total de la production écrite en ligne. Après une progression rapide, la part des articles générés par IA a atteint 48 % en 2024, mais depuis le début de l’année 2025, elle oscille autour de 50 % sans connaître de nouvelle hausse significative.

Une méthodologie rigoureuse

Pour parvenir à ces conclusions, Graphite a analysé un échantillon aléatoire de 55 400 URLs en anglais issues de Common Crawl, une archive publique du web souvent utilisée pour entraîner les modèles d’IA. Les pages sélectionnées devaient répondre à plusieurs critères :

  • Contenir au moins 100 mots ;
  • Être publiées entre janvier 2020 et mars 2026 ;
  • Être classées comme articles ou listes.

Chaque texte a ensuite été soumis à trois outils de détection d’IA : Pangram, GPTZero et Copyleaks.

Des limites floues entre contenu humain et automatisé

La frontière entre un article écrit par un humain et un texte généré par IA devient de plus en plus ténue. De nombreux rédacteurs utilisent désormais l’IA pour structurer, rédiger ou corriger leurs textes, brouillant ainsi les résultats des outils de détection. Graphite considère qu’un article est « principalement généré par IA » uniquement lorsque la majorité de son contenu est détectée comme tel.

« La qualité des contenus générés par IA s’améliore rapidement. Dans de nombreux cas, ils sont aussi bons, voire meilleurs, que ceux rédigés par des humains. Il est souvent difficile pour les lecteurs de faire la distinction », souligne l’analyse de Graphite.

« Ces modèles sont intelligents grâce à toutes les informations que nous avons mises en ligne, créées sans ces outils. Si nous cessons de produire des connaissances indépendantes de ces modèles, qu’est-ce qui les alimentera ? »

Dan Klein, professeur à l’Université de Californie à Berkeley et directeur technique d’un modèle d’IA

Un risque de boucle de rétroaction négative

Les chercheurs mettent en garde contre un scénario inquiétant : si les modèles d’IA commencent à s’entraîner sur des contenus eux-mêmes générés par IA, le web pourrait devenir une source massive de textes de faible qualité, formant un cercle vicieux difficile à briser.

En résumé

Si l’IA écrit désormais presque autant d’articles que les humains, son expansion semble avoir atteint un plafond. Pour l’instant, la crainte d’une invasion totale des contenus automatisés ne s’est pas concrétisée, mais les experts soulignent l’importance de maintenir une production de connaissances indépendantes pour éviter une dégradation de la qualité globale des contenus en ligne.

Source : Axios