Estudo aponta que 35% dos novos sites são gerados por IA desde 2022

Pesquisadores das universidades de Stanford e Imperial College London, em colaboração com o Internet Archive, publicaram um estudo revelador sobre o impacto da inteligência artificial na internet. Segundo os dados, 35% dos sites criados desde 2022 são gerados ou assistidos por IA, um crescimento expressivo em comparação ao período anterior ao lançamento do ChatGPT, no final de 2022.

A pesquisa, intitulada "O Impacto do Texto Gerado por IA na Internet", analisou amostras de sites entre agosto de 2022 e maio de 2025. Os dados foram coletados por meio do Wayback Machine, ferramenta do Internet Archive que armazena versões históricas de páginas da web. Os pesquisadores utilizaram o software Pangram v3, especializado em detecção de conteúdo gerado por IA, para classificar os sites analisados.

Transformação rápida e impactos no conteúdo online

Jonáš Doležal, pesquisador de IA da Stanford e coautor do estudo, destacou a velocidade com que a IA vem moldando a internet. "Em três anos, uma parte significativa da web passou a ser definida por IA, algo que levou décadas para ser construído por humanos", afirmou. Segundo ele, essa transformação representa uma mudança profunda na paisagem digital.

O estudo também investigou seis críticas comuns relacionadas ao conteúdo gerado por IA:

  • Redução da diversidade de opiniões;
  • Aumento da desinformação devido a "alucinações" da IA;
  • Padronização do tom dos textos, tornando-os mais superficiais e otimistas;
  • Falta de citações ou referências confiáveis;
  • Baixa densidade semântica em sequências de palavras;
  • Criação de uma "monocultura" de estilos de escrita, eliminando vozes únicas.

Metodologia e descobertas

Para validar suas hipóteses, os pesquisadores extraíram trechos de sites classificados como gerados por IA e submeteram o conteúdo a verificadores humanos. Um dos testes avaliou a presença de afirmações factuais falsas, enquanto outro analisou se os textos incluíam citações ou links para fontes confiáveis. Os resultados indicaram que:

"A proliferação de textos gerados ou assistidos por IA na internet pode contribuir para a degradação da diversidade semântica e estilística, além da precisão factual. No entanto, a extensão desses impactos ainda precisa ser mais profundamente investigada."

Os pesquisadores também observaram que o conteúdo gerado por IA tende a ser mais positivo e menos detalhado, o que pode influenciar a experiência do usuário e a qualidade da informação disponível online.

Implicações para o futuro da internet

O estudo levanta questões importantes sobre o futuro da web. Com a crescente adoção de ferramentas de IA, como o ChatGPT, a internet enfrenta o risco de se tornar cada vez mais homogênea e menos confiável. Os autores alertam para a necessidade de desenvolver mecanismos que garantam a qualidade, diversidade e transparência do conteúdo publicado.

Enquanto a IA oferece benefícios, como a automação de tarefas e a geração rápida de conteúdo, seus impactos negativos — como a disseminação de desinformação e a perda de originalidade — exigem atenção urgente dos criadores de políticas, desenvolvedores e usuários.