Novo motor de imagens do ChatGPT chega com promessas e desafios
O ChatGPT acaba de lançar uma atualização significativa em seu motor de geração de imagens, prometendo melhorias como tipografia aprimorada, acesso à web e capacidade de raciocínio. Para avaliar suas reais capacidades, a equipe da Axios realizou testes práticos com a nova ferramenta, batizada de ChatGPT Images 2.0.
O que mudou na versão 2.0?
A nova versão já está disponível no aplicativo e introduz recursos como suporte a diversos formatos de imagem e dois modos de operação: o padrão e o "pensante" (thinking mode), este último exclusivo para usuários pagantes. Segundo a empresa, o modelo foi treinado para entender melhor o contexto e produzir resultados mais precisos.
Testes práticos revelam pontos fortes e fracos
Em um dia de uso, a equipe testou a ferramenta em diferentes cenários:
-
Memorial personalizado: Um usuário pediu uma imagem em memória de seu gato falecido, acompanhada de dois brinquedos favoritos. O ChatGPT criou uma ilustração semelhante a um cartão de condolências altamente personalizado.
-
Edição de fotos de casamento: A ferramenta transformou duas fotos de casamento em um álbum estilo vintage, com cantos de foto, como se fossem imagens antigas.
-
Criação de pôsteres: Foi gerado um pôster fictício para um evento em Washington Square Park, com a participação de um sósia do jornalista Mike Allen.
-
Infográfico persuasivo: O ChatGPT produziu um infográfico intitulado "O caso contra o milho doce", usado (sem sucesso) para convencer colegas de que o doce não é nem doce nem milho.
-
Organização de ambientes: Ao analisar uma foto de quarto bagunçado, a ferramenta mostrou como o espaço ficaria sem os objetos espalhados. A reação da parceira do usuário foi: "Quando o ChatGPT realmente limpar o quarto, avisem".
-
Cartões personalizados: Transformou fotos de jogos de softball e futebol em cartões de jogador, incluindo nome, posição e logo da equipe, extraídos das camisetas.
Limitações e desafios identificados
Apesar dos avanços, o motor ainda apresenta algumas limitações:
-
Falta de atualização em tempo real: Ao pedir um jornal fictício baseado em manchetes recentes da Axios, a primeira tentativa usou artigos antigos. Na segunda tentativa, o resultado foi mais atual, mas ainda parecia um esboço.
-
Resultados pouco refinados: Um guia de trapaças para mahjong foi produzido com precisão, mas com baixa qualidade visual.
-
Tempo de processamento: O modo "pensante" exige mais tempo para gerar imagens, o que pode ser um inconveniente para usuários que buscam agilidade.
"O novo motor de imagens do ChatGPT é promissor, mas ainda precisa amadurecer. A capacidade de raciocínio é um avanço, mas a precisão e a velocidade ainda deixam a desejar em alguns casos."
Quem pode usar e como funciona?
Todos os usuários têm acesso ao modo padrão de geração de imagens. Já o modo "pensante", que inclui raciocínio integrado, é restrito a assinantes pagos. A ferramenta suporta diversos formatos e proporções, permitindo maior flexibilidade na criação de conteúdos visuais.
Conclusão: avanço significativo, mas com espaço para melhorias
O novo motor de imagens do ChatGPT representa um passo importante na evolução das ferramentas de IA para criação visual. Embora ainda enfrente desafios, como a precisão em tempo real e a qualidade de alguns resultados, as possibilidades são promissoras. Para empresas e usuários que buscam soluções rápidas e criativas, a ferramenta já oferece vantagens claras, especialmente com o modo "pensante" para tarefas mais complexas.
No entanto, é importante gerenciar as expectativas: a IA ainda não substitui completamente a criatividade humana ou a precisão de profissionais especializados. O futuro dessas ferramentas dependerá de como a OpenAI e outras empresas conseguirem aprimorar a integração entre raciocínio, precisão e velocidade.