ChatGPT Imagens 2.0 lançado! Afirmam que pensa, evolução na renderização de texto, teste do efeito do menu de macarrão com carne

robot
Geração do resumo em andamento

OpenAI lança o ferramenta de imagens do ChatGPT 2.0, com foco em capacidades poderosas de layout complexo e processamento de textos multilíngues (incluindo chinês), este artigo apresentará uma introdução completa às funcionalidades do Images 2.0, suas características, recursos das versões gratuitas e pagas, além de resultados de geração prática.

O que é o ChatGPT Images 2.0? Conheça suas principais funções e características!

Uma ferramenta de geração de imagens AI capaz de competir com o Gemini Nano Banana 2 chegou? A OpenAI anunciou o lançamento do ChatGPT Images 2.0, alimentado pelo novo modelo GPT Image 2, que destaca-se por sua excelente capacidade de selecionar, organizar e revelar informações em imagens. A seguir, as três principais características do ChatGPT Images 2.0:

Processamento avançado de layout e textos multilíngues

Primeiramente, uma característica bastante evidente é a significativa melhoria na capacidade de layout e processamento de textos multilíngues do ChatGPT Images 2.0.

Segundo a mídia especializada Techcrunch, ferramentas anteriores de geração de imagens AI geralmente utilizavam modelos de difusão, que frequentemente enfrentavam dificuldades na escrita de textos. O ChatGPT Images 2.0 consegue apresentar detalhes pequenos, ícones e interfaces de usuário com alta precisão.

A OpenAI afirma que o Images 2.0 apresenta avanços notáveis no processamento de idiomas que usam alfabetos não latinos, incluindo chinês, japonês, coreano, hindi e bengali, podendo gerar esses textos com altíssima clareza nas imagens.

Fonte da imagem: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Capacidade de raciocínio e busca na internet renovadas

Além do processamento de layout e textos multilíngues, o ChatGPT Images 2.0 oferece uma nova capacidade de raciocínio, podendo buscar informações na internet em tempo real para ajudar na geração de imagens. O banco de dados do modelo é atualizado até dezembro de 2025, auxiliando na criação de conteúdos relacionados a eventos recentes.

Fonte da imagem: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Suporte a resolução 2K e proporções variadas

O ChatGPT Images 2.0 suporta geração de imagens com resolução de até 2K e oferece uma gama mais ampla de proporções, desde 3:1 para imagens panorâmicas até 1:3 para imagens verticais.

O responsável pela pesquisa da OpenAI, Boyuan Chen, afirmou que a arquitetura do Images 2.0 foi completamente reformulada, sendo um modelo universal que, com comandos de texto simples, consegue lidar com transformações de perspectiva em estilo 3D e raciocínio espacial complexo.

Funcionalidades das versões gratuita e paga do ChatGPT Images 2.0

Dinheiro bem investido? Usuários de diferentes níveis de assinatura do ChatGPT Images 2.0 podem desbloquear funcionalidades distintas, resumidas assim:

  • Usuários gratuitos: Atualmente, podem usar o modelo básico ImageGen 2.0 para tarefas padrão de geração de imagens. A versão básica já inclui várias melhorias essenciais, como melhor conformidade com comandos, efeitos de renderização de texto mais robustos, suporte multilíngue e maior variedade de proporções.
  • Usuários do ChatGPT Plus, Business e Enterprise: Esses assinantes podem ativar o novo modo de raciocínio. Nesse modo, o gerador de imagens do chatbot utiliza buscas na internet, cria diagramas visuais a partir de arquivos enviados pelo usuário e realiza raciocínio estrutural antes de gerar as imagens. É possível gerar até 8 imagens simultaneamente, garantindo consistência nos personagens, objetos e estilos de cada cena.
  • Usuários Pro: Têm acesso ao modelo ImageGen Pro mais avançado. Embora a OpenAI ainda não tenha detalhado as diferenças exatas entre Pro e o modo de raciocínio, os usuários empresariais podem considerar o raciocínio como uma atualização funcional, útil para tarefas que exigem fatos verificáveis, conversão de documentos internos em diagramas explicativos ou manutenção de consistência visual em múltiplos ativos.
  • Desenvolvedores de API: Agora podem integrar o modelo gpt-image-2, suportando alta resolução e configurações flexíveis de proporções.

Testes do ChatGPT Images 2.0: menus, revistas, gráficos explicativos, etc.

Como o desempenho real do ChatGPT Images 2.0 corresponde às promessas da OpenAI? Vamos testar.

Teste de menu de restaurante de carne bovina

Um editor do “Crypto City” testou a versão gratuita do ChatGPT, criando um menu de pratos de carne bovina taiwanesa, com a seguinte instrução: “Por favor, gere um menu focado em pratos de carne bovina taiwanesa, usando chinês tradicional, incluindo nomes, preços e informações visuais de cada prato.”

A seguir, o resultado gerado:

Fonte da imagem: Gerado pelo ChatGPT Images 2.0

Para o conteúdo gerado na versão gratuita, parece razoável à primeira vista, mas ao observar com mais atenção, ainda há problemas na escrita de caracteres tradicionais chineses com traços mais complexos, podendo apresentar erros de caligrafia. Talvez a versão paga produza resultados melhores.

Além disso, o resultado aproxima-se bastante dos preços de carne bovina em Taipei, e ainda permite uma porção extra gratuita para consumo no local.

Porém, se o menu for para impressão, o ideal é converter as imagens geradas pelo ChatGPT Images 2.0 em arquivos vetoriais (como EPS, .ai do Adobe Illustrator ou PDF) usando o modo CMYK, para garantir a melhor qualidade na impressão. Embora as gráficas possam aceitar JPG ou PNG, se você tiver requisitos elevados de qualidade, será mais difícil ajustar o resultado final.

Teste de capa de revista de tecnologia

Em seguida, testamos uma capa de revista de ficção científica, usando a mesma revista “Crypto City” para verificar o processamento de layout complexo. A instrução foi: “Por favor, gere uma capa de revista de tecnologia em chinês tradicional, com o título ‘Crypto City’, tema ‘Encontro entre Blockchain e IA’, incluindo título, volume, código de barras e data de validade na parte superior, com todos os textos claros e alinhados de forma profissional.”

A seguir, o resultado:

Fonte da imagem: Gerado pelo ChatGPT Images 2.0

O resultado é semelhante ao anterior, aparentando bom à primeira vista, mas ao analisar detalhes, ainda há falhas na escrita de caracteres chineses com traços complexos. Além disso, a fonte da capa lembra bastante a “Jin Xuan” da Justfont, uma fonte taiwanesa, levantando dúvidas sobre possível licença.

Essa dúvida também foi levantada pelo “Crypto City” na época do lançamento do Nano Banana Pro.

  • Reportagem relacionada: Teste do Nano Banana Pro: avanços nos caracteres chineses! Mas surgem dúvidas sobre direitos de animação e fontes

Teste de gráficos explicativos multilíngues

“Crypto City” testou um gráfico de causa de terremoto em chinês tradicional, japonês e coreano, com textos multilíngues complexos, que tiveram uma renderização geral bem-sucedida. Na disposição, diferentes cores foram usadas para distinguir os idiomas, embora ao observar com atenção, alguns caracteres chineses, kanji ou coreanos com traços complexos ainda apresentem alguma borradura.

A seguir, o resultado:

Fonte da imagem: Gerado pelo ChatGPT Images 2.0

Images 2.0 mantém a consistência de personagens e objetos, resolvendo processos complicados

Além disso, o Images 2.0 também possui editabilidade, assim como o Nano Banana 2. Basta clicar em “Editar” no canto inferior esquerdo da imagem gerada para começar a editar, mantendo a consistência de personagens e objetos, facilitando a criação de páginas de quadrinhos, séries de posts para redes sociais ou plantas de design de diferentes cômodos de uma casa.

A gerente de produto do ChatGPT Images, Adele Li, afirmou que essa funcionalidade resolve o incômodo de que, anteriormente, os usuários precisavam gerar uma imagem de cada vez e montar manualmente, permitindo que criadores desenvolvam facilmente livros infantis com uma identidade visual uniforme ou materiais de marketing de marca.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar