ChatGPT Images 2.0: IA mais inteligente
A OpenAI apresentou o ChatGPT Images 2.0, nova versão de seu modelo para criação de imagens por inteligência artificial. Os recursos anunciados têm como objetivo superar o que é oferecido atualmente pela concorrência. Com a popularidade do Nano Banana, IA de imagens do Gemini do Google, a novidade s

A OpenAI apresentou o ChatGPT Images 2.0, nova versão de seu modelo para criação de imagens por inteligência artificial. Os recursos anunciados têm como objetivo superar o que é oferecido atualmente pela concorrência. Com a popularidade do Nano Banana, IA de imagens do Gemini do Google, a novidade surge como uma tentativa de superar a principal ferramenta gratuita do mercado, propondo ser mais inteligente, precisa e acessível.
O que muda com o ChatGPT Images 2.0
A principal promessa do Images 2.0 é entregar imagens que pareçam ter sido pensadas por um designer, e não geradas por um algoritmo. O novo modelo segue instruções complexas com mais fidelidade, posiciona objetos com precisão e renderiza textos densos dentro das imagens, um ponto que costuma apresentar problemas em outros geradores.
A resolução chega a 2K, e a flexibilidade de proporção de tela cobre desde banners horizontais em formato 3:1 até posts verticais em 1:3. A ferramenta se apresenta como opção para criação de conteúdo para redes sociais, apresentações, cartazes ou interfaces de aplicativos, prometendo uso prático sem ajustes manuais.
Suporte a idiomas
Um ponto de destaque é o suporte aprimorado a idiomas não latinos. Versões anteriores já tinham dificuldades com textos dentro das imagens. Com o Images 2.0, a OpenAI melhorou o suporte a japonês, coreano, chinês, hindi e bengali, gerando imagens em que o idioma se integra ao design de forma coerente.
Funcionalidades avançadas
O modelo vai além da geração simples. Quando o usuário ativa o modo de raciocínio avançado do ChatGPT, ele atua como um parceiro criativo: pesquisa informações na web, analisa o contexto e só então gera a imagem. Pode produzir até oito resultados distintos e coesos em uma única solicitação.
Isso permite criar uma sequência de páginas de mangá, conceitos para redesign de ambientes ou uma série de artes para redes sociais em diferentes proporções e idiomas de uma vez, mantendo continuidade de personagens e objetos entre as imagens.
Disponibilidade para desenvolvedores
A OpenAI também disponibiliza o modelo por meio de API com o nome gpt-image-2. Isso permite que empresas e desenvolvedores integrem a geração de imagens de alta qualidade em seus produtos. Os casos de uso incluem publicidade localizada, infográficos, ferramentas de design, plataformas criativas e criação de sites. Saídas acima de 2K ainda estão em fase beta na API e podem apresentar instabilidades.
Quem pode usar e quando
O ChatGPT Images 2.0 já está disponível para todos os usuários do ChatGPT e do Codex. Os recursos avançados com raciocínio, incluindo a geração de múltiplas imagens por prompt, são exclusivos dos planos Plus, Pro, Business e Enterprise. O preço de acesso via API varia conforme a qualidade e a resolução escolhidas.
A geração de imagens por IA é um mercado em rápida evolução, com várias empresas competindo por espaço. A chegada de novas versões, como a apresentada pela OpenAI, reflete a busca constante por melhorias na qualidade visual, na compreensão de instruções e na aplicabilidade prática das ferramentas. Esse movimento incentiva a inovação e pode levar a opções mais diversificadas e acessíveis para usuários finais e desenvolvedores no futuro.