Gate News notícia, 21 de abril—OpenAI lançou em 22 de abril o ChatGPT Images 2.0, que aprimora significativamente a capacidade de lidar com tarefas visuais complexas. O modelo melhorou a compreensão de instruções, o posicionamento de objetos e a expressão de relações, além de renderização de textos de alta densidade. Ele suporta geração de textos multilíngues, permitindo renderizar com precisão conteúdos não em inglês enquanto mantém a coerência semântica geral. O ChatGPT Images 2.0 oferece controle mais detalhado de detalhes, incluindo fontes de tamanhos pequenos, ícones, elementos de interface e composições complexas, além de suportar saídas com resolução de até 2K. O modelo reforçou a representação de estilos e o realismo, podendo gerar continuamente imagens de nível fotográfico, visuais de estilo cinematográfico, arte pixelada e estilos de quadrinhos. Possui capacidade de processamento de tarefas de ponta a ponta, possibilitando um fluxo de trabalho completo desde a redação de textos até o design de composições. As aplicações incluem desenvolvimento de jogos, criação de roteiros de storyboards e produção de materiais de marketing. O ChatGPT Images 2.0 já está disponível para todos os usuários do ChatGPT e Codex. Recursos avançados de geração de imagens com raciocínio estão disponíveis para usuários Plus, Pro e Business, com suporte empresarial a ser lançado em breve. O modelo subjacente gpt-image-2 também pode ser acessado via API.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar