Gate News, 21 avril — OpenAI a publié le 22 avril ChatGPT Images 2.0, améliorant considérablement la capacité de traitement des tâches visuelles complexes. Ce modèle a amélioré la compréhension des instructions, la disposition des objets et l'expression des relations, ainsi que le rendu de textes à haute densité. Il prend en charge la génération de textes multilingues, permettant d'améliorer la cohérence sémantique globale tout en rendant avec précision le contenu non anglais dans les images. ChatGPT Images 2.0 permet un contrôle plus précis des détails, y compris les petites polices, les icônes, les éléments d'interface utilisateur et les compositions complexes, et supporte une sortie jusqu'à 2K de résolution. Ce modèle renforce la représentation stylistique et le réalisme, pouvant générer en continu des images de qualité photographique, des visuels de style cinématographique, de l'art pixel et du style manga. Il possède une capacité de traitement de tâches de bout en bout, permettant un flux de travail complet allant de la rédaction de textes à la conception de compositions. Les applications incluent le développement de jeux, la création de scénarios et la production de matériel marketing. ChatGPT Images 2.0 est désormais accessible à tous les utilisateurs de ChatGPT et Codex. Les fonctionnalités avancées d'imagerie avec capacités de raisonnement sont disponibles pour les utilisateurs Plus, Pro et Business, avec un support Enterprise à venir. Le modèle sous-jacent gpt-image-2 peut également être utilisé via API.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler