A OpenAI está desenvolvendo uma atualização para seu padrão de linguagem gerador de imagens DALL-E 2, chamado de DALL-E 3.
Essa novidade versão, atualmente alcançável sobre 400 usuários, supera o padrão anterior da OpenAI e seus concorrentes reconhecidos, porquê Midjourney ou Stable Diffusion XL, segundo aqueles que tiveram chegada ao preview.
O YouTuber MattVidPro AI demonstrou as capacidades do DALL-E 3 em um vídeo recente, mostrando que ele pode gerar imagens semelhantes a fotos ou pinturas complexas sem seguir regras de repreensão.
Aliás, ele conseguiu gerar imagens de teor violento e protegido por direitos autorais (o que provavelmente será restringido na versão final, quando for lançada ao público).
Por exemplo, ele criou uma pintura de um Jesus Cristo zumbi comendo um sanduíche do Subway, em um estilo bastante semelhante à pintura de Francisco Goya “Saturno devorando um de seus filhos”.
O YouTuber destacou a melhoria do DALL-E 3 na compreensão de prompts e na geração de texto, particularmente na geração de imagens de mãos.
Em verificação com o último padrão da Midjourney, o DALL-E 3 adere melhor às regras de prompt e fornece imagens de qualidade superior.
Esse desenvolvimento, é simples, desafia empresas porquê Midjourney, Microsoft, Google e Adobe a atualizarem suas próprias versões de modelos de linguagem geradores de imagens para seguir o progresso da OpenAI.