No início deste ano, DALL-E 2 nos mostrou sua enorme capacidade de gerar imagens a partir de qualquer texto e uma notável melhoria em relação à primeira geração. No entanto, durante todos esses meses, essa inteligência artificial OpenAI teve uma limitação importante: as condições de uso impediram que pesquisadores que tivessem acesso a ela compartilhassem fotos de rosto geradas automaticamentemas isso acabou de mudar.
Conforme coletam nossos colegas da Genbeta, o DALL-E 2 conseguiu gerar rostos fotorrealistas desde o início, mas os responsáveis pelo projeto não permitiram sua circulação fora de portas devido à rrisco de criar deepfakes e conteúdo falso. Então, o que mudou para que os pesquisadores possam compartilhar rostos gerados automaticamente? A OpenAI implementou uma série de mudanças para melhorar a segurança dessa tecnologia.
DALLE-2 pode gerar faces, mas com essas limitações
Para reduzir riscos, o OpenAI garante que o DALL-E 2 agora impeça os pesquisadores de gerar rostos fotorrealistas de qualquer “rosto realista”. Além disso, a plataforma rejeita qualquer tentativa de gerar rostos de celebridades e figuras públicas. Deve-se notar que anteriormente não era permitido gerar rostos de figuras políticas proeminentes, mas após esta atualização, as limitações incluem qualquer personalidade famosa.
Sempre falamos de pesquisadores porque, diferentemente do DALL-E Mini, o DALL-E 2 está atualmente em um fase de teste fechada, por isso ainda não está disponível para o público em geral. Mesmo quem tem acesso a essa tecnologia ainda tem certas limitações. No entanto, inúmeros exemplos de seu funcionamento podem ser encontrados nas redes sociais. E algumas publicações nos permitem ver como são os rostos fotorrealistas gerados por essa tecnologia.
Mais exemplos de rostos de IA com cabelos coloridos e maquiagem geométrica. A revelação de que eles não são ‘reais’ é se você olhar nos olhos deles. # dalle2 pic.twitter.com/CUwOqJcNoT
— Danielle Computer Images 💿 (@djbaskin_images) 21 de junho de 2022
Danielle Baskin, via Twitter @djbaskin_images descreve como você usou DALL-E 2 para gerar rostos fotorrealistas com diferentes designs de maquiagem. “Adicionei a frase ‘amarelo neon geométrico triangular’ às minhas instruções e obtive essas ideias incríveis de cabelo e maquiagem”, diz ela, acrescentando “quando você olha nos olhos [a las imágenes generadas]você sabe que é sobre inteligência artificial.”
Nos bastidores da configuração do estúdio para Girl with a Pearl Earring. #dê a ela pic.twitter.com/fokfgdeaXf
— Ken Kocienda (@kocienda) 19 de junho de 2022
Um exemplo de como o DALL-E 2 pode ser usado para gerar imagens de outra imagem pode ser visto em um Tweet por E Cozinha. A partir da famosa pintura de Johannes Vermeer ‘Garota com Brinco de Pérola’, este usuário pediu para gerar um cena de estúdio, com fotógrafos, câmeras em tripés e muitas luzes, sim, em “pintura a óleo extremamente detalhada”. O resultado, surpreendente, destaca o potencial desse tipo de ferramenta em constante evolução.
Por trás do DALLE-2 está o GPT-3, um poderoso modelo de linguagem lançado em 2020 capaz de gerar vários tipos de conteúdo por meio de prompts escritos, e um modelo de “broadcast”, que comece com um padrão de pontos aleatórios e gradualmente altere esse padrão para gerar uma imagem quando reconhece aspectos específicos. Neste campo também encontramos outras propostas promissoras, como o recém-apresentado Google Parti, que utiliza um modelo autorregressivo e permite entradas de texto mais longas.
Em Xataka | O primeiro juiz feito pela inteligência artificial é bastante imparcial. Más (e boas) notícias para a justiça
Discussão sobre isso post