OpenAI parece estar definindo o ritmo para o desenvolvimento do IA generativa. Após o lançamento do ChatGPT em novembro de 2022, vimos o lançamento de uma onda de chatbots alternativos, como o Gemini do Google e o Claude Chat da Anthropic.
A empresa liderada por Sam Altman apresentou um gerador de vídeo chamado Sora em fevereiro deste ano. E, claro, o movimento da indústria tem sido fácil de prever: as empresas tecnológicas estão a trabalhar para competir na geração de vídeo.
Um gerador de vídeo ‘Made in China’
A filmagem que a OpenAI exibiu de Sora deixou muitas pessoas surpresas, incluindo editores de vídeo profissionais. Até o momento não tínhamos visto nada parecido. O modelo poderia não apenas gerar vídeos, mas também simular o nosso mundo.
Mas, tal como acontece com os chatbots, temos razões para acreditar que é uma questão de tempo até que surjam ferramentas com capacidades semelhantes. A Adobe já está trabalhando em seu próprio gerador de vídeos, mas nem tudo nasce nos Estados Unidos. As empresas chinesas também estão a trabalhar incansavelmente neste sentido.
A Shengshu Technology e a Universidade Tsinghua apresentaram ao mundo um gerador de vídeo chamado Vidu. Estamos diante de uma ferramenta baseada em inteligência artificial que converte indicações textuais simples em fragmentos de vídeo de até 16 segundos de duração (contra 60 segundos de Sora) com resolução máxima de 1080p.
Como podemos ver no vídeo acima, a empresa asiática não hesita em comparar indiretamente a sua ferramenta com a desenvolvida pela OpenAI. Em outras palavras, eles pegaram o conceito de alguns clipes do Sora e nos mostraram como ficariam com o Vidu.
São cenas com certo grau de complexidade para uma IA. Por exemplo, um olho humano em detalhe plano, um veículo passando por uma floresta, televisores empilhados, uma mulher caminhando à noite por uma cidade iluminada por luzes neon, entre outras cenas.
À primeira vista, o Sora parece ser uma ferramenta capaz de produzir resultados de melhor qualidade. No entanto, neste ponto devemos fazer uma menção importante: nenhuma das duas alternativas está aberta ao público em geral, por isso não pudemos testá-las.
Os criadores do Vidu destacam que seu modelo possui uma série de características muito notáveis. Eles afirmam que, como Sora, ele pode simular o mundo físico. Dizem também que ele consegue criar cenas consistentes e é capaz de compreender elementos chineses.
Imagens | OpenAI | Shengshu-ai
Em Xataka | Essa cozinha não é real e a IA não tem um filho superdotado: é assim que a Meta AI está mudando o Facebook e o Instagram