Quando a OpenAI apresentou o Sora em fevereiro passado, ficamos impressionados com sua capacidade de criar vídeos. Até aquele momento não acreditávamos que modelos generativos eram tão avançados que simulam nosso mundo com uma precisão surpreendente (embora não sem imperfeições). O acesso a esta ferramenta, no entanto, era estritamente limitado e não havia data de lançamento anunciada.
Há cerca de um mês, Sora está disponível para membros da equipe vermelha da OpenAI, responsável por identificar vulnerabilidades, preconceitos e outros problemas, e para um pequeno número de designers, cineastas e artistas visuais, que fornecem feedback de um ponto de vista criativo. Mas tudo parece indicar que não teremos que esperar muito para ter acesso a este modelo.
A libertação de Sora está se aproximando
Em entrevista ao The Wall Street Journal, Mira Murati, CTO da OpenAI, revelou uma série de pistas que podem nos ajudar a estimar quando Sora chegará. O executivo disse que a ferramenta estará disponível “este ano” e, embora não tenha fornecido uma data exata, observou que isso poderia acontecer em “alguns meses”. Então, com base nisso, não teremos que esperar até 2025.
Porém, antes de nos entusiasmarmos, devemos levar em consideração alguns detalhes adicionais. Neste momento não sabemos se a OpenAI fará um lançamento global do Sora este ano ou, pelo contrário, optará por um lançamento gradual. Por outro lado, teremos que esperar para saber se a nova regulamentação da União Europeia poderá atrasar a implantação da ferramenta (algo que já aconteceu com o Microsoft Copilot).
Quando Sora estiver disponível ao público, a ferramenta de IA poderá trazer uma surpresa. A empresa está considerando adicionar áudio aos vídeos gerados. Este é, sem dúvida, um elemento que realçaria ainda mais o realismo das cenas. Como se não bastasse, a OpenAI também está trabalhando em ferramentas de edição que deverão estar disponíveis aos usuários.
Uma das questões espinhosas em relação ao modelo de geração de vídeo da OpenAI é como ele foi treinado. Desde que a empresa liderada por Sam Altman adotou uma abordagem comercial (e consequentemente fechada), muitos detalhes sobre os seus produtos permaneceram secretos, incluindo de onde vieram os dados para “dar vida” aos seus modelos generativos de inteligência artificial.
Este problema já resultou em alguns processos por violação de direitos autorais contra a OpenAI. O New York Times, por exemplo, acusou a empresa de extrair conteúdo de seus artigos para treinar os modelos que fazem o ChatGPT funcionar. Se focarmos em Sora, com quais dados esse modelo foi treinado? Murati também deu algumas pistas sobre isso na entrevista citada.
O especialista disse que usaram dados disponíveis publicamente, licenciados ou não. Questionada se a empresa obteve parte desses dados de serviços como Facebook, Instagram ou YouTube, ela respondeu que não tinha certeza e acrescentou: “Não vou entrar em detalhes”. Mais tarde, porém, confirmou que o material licenciado inclui conteúdo do banco de imagens Shutterstock.
Imagens | OpenAI
Em Xataka | O que há de mais recente no Google é uma IA que joga videogames. A chave: isso acontece através da compreensão da linguagem natural