A corrida para desenvolver o seu próprio bot de bate-papo pregou uma peça na ByteDance, a gigante chinesa da tecnologia por trás do TikTok. Nos seus esforços para não ficar para trás na batalha da inteligência artificial, a empresa asiática decidiu utilizar a tecnologia OpenAI de uma forma que viola as condições de serviço estabelecidas pela equipa de Sam Altman. A notícia foi divulgada nas últimas horas pelo The Verge e já teve consequências: a OpenAI anunciou que irá suspender a conta ByteDance enquanto investiga a extensão do ocorrido.
É o enésimo capítulo da corrida desencadeada pela IA.
Ignore as letras miúdas. Isso é aproximadamente o que ByteDance fez. Pelo menos de acordo com os dados revelados por Alex Heath no The Verge, que publicou um artigo exaustivo no qual explica como a empresa chinesa por trás do TikTok tem usado secretamente a tecnologia OpenAI para desenvolver seu próprio modelo de linguagem LLM, sigla em inglês. Modelo de linguagem. O objetivo da empresa asiática: não ficar para trás numa área, a da inteligência artificial, em que a ByteDance já brilhou graças ao alimentar do TikTok.
Se a ação da ByteDance gerou polêmica é porque violaria as condições de serviço estabelecidas pela OpenAI para o uso de sua tecnologia. A empresa liderada por Sam Altman e criador do ChatGPT estabelece que os resultados dos seus modelos não podem ser utilizados “para desenvolver modelos de IA que concorram” com os seus próprios produtos e serviços. The Verge vai ainda mais longe e esclarece que a ByteDance acessou a OpenAI através da Microsoft, que aplica a mesma política.
O que diz a política OpenAI? A empresa detalha no seu site as condições de utilização que se aplicam tanto a particulares como a empresas e neste último caso o seu segundo ponto, dedicado às restrições de utilização, é muito claro: a OpenAI não consente em “utilizar o Output para desenvolver qualquer modelo de IA que competem com nossos produtos e serviços. Também não autoriza “qualquer método de extração de dados dos Serviços que não seja aquele permitido pelas APIs”.
Não permitido… e ciente. Heath afirma ter acessado documentos internos da ByteDance que mostram que a empresa confiou na API OpenAI para desenvolver seu próprio LLM com o codinome ‘Project Seed’ durante quase todas as fases de desenvolvimento de seu modelo fundador, que também inclui as etapas de treinamento e a avaliação subsequente do modelo. Não só isso. Heath diz que viu conversas no Lark, plataforma interna da ByteDance, sobre mascarar testes com manipulação de dados.
“Como explicou uma pessoa com conhecimento de primeira mão da situação: ‘Eles dizem que querem ter certeza de que tudo é legal, mas na verdade não querem ser pegos’”. explica o editor do The Verge em seu perfil X.
Quando o Doubao, chatbot da ByteDance, finalmente obteve aprovação dos reguladores para uso na China, a controladora do TikTok supostamente ordenou que seus funcionários parassem de usar a API no ‘Project Seed’, embora essa reversão não tenha ocorrido. Sempre de acordo com as informações tratadas pelo The Verge, a empresa continuou a utilizar a API para avaliar o desempenho do chatbot.
Resposta da OpenAI. A reação da equipe de Altman não demorou a chegar. Há poucas horas a empresa, que acaba de enfrentar uma complexa crise de liderança, emitiu uma nota na qual comunicava a sua decisão de suspender a conta da ByteDance devido ao uso que tinha dado ao GPT durante o treino do seu próprio modelo de IA. “Todos os clientes da API devem cumprir as políticas de uso para garantir que nossa tecnologia seja usada para o bem”, esclarece OpenAI, que decidiu tomar uma decisão: “Embora o uso de nossa API pela ByteDance tenha sido mínimo, suspendemos sua conta enquanto continuamos a investigar.”
A empresa americana vai ainda mais longe e avisa que vai investigar o que aconteceu e qual tem sido o seu alcance, informação que também lhe permitirá exigir uma resposta: “Se descobrirmos que a utilização não cumpre estas políticas, pediremos você realize as alterações necessárias ou cancelaremos sua conta.”
ByteDance nega irregularidades. A empresa chinesa também se manifestou. Em declarações ao Business Insider, a ByteDance negou qualquer irregularidade e insiste que possui licença para usar a tecnologia OpenAI: “A ByteDance é licenciada pela Microsoft para usar as APIs GPT”. A empresa reconhece ter utilizado o GPT para “promover produtos e funções em mercados fora da China”, mas sublinha que utilizou o seu próprio modelo de desenvolvimento para promover o Doubao, ferramenta disponível apenas na China.
A controvérsia da ByteDance surge num momento chave, com Microsoft, Google, Amazon, Meta ou X avançando nos seus próprios caminhos no campo da IA. Há poucos dias o jornal Postagem matinal do Sul da China (SCMP) publicou que a empresa chinesa se lançou na corrida da IA generativa e está a trabalhar numa ferramenta para a criação de chatbots, uma “plataforma de desenvolvimento” que, segundo fontes do jornal de Hong Kong, planeia lançar como versão beta pública antes de 2024.
Imagem de capa: ByteDança
Através da: A beira
Em Xataka: O imparável ByteDance tropeçou em uma pedra muito grande: os videogames