Podemos regulá-lo e tentar impedi-lo, mas neste momento é claro que o desenvolvimento da inteligência artificial generativa é imparável. Acima de todas as implicações, há um problema energético: é necessária uma enorme capacidade computacional para processar as respostas e, sobretudo, treinar grandes modelos de IA, uma possibilidade ao alcance de muito poucas empresas.
Quanta energia a IA generativa consome? O engenheiro-chefe de IA generativa da Meta, Sergey Edunov, tem uma resposta surpreendente: “são necessários apenas dois reatores nucleares” para atender à demanda.
É uma visão otimista de um problema que nos preocupa há vários anos: a IA superpoluente. O treinamento de modelos de inteligência artificial não aumentaria as emissões de carbono se construíssemos uma usina nuclear com dois reatores exclusivamente para alimentá-los.
Energia nuclear para alimentar a fera. A Meta não é a primeira empresa a vincular a energia nuclear à inteligência artificial. A Microsoft revelou em setembro seus planos para desenvolver reatores de fissão nuclear “para alimentar os data centers onde residem a Microsoft Cloud e sua inteligência artificial”.
A Microsoft também investiu na fusão nuclear. No início do ano, a empresa liderada por Satya Nadella concordou em comprar energia de fusão à Helion Energy, uma startup liderada por Sam Altman, se conseguisse pôr em funcionamento os seus engenhosos reatores de fusão até 2028. Mais um acordo entre Nadella e Altman, mas faz sentido. Afinal, a própria IA está a ajudar-nos a superar os maiores desafios da fusão nuclear.
De onde vem o cálculo Meta? Sergey Edunov lidera o treinamento do Llama 2, modelo de linguagem do Meta que se tornou um dos mais utilizados devido à sua abordagem de código aberto. Em mesa redonda moderada pela VentureBeat no Vale do Silício, Edunov colocou alguns números na mesa:
“A Nvidia lançará entre um milhão e dois milhões de GPUs H100 no próximo ano. Se todas essas GPUs fossem usadas para gerar ‘tokens’ para modelos de linguagem de tamanho razoável, elas somariam cerca de 100.000 tokens por pessoa por dia em todo o planeta. Cada uma “O H100 consome cerca de 700 watts; adicionando o resfriamento do data center, cerca de 1 kW. Não é muito em escala humana, seriam necessários apenas dois reatores nucleares para alimentar todos aqueles H100.”
Treinamento de modelo vs. ‘inferência’. Edunov fez várias qualificações. A sua estimativa não tem em conta a formação do modelo, mas sim a sua “inferência”, o processo pelo qual um modelo de IA já treinado aplica o que aprendeu para responder a perguntas e pedidos.
O treinamento é muito mais caro energeticamente do que a inferência, então todos os modelos grandes têm um corte de informações (o último corte do ChatGPT é abril de 2023, mas antes disso ele funcionou por meses com informações de 2021). O seu cálculo por ‘tokens’ (unidades de linguagem que os modelos de linguagem são capazes de processar) apenas tem em conta a capacidade de inferência de IA generativa que a Nvidia planeia vender em 2024.
Um cálculo alternativo. “Em breve, a inteligência artificial necessitará de tanta electricidade como um país inteiro”, foi a manchete do New York Times há um mês. A matéria referia-se a um estudo que estima o consumo de 85 a 134 terawatts até 2027. Tanto quanto Argentina, Holanda ou Suíça.
Um reator nuclear tem capacidade de produção de cerca de 1.000 megawatts-hora. Menos de 9 terawatts-hora por ano, se funcionasse sem parar.
A pegada de carbono da IA. Neste momento, o mundo não funciona como sugere Edunov. As placas gráficas que trabalham horas extras para que possamos conversar com uma máquina ou criar memes da Pixar não são alimentadas exclusivamente por fontes livres de carbono. Os data centers são diretamente responsáveis por 1% das emissões de gases de efeito estufa, e a situação está piorando devido à IA
Mais regulamentação pode acelerar a mudança para a utilização de energia com emissões zero. Uma nova lei governamental da Califórnia obriga as grandes empresas tecnológicas, incluindo a OpenAI e a Google, a revelarem a sua pegada de carbono e a da sua cadeia de abastecimento até 2026. Na Europa, a Comissão Europeia propõe que os centros de dados sejam neutros em carbono até 2030.
Imagem | Gerald Buthaud (Sunset/GTRES), Sergey Edunov (X)
Em Xataka | “Já estamos no último passo”: como a Espanha obteve a chave para tornar a fusão nuclear uma realidade