Até agora a NVIDIA era imbatível no mundo dos chips de IA para grandes empresas e data centers, mas a Intel acaba de anunciar um produto que pode mudar as coisas: o Acelerador Gaudi AI 3.
Este chip, afirma a Intel, é capaz de oferecer 50% mais capacidade de inferência e uma eficiência energética média 40% melhor do que o produto de referência neste setor, os chips H100 da NVIDIA.
Na verdade, a Intel se orgulha de que seu Gaudi 3 custa “uma fração” do custo dos gráficos H100 especializados, embora não detalhe exatamente a diferença. Sabe-se, no entanto, que os H100s da NVIDIA custam facilmente cerca de US$ 30.000.
Esta placa aceleradora de IA, destacam os seus responsáveis, será utilizada em grandes sistemas com dezenas de milhares de unidades interligadas através de conexões Ethernet. Gaudi 3 é quatro vezes mais poderoso em tarefas de IA e tem 1,5 vezes mais largura de banda de memória que seu antecessor.
A primeira versão de Gaudí foi feita com fotolitografia de 16 nm. Gaudi 2 utilizou processos de 7 nm, mas nesta terceira geração foi além e utiliza fotolitografia de 5 nm, o que permite a integração de um maior número de transistores e ganhos de potência e eficiência.
Sua capacidade é certamente promissora, e a Intel afirma que o Gaudi 3 poderá oferecer tempos de treinamento 50% melhores ao utilizar os modelos Llama 2 7B e 13B, além do GPT-3 com parâmetros 175B.
Estamos antes um mercado que está em pleno andamento: A AMD já apresentou suas próprias placas aceleradoras em dezembro, as Instinct MI300X, que foram adicionadas às APUs Instinct MI300A e também ofereceram uma alternativa ao H100 da NVIDIA por uma fração do custo.
Claro, na NVIDIA eles não estão exatamente parados e há poucos dias aprendemos sobre seu novo chip B200 com arquitetura Blackwell. Este monstro de 208 mil milhões de transístores (o H100 tem 80 mil milhões) estará disponível em 2024 e irá, sem dúvida, remodelar a concorrência neste setor.
Espera-se que Gaudi esteja disponível para OEMs como HP Enterprise (HPE), Lenovo e Supermicro no segundo trimestre de 2024. Nenhum preço foi especificado para essas placas aceleradoras.
Em Xataka | O lançamento do novo superchip de IA da NVIDIA deixa uma questão: onde estão seus equivalentes para PC e dispositivos móveis?