Há poucos dias o Google deu início à era da IA de bolso com Gemini Nano, seu modelo de IA de texto generativo capaz de funcionar diretamente do celular e sem conexão com a nuvem. Agora a Microsoft acaba de surpreender a todos com o lançamento de seu rival específico, um Small Language Model (SLM) chamado Phi-2 que também pode ser usado em telefones celulares.
Phi-2. Na pesquisa da Microsoft eles indicaram que este novo modelo de conversão de texto em texto é “pequeno o suficiente para rodar em um laptop ou dispositivo móvel”. Satya Nadella já nos contou sobre isso no recente evento Ignite 2023, e é a evolução do Phi-1, que tinha apenas parâmetros de 1,3B.
Um ChatGPT em formato compacto. Estamos diante de um modelo com 2,7 bilhões de parâmetros (2,7B), número que o orienta claramente para ser usado em aparelhos mais modestos. No Google Gemini Nano ele possui duas versões com parâmetros de 1.800 (1,8B) e 3,25 bilhões (3,25B), por exemplo.
Pequeno, mas valentão. É, pelo menos segundo os responsáveis. A razão? É capaz de igualar e até superar o desempenho e a precisão de modelos teoricamente mais capazes como o Llama 2-7B ou o Mistral-7B. Nos testes realizados internamente, o desempenho é excelente apesar de possuir quase um terço dos parâmetros desses modelos.
Também supera o Gemini Nano. O novo modelo da Microsoft também é capaz de superar o desempenho do Gemini Nano 3.25B, o modelo “mobile” mais ambicioso do Google, e segundo os pesquisadores da empresa também é capaz de oferecer menos “toxicidade” e ser mais subjetivo nas respostas do que as oferecidas , por exemplo, por Llama 2.
As comparações são odiosas. Na apresentação do modelo, a Microsoft lembrou-nos que a espetacular demonstração do Gemini Ultra não tinha sido tão espetacular. Ele havia trapaceado um pouco. Em uma das seções, o Google mostrou como o Gemini Ultra foi capaz de ajudar um aluno com problemas de física, e na Microsoft usaram os mesmos prompts com o Phi-2 e viu-se que também conseguiu tirar essas dúvidas mesmo sendo um modelo bem menor.
Só para investigar. Apesar desta capacidade, o Phi-2 não chegará aos nossos telemóveis, pelo menos por enquanto. O modelo é licenciado apenas “para fins de pesquisa” e não pode ser implantado comercialmente. Fala-se na possibilidade de utilizá-lo “para fins não comerciais e não geradores de receitas”, mas a sua aplicação prática é um pouco menos direta. Ele pode ser acessado, porém, por meio do catálogo da nova plataforma Azure AI Studio.
Em Xataka | ChatGPT está ficando preguiçoso e OpenAI sabe disso. Mas se você lhe oferecer uma gorjeta (ou disser que não tem dedos), ele se sairá melhor