O Google finalmente mostra sua grande arma contra o ChatGPT. Gêmeos agora é oficial. O novo modelo de linguagem (LLM) do Google já pode ser testado e promete ser a IA mais avançada até o momento. Ao contrário do que se pensava, a Google decidiu lançar agora o seu novo modelo de IA. Isso será feito em três tamanhos diferentes: nano, Pro e Ultra. A má notícia é que sua versão mais poderosa, Gemini Ultra, só chegará no início do próximo ano.
Gemini, um modelo de IA que supera todos os seus rivais nos principais testes. Gemini é um modelo multimodal, o que significa que pode compreender informações de diversas fontes, desde texto a imagens, vídeo, áudio ou código. Conforme explicado pelo Google, é o “modelo mais flexível até o momento”.
Segundo o Google, os resultados do Gemini em sua versão Ultra são os melhores de uma IA em 30 dos 32 testes acadêmicos amplamente utilizados, superando ligeiramente os percentuais obtidos pelo GPT-4, o modelo OpenAI.
O Google explica que com uma pontuação de 90,04% no MMLU (compreensão de linguagem multitarefa em massa), é o primeiro modelo a superar especialistas humanos em um teste que combina 57 disciplinas como física, história, medicina ou ética, juntamente com capacidade de resolução de problemas.
Uma maneira diferente de raciocinar. O Google projetou o Gemini do zero e a abordagem para lidar com os problemas é diferente. É nativamente multimodal, ou seja, é pré-treinado desde o início para combinar diferentes modalidades. Um vídeo demonstrativo mostra como o Gemini é capaz de interpretar desenhos em tempo real, relacionar objetos e sugerir músicas conforme lhe damos instruções.
Gemini é “excepcionalmente hábil em extrair insights difíceis de identificar de grandes quantidades de dados”, observa o Google.
Com AlphaCode 2. Gemini apresenta um novo sistema de geração de código, AlphaCode2. Conforme descrito pelo Google, o novo sistema tem um bom desempenho em matemática complexa e na compreensão teórica da ciência da computação. Segundo os dados, o AlphaCode 2 tem um desempenho melhor que 85% dos participantes. Para referência, AlphaCode 1 foi melhor que 50%.
Um salto em eficiência. Há uma informação que o Google não compartilhou oficialmente: o número de parâmetros. Isso explica que o Gemini Ultra é o modelo mais eficiente já criado, o que significa que consome menos energia do que é capaz de oferecer.
Um dos motivos é que o Gemini Ultra vem com o sistema TPU v5p, a unidade de processamento de tensores mais poderosa, eficiente e escalável até o momento. Além das TPUs, o Gemini também foi treinado e utiliza GPUs externas, previsivelmente a popular Nvidia H100.
Gemini agora está chegando ao Google Bard (mas em fases diferentes). A partir de hoje, o Google Bard recebe a maior atualização de sua história com a mudança para o Gemini Pro. O chatbot do Google começará a usar a versão média do Gemini. Estará disponível em inglês em mais de 180 países e na Europa nos próximos meses.
A partir do próximo ano, o Google lançará o Bard Advanced. Uma nova versão de sua IA que integrará o Gemini Ultra. No momento a melhor versão do Gemini não foi lançada, pois segundo o Google “estão sendo realizadas extensas verificações de confiança e segurança”.
E também Google Pixel 8 Pro. Além do Bard, o Gemini estará disponível em serviços como Search, Ads, Chrome e Duet AI. A partir de 13 de dezembro, os desenvolvedores poderão acessar o Gemini Pro por meio da API do Google AI Studio ou Vertex AI.
Por fim, o Gemini também estará disponível no Google Pixel 8 Pro. AICore é um novo serviço onde os criadores de aplicativos poderão aproveitar as possibilidades geradas pela IA, neste caso com o Gemini Nano, sua versão mais leve.
Segundo o Google, futuramente essa possibilidade chegará também a outros dispositivos com Android 14. Sem especificar mais detalhes.
O Google quer mais uma vez ser protagonista no campo da inteligência artificial. Além de suas capacidades, o Gemini promete ser o modelo de IA com avaliações de segurança mais abrangentes. Por isso, o Google explica que na busca de pontos cegos tem trabalhado com especialistas externos. Ao mesmo tempo, aplicaram classificadores de segurança específicos para identificar conteúdos que envolvem violência ou estereótipos negativos.
“É o início de uma nova era para nós”, explica Sundar Pichai, CEO do Google. O Gemini demorou a chegar, mas já chegou e o GPT-5 também é esperado no próximo ano. Novos avanços para um campo, o da IA, onde parece que todos os meses ocorrem desenvolvimentos importantes.
Em Xataka | Estamos mais perto do que parece de alcançar a inteligência artificial geral. Pelo menos de acordo com o CEO da DeepMind