Aqueles que conseguiram experimentá-lo estão claros que o Humane AI Pin é um desastre. O primeiro dispositivo de IA de nova geração a chegar ao mercado prometia substituir o nosso smartphone, mas as nossas primeiras impressões já deixavam claro que isso parecia impossível.
Este dispositivo, no entanto, é um esforço interessante quando se trata de propor uma alternativa ao celular tradicional. Um que, apesar de suas falhas e limitações, aponta para um futuro em que talvez o smartphone não seja o protagonista absoluto da nossa relação com a tecnologia.
Ainda é muito cedo para dispositivos de IA
As análises vistas nas primeiras análises do Humane AI Pin mostraram como o produto era claramente verde. A interação por voz é uma opção interessante, mas nem tanto se demora nas respostas e sua precisão é baixa.
O culpado aqui não é tanto o AI Pin, mas a tecnologia da qual ele depende. Por trás dessas respostas está o GPT-4, o modelo OpenAI. Receber a pergunta, processá-la, gerar a resposta e sintetizá-la em forma de voz artificial já é complicado por si só, mas depender da nuvem todos os momentos são afetados: tudo fica mais complexo.
Somado a tudo isso está o fato de que GPT-4 não é de forma alguma infalível. É verdade que muitas vezes nos responde com precisão e correção, mas tanto este como o resto dos modelos generativos de IA cometem erros e inventam pela simples razão de não saberem o que dizem. Eles simplesmente dizem isso.
Isso coloca a experiência do usuário e sua validade prática em muitos problemas. Se estou em frente a um monumento e pergunto ao AI Pin o que é isso, espero que ele me responda correta e rapidamente. Se eu puder fazer a mesma coisa mais rápido no smartphone – por exemplo, com o Google Lens – e com mais confiança de que a resposta está correta, os pilares sobre os quais o AI Pin se apoia desabarão.
A razão para todos esses problemas é simples: é cedo ainda. Os modelos de IA são imprecisos, não são exatamente rápidos (a menos que consumam ainda mais recursos) e atualmente dependem de grandes plataformas de nuvem. O grande rival do Humane AI Pin neste primeiro lote é o Rabbit R1, que ainda não chegou aos primeiros usuários, mas que também pode ser afetado por alguns problemas do seu concorrente.
E a solução é igualmente simples. A IA precisa de tempo. É hora de desenvolver chips mais potentes e muito mais eficientes e, principalmente, de que esses chips ofereçam essas opções em nossos celulares. E também é hora de os modelos de IA também se tornarem mais leves e, acima de tudo, mais precisos. Já estamos vendo o primeiro com projetos como o Gemini Nano, e o segundo será alcançado com futuras iterações do atual LLM.
Altman acredita que pode fazer melhor
Temos, portanto, duas propostas atuais – Humane AI Pin e Rabbit R1 – que já são uma realidade, mas que agora estão ameaçadas pela sombra de um projeto muito intrigante.
Este é o dispositivo (ou dispositivos, no plural) que duas das grandes personalidades da indústria estão desenvolvendo. A primeira, Sam Altman, atual CEO da Open AI. A segunda, Jony Iveo famoso designer industrial que marcou época na Apple e que está por trás do design de boa parte dos produtos da empresa – como Mac, iPhone ou Apple Watch, entre outros – no último quarto de século.
Os rumores desta aliança única vêm fermentando há meses, mas as coisas ficaram mais animadas primeiro em janeiro, quando se soube que Altman estava procurando investidores para desenvolver fábricas de chips de IA, e mais tarde, muito recentemente, quando mais evidências da aliança foram encontradas. .A participação de Ive nesse projeto de criação de um novo lote de hardware com IA como protagonista.
O objetivo é crie algo como “o iPhone da IA”, mas na realidade provavelmente não terá muito de um iPhone em particular e de um telefone celular em geral. Muito provavelmente não se parecerá com um smartphone, mas provavelmente o formato será diferente, que é precisamente o que os dois atuais concorrentes também estão a tentar fazer.
O formato e o design não são realmente o problema. Eles disseram sobre o Rabbit R1 que na verdade ele poderia perfeitamente ser um design bem Apple. O problema estará – ou melhor, estará – mais uma vez naquilo que já referimos: tempos mínimos de resposta e precisão e (sobretudo) utilidade prática dessas respostas.
Altman certamente tem tabelas suficientes para lidar com esses problemas: ele sabe melhor do que ninguém onde estão os modelos generativos de IA e certamente aplicará bem essa experiência se este projeto de negócio for adiante.
Na verdade, esses futuros dispositivos provavelmente aproveitarão a ideia de agentes de IA que são a grande ideia do Rabbit R1: eles podem não ser dispositivos “passivos” para dar respostas e permanecer lá, mas também para agir de acordo com essas sugestões. Não só recomendam um restaurante para jantar à sexta-feira, como também fazem a reserva após confirmação do utilizador. E com isso, como com tudo.
Essa pode ser precisamente a chave para um dispositivo de IA que atenda às expectativas: o Humane AI Pin é na verdade baseado no GPT-4, LLM da OpenAI, mas uma coisa é ter esta empresa como parceira tecnológica e outra é ser. seu CEO. Curiosamente, não parece que a OpenAI estará envolvida neste novo projeto Altman.
No entanto, espera-se que Ive e Altman consigam arrecadar pelo menos US$ 1 bilhão para iniciar este projeto. Eles têm candidatos à vista segundo o The Information, e entre eles está Masayoshi Son, CEO do SoftBank e um dos grandes protagonistas do segmento de investimentos tecnológicos.
Como poderia ser o “iPhone da IA” de Altman e Ive?
Sem ver como o Rabbit R1 se comporta, os obstáculos que tanto este como os demais dispositivos de IA de nova geração enfrentam são o estado atual da tecnologia: hoje eles dependem da nuvem, mas também a precisão dos modelos nem sempre é ideal.
Precisamente por esta razão, uma das chaves para os futuros sucessores, sejam eles Altman/Ive ou não, é que estes modelos de IA não execute na nuvem, mas localmente. Isso será crucial para evitar esta dependência da ligação à Internet e das plataformas que agora alojam modelos de IA.
Claro que há outro elemento crucial nessa aposta: o dos chips que permitem oferecer estas experiências. Hoje o Llama 2 é o exemplo de referência de um modelo que pode ser instalado e executado localmente – existem muitos mais – mas para que responda fluentemente precisamos de uma placa gráfica topo de linha, pois são esses chips que atualmente oferecem capacidade suficiente para lidar com os cálculos necessários impostos pelos atuais LLMs.
Esperamos, portanto, que a tecnologia evolua e melhore significativamente em ambas as áreas. O primeiro de modelos são mais eficientes e pode rodar em nossos telefones celulares (e PCs), algo que já começamos a ver com desenvolvimentos como o Gemini Nano.
E segundo, que o fichas do futuro oferecem um salto significativo no desempenho em tarefas de IA, algo que está sendo tentado, por exemplo, com a integração de NPUs cada vez mais poderosas em SoCs modernos. Aqui é interessante ver que pode haver outras maneiras de conseguir isso: Groq, a empresa que desenvolve chips especializados com o que eles chamam de LPUs (Unidades de Processamento de Linguagem) pode ser uma maneira interessante para nossos próprios dispositivos.
Imagens | Aldeia Global | humano
Em Xataka | Sr. Musk, não precisamos de um chatbot sarcástico. Precisamos de alguém em quem possamos confiar 100%