Devin promete ser o "primeiro engenheiro de software de inteligência artificial": aquele que detecta e corrige erros de código autonomamente

Devin promete ser o "primeiro engenheiro de software de inteligência artificial": aquele que detecta e corrige erros de código autonomamente

A programação nunca mais será a mesma. Desde que ferramentas como o GitHub Copilot começaram a demonstrar que parte do trabalho poderia ser feito por máquinas. O sucesso destas soluções está a tornar-se mais claro nesta área, e agora apareceu outra nova solução promissora chamada Devin, desenvolvida pela Cognition Labs.

Engenheiro de software robótico. Seus criadores o chamam de “o primeiro engenheiro de software de IA” e se gabam de como Devin supera em muito outros concorrentes nos testes SWE-Bench. Eles avaliam o comportamento de diferentes LLMs na correção de problemas e pull requests de repositórios Python muito populares e, de acordo com os testes, este agente de IA é capaz de superar Claude 2, Llama ou GPT-4, entre outros.

 <img alt="Estou usando o GitHub Copilot há alguns dias para programar e esta é minha experiência" src="https://i.blogs.es/4ee5a1/1366_2000/375_142.jpeg">

Ele cozinha, ele come. O CEO da Cognition Labs, Scott Wu, explicou em sua apresentação como tudo que você precisa fazer é descrever o problema para Devin e ele cuidará de tudo. Consulta as APIs e o código, e possui um console, um IDE e um navegador próprio para avaliar todo o processo. É capaz de detectar erros, modificar o código e testá-lo para verificar se o erro foi resolvido. A automação surpreende e demonstra mais uma vez a capacidade desses agentes autônomos.

Um programador mais solvente. Nos exemplos que Wu e sua equipe compartilharam no tópico do Twitter Inicialmente vemos como Devin consegue “aprender” a gerar imagens que escondem texto em seu interior, mas também como consegue contribuir com repositórios de códigos já maduros e que, por exemplo, contêm erros. Em um exemplo adicional, Devin Ele fez o trabalho e resolvi um problema pago na plataforma Upwork.

Outra ameaça para os desenvolvedores. Alguns programadores já têm certeza de que este é mais um marco naquele futuro teórico em que parte do seu trabalho será feito por máquinas. É o que Adam Rackis aponta que é desenvolvedor do Spotify e explicou que “os dias de se formar em oito semanas em um bootcamp onde você aprende React e depois consegue um emprego com um salário de US$ 200.000 acabaram”.

É baseado em GPT-4. Isso é curioso, pois a solução criada por Devin não é exatamente original: segundo alguns especialistas seus criadores o construíram em torno do GPT-4 e aproveitaram todos os recursos deste LLM e os aplicaram especificamente a este cenário para programadores.

Há um pequeno investimento por trás. Parece razoável pensar que Devin é de fato baseado no GPT-4: a empresa recebeu um investimento de US$ 21 milhões do Founders Fund – uma empresa de capital de risco cofundada por Peter Thiel – mas esse valor, embora relevante, é pequeno para o que geralmente é tratado nessas áreas e não é nenhum lugar perto o que permitiria criar um modelo comparável ao GPT-4 do zero.

Imagem | Daniel Igdery

Em Xataka | Code Llama 70B é o novo modelo de IA da Meta para programação. Está a um passo de ultrapassar o GPT-4