A inteligência artificial parece ter vindo para ficar. Hoje, ChatGPT ou Microsoft Copilot podem nos ajudar a escrever e-mails, programar, estudar idiomas e muito mais. No entanto, alguns acreditam que este é apenas o começo de uma revolução tecnológica muito maior. Bill Gates, por exemplo, imagina um futuro onde os agentes de IA realizarão tarefas por nós e “mudarão completamente a forma como vivemos”.
Este porto para onde aparentemente nos dirigimos tem potencial para desencadear um aumento de produtividade, mas também apresenta desafios de segurança cibernética. Um grupo de especialistas da Universidade Cornell, localizada no estado de Nova York, criou “o primeiro worm projetado para atacar ecossistemas GenAI”. Trata-se de um novo malware funcional em laboratório que pretende alertar para a real possibilidade de criação deste tipo de ameaças.
Um worm para enviar spam e roubar dados
O worm, denominado Morris II em homenagem ao primeiro worm da Internet criado por Robert T. Morris em 1988, foi usado para demonstrar vários ataques de dia zero contra um serviço de e-mail capaz de responder automaticamente a mensagens com IA generativa. Os pesquisadores conseguiram obter o malware irá se auto-replicar e roubar dados da vítima em testes com dois grandes modelos de linguagem populares: Gemini Pro do Google e GPT-4 da OpenAI.
Para comprometer a segurança do sistema de e-mail (criado especificamente para a investigação), Morris II usa uma técnica conhecida como Adversarial Self-Replicating Prompt. Este é um tipo específico de prompt incluído no corpo da mensagem ou incorporado sub-repticiamente em uma imagem e que engana a IA generativa adjacente ao processar a mensagem. Este ataque, explicam, pode infectar outros hosts e espalhar conteúdo personalizado.
Morris II também é capaz de comprometer uma funcionalidade conhecida como RAG. Esta é uma ferramenta utilizada por algumas aplicações de inteligência artificial para melhorar as respostas através da extração de informações de fontes externas. Neste caso, o worm foi capaz de banco de dados comprometido do aplicativo de e-mail simulado, de modo que suas respostas incluíssem dados confidenciais do usuário e também pudessem se replicar.
Os pesquisadores afirmam ter enviado suas descobertas ao Google e à OpenAI, embora acrescentem que o worm que criaram se aproveita de um design deficiente na arquitetura do ecossistema GenAI representada no programa de e-mail que eles próprios criaram e não em vulnerabilidades nos modelos de linguagem. Todos os detalhes desta interessante investigação podem ser consultados num artigo de acesso público.
Imagens | Xataka com Copilot Designer (DALL·E 3)
Em Xataka | NVIDIA está em alerta: seu mais forte concorrente chinês já possui um chip de IA tão ou mais poderoso que a GPU A100