A IA é realmente boa para identificar rostos, objetos ou animais. Estas funcionalidades têm sido tradicionalmente utilizadas em áreas do quotidiano como a gestão de fotos com Google Photos ou Apple Photos, mas também noutras muito mais perturbadoras como a vigilância em massa que, por exemplo, foi regulamentada na Europa. Agora os pesquisadores descobriram um aplicativo que também possui aplicações práticas excelentes – e preocupantes.
Tudo começou na aula. Três alunos da Universidade de Stanford começaram a cursar a disciplina ‘Ciência da Computação 330: Multitarefa Profunda e Meta Aprendizagem’. Eles precisavam de um projeto para trabalhar, então esses pesquisadores, chamados Michael Skreta, Silas Alberti e Lukas Haas, perceberam que poderiam aplicar esse novo conhecimento ao seu hobby de um jogo online único.
GeoGuessr. Este jogo online, disponível há anos, tornou-se um sucesso singular que já conta com um bom grupo de jogadores obcecados. A ideia é simples: é apresentada a você uma foto de algum local e você deve tentar deduzir onde ela foi tirada apontando para ela no Google Maps a partir dos detalhes da própria foto. O jogo tem 50 milhões de jogadores em todo o mundo e todos competem entre si, e entre eles já existem celebridades do YouTube ou Twitch, e também começaram a surgir jogadores verdadeiramente excepcionais.
Vamos vencer o GeoGuessr. Esses alunos queriam descobrir se poderiam criar um sistema de IA que pudesse jogar o GeoGuessr melhor do que os humanos. Eles partiram de uma plataforma OpenAI chamada CLIP que é capaz de “aprender” dados de imagens de entrada a partir do texto que nelas existe.
Treinamento com Google Street View. Como apontam na NPR, para treinar seu modelo de IA eles começaram a “alimentá-lo” com dados do Google Street View. “Criamos nosso próprio conjunto de dados com cerca de 500.000 imagens do Google Street View. Na verdade, não são muitos dados e ainda assim conseguimos alcançar um desempenho espetacular”, disse Alberti.
POMBO. O projeto, conhecido como Predicting Image Geolocations (PIGEON), acabou sendo fruto desse esforço. O modelo de IA poderia identificar a localização a partir de uma imagem do Google Street View de qualquer local. A sua precisão é surpreendente: deduz o país com 95% de precisão e normalmente coloca a imagem a 25 km do local onde foi realmente tirada.
Derrotar o campeão mundial. Para avaliar seu comportamento, os pesquisadores contataram Trevor Rainbolt, que se tornou uma lenda na comunidade GeoGuessr. Apesar de suas façanhas neste jogo, ao enfrentar o PIGEON acabou perdendo vários rounds. Como Alberti destacou, “não fomos a primeira IA a jogar contra Rainbolt. Fomos simplesmente a primeira IA a vencer ele”.
Além do POMBO. Os responsáveis pelo projeto foram mais longe e criaram também o PIGEOTTO, uma versão mais ambiciosa que foi treinada com mais de quatro milhões de imagens do Flickr e da Wikipedia, o que permite aumentar ainda mais a capacidade e o desempenho do sistema. Não divulgaram o desenvolvimento, que não pode ser testado, mas publicaram o estudo com detalhes e conclusões do projeto.
Especialistas preocupados. Jay Stanley, de la American Civil Liberties Union (ACLU), explicaba que las empresas podrían usar sistemas como este para espiar dónde has viajado, y agencias gubernamentales podrían también detectar si un usuario que publica sus fotos ha viajado a cierto país que está en su ponto de mira. Também poderia ser usado para assediar usuários, por exemplo.
Em Xataka | A IBM distanciou-se do reconhecimento facial, mas não completamente: um suculento contrato de 64 milhões de euros a aguarda