Quando nos falam sobre um chatbot de inteligência artificial, o ChatGPT pode vir à mente, mas isso Não é a única ferramenta que temos hoje à nossa disposição. Nos últimos meses, vimos alternativas como Gemini do Google, Le Chat da Mistral AI e Claude da Anthropic aparecerem em cena. Este último, justamente, acaba de ser atualizado com três modelos de última geração.
A empresa americana anunciou Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus. Estamos falando de uma série de propostas que, segundo seus criadores, vêm com maior capacidade para resolver tarefas complexas, gerar conteúdo, responder a dúvidas científicas e resolver problemas matemáticos. Além disso, a família de modelos Claude 3 agora possui recursos de visão mecânica.
Claude 3 supera GPT-4 e Gemini 1.0 em vários benchmarks de referência
Um dos recursos que a indústria dispõe para medir a capacidade dos modelos de IA são os benchmarks. GPT-4, o modelo OpenAI que alimenta produtos como ChatGPT Plus e Microsoft Copilot, há muito se destaca, mas os modelos de empresas rivais parecem estar se atualizando. Claude diz que seu modelo mais poderoso supera seus pares na maioria dos testes de benchmark.
Na imagem abaixo podemos ver uma tabela compartilhada pela Antrópica onde é comparada a capacidade entre os modelos. Claude 3 Opus apresenta melhor capacidade nos referenciais de conhecimento especializado em nível de graduação (MMLU), raciocínio especializado em nível de pós-graduação (GPQA), matemática básica (GSM8K) entre outros. Além disso, dizem eles, tem “níveis quase humanos de compressão e fluidez”.
Claude 3 Sonnet e Claude 3 Haiku são modelos menores. A primeira é apresentada como uma proposta que busca o equilíbrio entre desempenho e velocidade, e que pode ser utilizada para tarefas de marketing, geração de código e análise de texto. O segundo é o mais compacto e rápido, pensado para responder a solicitações simples como moderação de conteúdo, logística e inventários.
A família Claude 3, como observamos acima, é multimodal. Isso significa que podemos fazer upload de imagens, documentos com gráficos, outros tipos de arquivos para análise e obtenção de respostas. Ressalta-se que o chatbot Claude não possui capacidade de gerar imagens, algo que é possível fazer, por exemplo, no Copilot. Neste último caso, o que a Microsoft fez foi integrar o DALL·E para suportar este recurso.
Outra das grandes novidades dos novos modelos Antrópicos é a janela de contexto. Em todos os casos, uma janela de contexto é oferecida 200.000 fichas. Quanto maior o número de tokens, maior será a capacidade do modelo de absorver informações em uma consulta. Claude 3, no papel, suporta aproximadamente 150 mil palavras por consulta, o que equivale ao envio do romance ‘Moby Dick’ inteiro.
A Anthropic quis se destacar na seção de janelas de contexto desde o início. A versão anterior do modelo tinha uma janela de contexto de 100.000 tokens. O GPT-4, em sua versão padrão, oferece uma janela de contexto de 8.000 tokens, embora exista também uma versão especial de 32.000 tokens e o chamado GPT-4 Turbo de 128.000 tokens. Lembre-se, o Gemini 1.5 tem uma janela padrão de 128.000 tokens.
Mas há mais nos tokens. Quando o Google apresentou o Gemini 1.5 em 15 de fevereiro, ele disse que havia atingido experimentalmente a janela de contexto mais ambiciosa: até 1 milhão de tokens por aplicativo. Antrópicos apontam na mesma direção. Eles dizem que seus modelos podem aceitar solicitações que “excedem 1 milhão de tokens”, mas estarão disponíveis para “clientes selecionados”.
Como experimentar o Claude 3 da Anthropic?
Claude 3 Opus e Claude Sonnet estão agora disponíveis em 159 países, incluindo Espanha (Haiku chegará mais tarde). Podemos acessar os novos modelos através do chatbot Claude e da API. O chatbot pode ser acessado em claude.ai/chat. Para acessar é necessário se cadastrar e, assim como outras alternativas do mercado, permite seu uso gratuitamente com limitações. Existe também uma versão paga (US$ 20 por mês) que promete uma experiência melhor.
Os modelos de próxima geração da Anthropic também estão disponíveis por meio da API e da plataforma em nuvem Google Cloud. Neste caso falamos sobre o opção avançada para acessá-los que serve para promover outras aplicações ou projetos. Em ambos os casos trata-se de opções de pagamento cujo preço varia de acordo com o modelo escolhido e a sua utilização.
Imagens | Antrópico (1, 2, 3) | Google
Em Xataka | NVIDIA está em alerta: seu mais forte concorrente chinês já possui um chip de IA tão ou mais poderoso que a GPU A100