Ai Artificial Intelligence.jpg

Claude 3.5 estabelece novos benchmarks de IA, superando o GPT-4o em codificação e raciocínio

Antrópico tem lançado Claude 3.5 Sonnet, a mais recente adição à sua linha de modelos de IA, afirmando que supera modelos anteriores e concorrentes como o GPT-4 Omni da OpenAI. Disponível gratuitamente em Claude.ai e no aplicativo Claude iOS, o modelo também pode ser acessado por meio da API Anthropic, Amazonas Bedrock e Vertex AI do Google Cloud. Cláudio 3.5 O Sonnet custa US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, com uma janela de contexto de 200.000 tokens.

Benchmarks do soneto Claude 3.5 (antrópico)
Benchmarks do soneto Claude 3.5 (antrópico)

Claude 3.5 Sonnet estabelece novos padrões de referência em raciocínio em nível de pós-graduação (GPQA), conhecimento em nível de graduação (MMLU) e proficiência em codificação (HumanEval). Ele demonstra melhorias significativas na compreensão de nuances, humor e instruções complexas e é excelente na geração de conteúdo de alta qualidade com um tom natural. O modelo opera com o dobro da velocidade do Claude 3 Opus, tornando-o adequado para tarefas complexas, como suporte ao cliente sensível ao contexto e fluxos de trabalho em várias etapas.

“Em uma avaliação interna de codificação agente, Claude 3.5 Sonnet resolveu 64% dos problemas, superando Claude 3 Opus, que resolveu 38%.”

O modelo pode escrever, editar e executar código de forma independente, tornando-o eficaz para atualizar aplicativos legados e migrar bases de código. Ele também se destaca em tarefas de raciocínio visual, como interpretação de tabelas e gráficos, e pode transcrever com precisão textos de imagens imperfeitas, beneficiando setores como varejo, logística e serviços financeiros.

A Anthropic também introduziu Artefatos, um novo recurso do Claude.ai que permite aos usuários gerar e editar conteúdo como trechos de código, documentos de texto ou designs de sites em tempo real. Esta característica marca o trabalho de Claude evolução de uma IA conversacional a um ambiente de trabalho colaborativo, com planos para apoiar a colaboração em equipe e o gerenciamento centralizado do conhecimento no futuro.

A Anthropic enfatiza seu compromisso com a segurança e a privacidade, afirmando que o Claude 3.5 Sonnet passou por testes rigorosos para reduzir o uso indevido. O modelo foi avaliado por especialistas externos, incluindo o Instituto de Segurança de Inteligência Artificial do Reino Unido (UK AISI), e integrou feedback de especialistas em segurança infantil para atualizar seus classificadores e ajustar seus modelos. A Anthropic garante que não treina seus modelos generativos em dados enviados por usuários sem permissão explícita.

Olhando para o futuro, a Anthropic planeja lançar o Claude 3.5 Haiku e o Claude 3.5 Opus ainda este ano, junto com novos recursos como o Memory, que permitirá ao Claude lembrar as preferências do usuário e o histórico de interação.

Mencionado neste artigo
Postado em: IA, Tecnologia

Fonte

Compartilhe:

Facebook
Twitter
LinkedIn
Pinterest
Pocket
WhatsApp

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *