Openai.jpg

OpenAI lança o modelo LLM de próxima geração o1 usando tokens de raciocínio para planejar saídas

A OpenAI lançou uma nova série de modelos de IA chamados OpenAI o1, projetados para aprimorar as capacidades de raciocínio para resolver problemas complexos. Os modelos o1-preview e o1-mini visam gastar mais tempo pensando em problemas antes de gerar respostas, potencialmente beneficiando campos como ciência, codificação e matemática.

Como OpenAI relatou, esses modelos aprendem a refinar seus processos de pensamento por meio de treinamento, permitindo que eles tentem estratégias diferentes e reconheçam erros. Em testes, a próxima atualização do modelo teve desempenho igual ao de alunos de doutorado em tarefas desafiadoras de física, química e biologia. O modelo de raciocínio superou significativamente os modelos anteriores, resolvendo 83% dos problemas em um exame de qualificação para a Olimpíada Internacional de Matemática, em comparação com os 13% do GPT-4.

Para desenvolvedores, a série o1 oferece capacidades de codificação aprimoradas, alcançando o 89º percentil nas competições da Codeforces. O OpenAI o1-mini, um modelo menor e mais econômico, é 80% mais barato que o o1-preview e se destaca na geração e depuração de códigos complexos.

Esses avanços podem ter implicações para a indústria de criptomoedas, onde códigos complexos e raciocínio matemático são críticos. Os recursos aprimorados de raciocínio e codificação dos modelos o1 podem beneficiar o desenvolvimento de contratos inteligentes, análise de protocolos de blockchain e auditoria de segurança.

A OpenAI também implementou uma nova abordagem de treinamento de segurança para esses modelos, permitindo que eles aderissem melhor às diretrizes de segurança e alinhamento ao raciocinar sobre políticas por meio de cadeia de pensamento. Em testes desafiadores de jailbreaking, o modelo o1-preview pontuou significativamente mais alto na manutenção da adesão às regras de segurança em comparação ao GPT-4.

Greg Brockman, presidente e cofundador da OpenAI, diz que a tecnologia o1 fornece novas oportunidades de segurança e mostrou melhorias em confiabilidade, alucinações e robustez a ataques adversários. Ele destaca que a capacidade dos modelos de raciocinar passo a passo desbloqueia o “pensamento do Sistema II”, permitindo-lhes lidar com tarefas mais complexas.

Os modelos o1 estão disponíveis atualmente para usuários do ChatGPT Plus e Team, com acesso para usuários Enterprise e Edu seguirem. Desenvolvedores com níveis de uso de API qualificados podem começar a prototipar com ambos os modelos, embora certos recursos como chamada de função e streaming ainda não sejam suportados.

A OpenAI planeja continuar desenvolvendo e lançando modelos nas séries GPT e o1, com o objetivo de torná-los mais úteis adicionando recursos como navegação e upload de arquivos e imagens.

Compartilhe:

Facebook
Twitter
LinkedIn
Pinterest
Pocket
WhatsApp

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *