百度伐谋Agent 2.0 mais uma vez no topo do MLE-Bench

Notícias da Mars Finance: a 10 de abril, o Baidu Fàmóu Agent 2.0 voltou recentemente a liderar um benchmark de referência de autoridade em engenharia de machine learning, o MLE-Bench, alcançando um novo desempenho SOTA. Este é um segundo feito depois de ter liderado pela primeira vez em outubro do ano passado. A versão oficial será divulgada em maio deste ano, na conferência de programadores de IA da Baidu, a Create 2026. O MLE-Bench foi criado sob a liderança da OpenAI e inclui 75 desafios reais de engenharia provenientes de competições do Kaggle. (Perspetiva panorâmica)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar