O mais recente modelo de IA da Alibaba, QwQ-32B-Preview, supera o O1 da OpenAI em alguns benchmarks

Cryptopolitan
MATH0,22%

À medida que a concorrência se intensifica no campo da IA, o gigante chinês do varejo Alibaba apresentou o QwQ-32B-Preview, que, segundo relatos, supera a série o1 da OpenAI.

O último modelo supostamente supera os modelos o1-preview e o1-mini da OpenAI em alguns benchmarks específicos, como os testes AIME e MATH, que avaliam o desempenho dos modelos de IA em quebra-cabeças lógicos e problemas matemáticos.

A Alibaba disponibilizou o QwQ-32B-Preview para download.

De acordo com o gigante do varejo, o novo modelo da Alibaba é capaz de lidar com problemas complexos e intrincados em comparação com os modelos de linguagem grandes (LLMs) normais, como ChatGPT-4 e Claude 3.5.

Um artigo da Benzinga indica que o QwQ-32B-Preview é um dos poucos disponíveis sob uma licença permissiva, permitindo aos usuários baixá-lo e usá-lo. O modelo agora está disponível na plataforma de desenvolvimento de IA Hugging Face.

No entanto, a Alibaba lançou certos componentes do modelo para limitar a replicação completa do modelo ou insights sobre seu funcionamento.

O mais recente modelo da Alibaba possui 32,5 mil milhões de parâmetros, o que lhe permite lidar com até 32.000 palavras. Com as significativas capacidades do modelo e a acessibilidade semi-aberta, o novo concorrente da Alibaba prepara o terreno para um salto transformador nas tecnologias de raciocínio de IA.

O anúncio transparente da Alibaba, que destaca a sofisticação do seu modelo, a OpenAI manteve os seus parâmetros em segredo.

A chegada deste modelo ocorre num momento em que a OpenAI está a fazer progressos significativos no setor de IA. Em outubro, a avaliação da OpenAI saltou para $157 mil milhões após uma bem-sucedida ronda de financiamento.

No início desta semana, a SoftBank Group SFTBF aumentou supostamente a sua participação no fabricante do ChatGPT através de um buyout de ações de funcionários de 1,5 bilhões de dólares.

A OpenAI também é dito estar a explorar o desenvolvimento do seu próprio navegador web para desafiar o navegador Google Chrome, subsidiária da Alphabet, após pressão vinda do Departamento de Justiça dos EUA para o alienar.

A Alibaba admite que o modelo também tem falhas

Embora possua algumas forças únicas, o novo modelo também tem limitações. De acordo com o grupo, o QwQ-32B-Preview tem problemas como trocas de idioma inesperadas, o que pode potencialmente confundir os utilizadores. O modelo também tem um desempenho inferior em tarefas que requerem raciocínio comum, o que é comum em muitos sistemas de IA.

Segundo o AutoGPT, o modelo pode ficar preso em loops lógicos, atrasando as respostas.

Apesar das suas falhas, as suas capacidades de raciocínio permitem-lhe verificar os factos por si próprio, reduzindo assim os erros, mas aumentando o tempo de resolução.

Ao raciocinar sobre tarefas e planear passos, o modelo da Alibaba evita algumas armadilhas que afetam a IA tradicional. Mas esta abordagem exige tempo extra, o que pode limitar a aplicação em tempo real.

De acordo com a Benzinga, as respostas do ‘QwQ-32B-Preview’ estão alinhadas com os padrões regulatórios chineses, evitando tópicos politicamente sensíveis.

Por exemplo, tópicos politicamente sensíveis como Taiwan darão respostas alinhadas com a posição do governo chinês.

Além disso, notícias sobre eventos como a Praça Tiananmen não geram respostas, mostrando o design cauteloso do modelo.

Embora isso possa ser ideal para o mercado chinês, também pode limitar seu apelo no mercado global. No entanto, o modelo é um passo significativo para o mundo da IA racional. Embora suas limitações possam reduzir seu apelo global, seus outros componentes, como lógica e natureza semi-aberta, o tornam um grande concorrente para o OpenAI.

De acordo com o AutoGPT, o QwQ-32B-Preview destaca o potencial e os desafios dessa emocionante fronteira, onde os laboratórios de IA em todo o mundo estão trabalhando para aprimorar a tecnologia de raciocínio.

De Zero a Pro em Web3: O Seu Plano de Lançamento de Carreira de 90 Dias

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
GateUser-a578b9cfvip
· 2024-11-29 23:43
Comprar na Baixa 🤑
Ver originalResponder0