A Microsoft lança código aberto para o modelo de incorporação de texto Harrier de três camadas, versão 27B, alcançando o topo da tabela multilíngue MTEB v2

BlockBeatNews

De acordo com o monitorização da 1M AI News, a Microsoft disponibilizou em código aberto no Hugging Face a família de modelos de embeddings de texto multilingues harrier-oss-v1, que inclui três variantes: 270M, 0.6B e 27B. O cartão do modelo mostra que esta série utiliza uma arquitetura apenas com decoder-only, last-token pooling e normalização L2, suportando no máximo 32768 tokens, podendo ser usada para pesquisa (retrieval), agrupamento (clustering), similaridade semântica, classificação, mineração bilingue e reordenação.

Multilingual MTEB v2 é o benchmark de embeddings de texto multilingues mais usado na indústria, cobrindo principalmente tarefas como pesquisa, classificação, agrupamento e similaridade semântica. O cartão do modelo da Microsoft afirma que as pontuações das três variantes neste benchmark são 66.5, 69.0 e 74.3, respetivamente, e que a variante de 27B subiu para o primeiro lugar no dia do lançamento. As versões de 270M e 0.6B também usam, adicionalmente, modelos de embeddings maiores para fazer destilação de conhecimento; os três modelos foram publicados sob a licença MIT.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários