Microsoft open-source le modèle d'intégration de texte Harrier à trois niveaux, la version 27B, en tête du classement multilingue MTEB v2

BlockBeatNews

Selon la surveillance 1M AI News, Microsoft a publié en open source, sur Hugging Face, une famille de modèles d’embeddings de texte multilingues nommée harrier-oss-v1, comprenant trois gammes : 270M, 0,6B et 27B. La fiche du modèle indique que cette série utilise une architecture de type decoder-only, un last-token pooling et une normalisation L2 ; elle supporte jusqu’à 32768 tokens et peut être utilisée pour la recherche (retrieval), le clustering, la similarité sémantique, la classification, l’extraction bilingue et le réordonnancement (re-ranking).

Multilingual MTEB v2 est un benchmark d’embeddings de texte multilingues couramment utilisé dans l’industrie ; il teste principalement des tâches telles que la recherche, la classification, le clustering et la similarité sémantique. La fiche du modèle Microsoft indique que, sur ce benchmark, les scores des trois gammes sont respectivement de 66,5, 69,0 et 74,3, et que la version 27B a pris la première place le jour de sa publication. Les versions 270M et 0,6B utilisent également en plus un modèle d’embedding plus grand pour procéder à une distillation de connaissances ; les trois modèles sont publiés sous licence MIT.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire