Alibaba Qianwen Modèle Multimodal Complet Qwen3.5-Omni lancé

robot
Création du résumé en cours

Message de Deep Tide TechFlow, le 30 mars, d’après les données de Jin10, Alibaba Qianwen a annoncé le lancement du modèle grand tout-modal Qwen3.5-Omni. La série Qwen3.5-Omni comprend des versions Instruct de trois tailles : Plus, Flash et Light, et prend en charge un contexte long allant jusqu’à 256k. Le modèle prend en charge une entrée audio de plus de 10 heures et une entrée vidéo et audio 720P (1FPS) de plus de 400 secondes. Le modèle a été préentraîné en mode natif multmodal sur de très grandes quantités de données textuelles, visuelles et audio-vidéo dépassant 100 millions d’heures, et il montre des capacités remarquables de perception et de génération en tout modal. Par rapport à Qwen3-Omni, les capacités multilingues de Qwen3.5-Omni ont été considérablement renforcées : le modèle peut prendre en charge la reconnaissance vocale dans 113 langues et dialectes, ainsi que la génération vocale dans 36 langues et dialectes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler