Alibaba Qianwen Modèle Multimodal Complet Qwen3.5-Omni lancé

DeepFlowTech · 2026-03-30T13:49:22+00:00

Alibaba Qianwen a publié le modèle multimodal complet Qwen3.5-Omni, prenant en charge un contexte long de 256k et plus de 10 heures d'entrée audio, démontrant d'excellentes capacités de perception et de génération multimodales, renforçant les fonctionnalités multilingues, supportant 113 langues de reconnaissance vocale et 36 langues de synthèse vocale.

DeepFlowTech

2026-03-30 13:49:22

Création du résumé en cours

Message de Deep Tide TechFlow, le 30 mars, d’après les données de Jin10, Alibaba Qianwen a annoncé le lancement du modèle grand tout-modal Qwen3.5-Omni. La série Qwen3.5-Omni comprend des versions Instruct de trois tailles : Plus, Flash et Light, et prend en charge un contexte long allant jusqu’à 256k. Le modèle prend en charge une entrée audio de plus de 10 heures et une entrée vidéo et audio 720P (1FPS) de plus de 400 secondes. Le modèle a été préentraîné en mode natif multmodal sur de très grandes quantités de données textuelles, visuelles et audio-vidéo dépassant 100 millions d’heures, et il montre des capacités remarquables de perception et de génération en tout modal. Par rapport à Qwen3-Omni, les capacités multilingues de Qwen3.5-Omni ont été considérablement renforcées : le modèle peut prendre en charge la reconnaissance vocale dans 113 langues et dialectes, ainsi que la génération vocale dans 36 langues et dialectes.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.