アリババが音声言語モデル「Qwen-Audio」を発表
Pinwan氏によると、Arxivのページには、Alibabaが最近Qwen-Audioという音声言語モデルをリリースしたことが示されている。 このモデルは、音声言語の事前学習を拡張して、30以上のタスクと、人間の声、自然の音、音楽、歌などのさまざまな音声タイプをカバーすることで、普遍的な音声理解を実現するように設計されています。 調査によると、Qwen-Audioは、タスク固有の微調整を必要とせずに、幅広いベンチマークタスクで大幅なパフォーマンスを達成しています。