阿里通义开源音频语言模型Qwen2-Audio 相关论文入选顶会ACL 2024

2024-08-13 11:41:38 来源：

格隆汇8月13日｜据36氪，阿里通义大模型继续开源，Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入，直接进行语音问答，理解并分析用户输入的音频信号，包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准，相关论文已入选本周正在举办的国际顶会ACL2024。

文章转载自：互联网，非本站原创