【财新网】继4月发布对标ChatGPT的大模型“通义千问”之后,阿里再次发布融合大模型能力的新产品。6月1日,阿里云在广州举办峰会,宣布聚焦音视频内容的“通义听悟”正式上线,并对外开放公测。
阿里称,该产品有两大功能,一是通过语音识别模型,对音频进行速记转写,方便检索,二是通过接入通义千问大模型的理解与摘要能力,可以整理转写的内容,快速总结全文及每个发言人观点,整理关注重点和待办事项。阿里云CTO(首席技术官)周靖人称,这款产品瞄准的是音视频内容场景,比如开会、上课、访谈、培训、面试、看视频、听播客等。