财新传媒
财新传媒
1111111
财新通行证
T中

GPT革命|阿里云发布新一代开源模型 称能力超过Llama3

文|财新 刘沛林
2024年06月07日 17:25
阿里云称,目前还在训练更大参数的模型,下一步还将发展多模型、多模态的能力
news 原图 过去一年,阿里云是国内开源模型最积极的推动者。图:视觉中国

  【财新网】阿里开源大模型再迭代。6月7日,阿里云在开源社区上线了Qwen2系列模型,包含5亿、15亿、70亿、570亿、720亿,五个参数版本的模型,其中Qwen2-72B模型在多个测评榜单的成绩超过了Meta 4月发布的Llama3-70B模型,Qwen2-57B则为阿里云第二款混合专家模型(MoE),MoE架构在相同算力资源下性能更强,被认为是大模型技术趋势。

  阿里云提供的数据显示,在考察常识能力、逻辑推理、数学能力的多个测评榜单中,Llama3-70B、法国大模型公司Mistral AI旗下的Mixtral-8x22B、阿里云2月发布的Qwen1.5-110B此前位于第一梯队,榜单得分各有胜负,此次发布的Qwen2-72B得分则全面领先上述三款模型。

责任编辑:屈运栩 | 版面编辑:刘春辉

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>