财新传媒
财新传媒
1111111
财新通行证
T中

阿里发布新一代开源模型Qwen3 部署门槛大幅降低

文|财新 刘沛林
2025年04月29日 08:47
阿里巴巴称,新模型相较于DeepSeek-R1部署成本降低了65-75%
news 原图 4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3。图:视觉中国

  【财新网】开源大模型竞赛持续。4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3,阿里巴巴称新模型总参数量仅为DeepSeek-R1的三分之一,部署门槛大幅降低,同时其性能优于DeepSeek-R1。用户可以通过阿里云的企业平台或通义App直接体验该模型,夸克也将接入Qwen3。

  Qwen3的旗舰模型采用混合专家(MoE)架构,从36T的数据量上训练而来,总参数量为235B,激活参数量为22B。作为对照,同样采用MoE架构的DeepSeek-V3在14.8T的数量上训练而来,总参数量为671B,激活参数量为37B。

责任编辑:屈运栩 | 版面编辑:王影

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读

美俄元首会晤近3小时 气氛积极但未达成协议

香港高才通近半数放弃续签 成功续签者仅三分之二长住香港

任职华夏基金研究员期间被认定“老鼠仓” 冤是不冤

长图梳理“董小姐”事件和她的贵人们

【商圈】赌诈大佬佘智江的逃犯人生

财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>