财新传媒
财新传媒
1111111
财新通行证
T中

GPT周报|零一万物回应“抄袭”;英伟达新AI芯片2024年上市;微软自研AI芯片亮相

2023年11月17日 18:43
推荐:Sam Altman投资公司发布可穿戴AI硬件;WPS AI开启公测;比尔·盖茨称AI将彻底改变如何使用电脑
news 原图 近日,Hugging Face开发者质疑李开复旗下 AI企业零一万物开源大模型抄袭了Meta的LLaMA架构,只对两个张量名称进行修改。图:财新

  【财新网】

  零一万物回应“抄袭” 发布Yi-34B训练过程说明

  11月15日,零一万物对其大模型Yi-34B训练过程进行说明,称训练模型过程中沿用了GPT/LLaMA的基本架构,且基本上国际主流大模型都是基于Transformer的架构,大模型持续发展与寻求突破口的核心点不仅在于架构,而是在于训练得到的参数。近日,Hugging Face开发者质疑李开复旗下 AI企业零一万物开源大模型抄袭了Meta的LLaMA架构,只对两个张量名称进行修改。零一万物开源团队总监Richard Lin称,在大量训练实验过程中,由于实验执行需求对代码做了更名,将尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。

责任编辑:张而弛 | 版面编辑:王影

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>