财新传媒
财新传媒
1111111
财新通行证
T中

GPT革命|智源发布多种大模型 称900卡可训万亿语言大模型

文|财新 刘沛林
2024年06月14日 15:47
统一的多模态大模型、具身智能大模型和科学用AI结合起来才能形成世界大模型,最终通向AGI
news 原图 2024年6月14日,第六届“北京智源大会”在中关村展示中心开幕。图:智源研究院

  【财新网】由科技部、北京市支持的民营非营利机构智源研究院公布AI大模型最新进展。6月14日,智源研究院公布万亿参数的大语言模型进展,发布用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持8种芯片的智算操作系统。

  具体来看,此次公布的万亿参数大模型“Tele-FLM“是和中国电信联合研发,中国电信主要提供算力和部分数据。智源研究院院长王仲远称,该项目是在112台A800机器(即896块A800 GPU)上训练4个月得出的,已开源发布的520亿参数版本英文能力优于Llama2-70B,接近Llama3-70B的水平,而中文能力优于Llama3-70B和Qwen1.5-72B。

责任编辑:屈运栩 | 版面编辑:李东昊

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>