财新传媒
财新传媒
1111111
财新通行证
T中

GPT革命|智谱AI张鹏:500一600亿参数是大模型的门槛

文|财新 刘沛林
2023年04月04日 16:03
张鹏认为,AI2.0解决了人工智能通用性的问题,场景割裂的中、小模型意义不大
news 原图 资料图:智谱AI创始人、CEO张鹏。

  【财新网】“如果不具备泛用性,尽管模型比以前大一点、效果好一点,应用场景仍然是割裂的,这些中小模型和原来有什么区别?” 主攻预训练大模型的智谱AI创始人、CEO张鹏近日接受财新专访时指出,他认为这一轮AI热潮建立在大模型的泛化能力上,业界普遍的认识是500一600亿参数是大模型智能涌现的门槛。

  张鹏指出,尽管适用于单场景的模型需要参数量、成本相对较低,但一旦应用于新行业所有训练数据需要重新来过,泛化能力低。他认为,大模型参数降下来很容易,同时还能保持很强的能力,但一个中模型、小模型提升则很困难。“像之前CV(计算机视觉)那些模型只做人脸识别,给一个宠物照片就傻了,大模型可以往下降维,但小模型没法往上升维,”他说。

责任编辑:屈运栩 | 版面编辑:边放

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>