【财新网】清华系大模型创业公司智谱AI发布新版。1月16日,智谱AI在北京召开了首次面向开发者的技术开放日,其创始人、CEO张鹏在演讲中发布了新一代基座大模型GLM-4、文生图大模型CogView3、定制功能GLMs和模型应用商店等功能。
“GLM-4大模型性能相比上一代全面提升近60%,支持更长的文本、更强的多模态能力、更快的推理速度,从标准的大数据评测数据上看,整体水平已经接近GPT-4,”张鹏称。
智谱AI展示的评测结果显示,在考察多学科常识、数学能力等6个英文标准数据集测试中,GLM-4的测试得分平均为GPT-4的95%,其中在考察常识推理的HellaSwag测试中与GPT-4分数差距最大,为GPT-4得分的90%;而在考察模型代码能力的HumanEval测试中,GLM-4的得分为72分,甚至超过了GPT-4的67分。