T中

GPT革命｜阿里云发布新一代开源模型称能力超过Llama3

文｜财新刘沛林

2024年06月07日 17:25

阿里云称，目前还在训练更大参数的模型，下一步还将发展多模型、多模态的能力

原图过去一年，阿里云是国内开源模型最积极的推动者。图：视觉中国

　　【财新网】阿里开源大模型再迭代。6月7日，阿里云在开源社区上线了Qwen2系列模型，包含5亿、15亿、70亿、570亿、720亿，五个参数版本的模型，其中Qwen2-72B模型在多个测评榜单的成绩超过了Meta 4月发布的Llama3-70B模型，Qwen2-57B则为阿里云第二款混合专家模型（MoE），MoE架构在相同算力资源下性能更强，被认为是大模型技术趋势。

　　阿里云提供的数据显示，在考察常识能力、逻辑推理、数学能力的多个测评榜单中，Llama3-70B、法国大模型公司Mistral AI旗下的Mixtral-8x22B、阿里云2月发布的Qwen1.5-110B此前位于第一梯队，榜单得分各有胜负，此次发布的Qwen2-72B得分则全面领先上述三款模型。

责任编辑：屈运栩 | 版面编辑：刘春辉

GPT革命｜阿里云发布新一代开源模型 称能力超过Llama3

GPT革命｜阿里云发布新一代开源模型称能力超过Llama3