首页 > 实时讯息 >

今天凌晨,阿里重磅发布!

0次浏览     发布时间:2025-03-06 17:01:00    

3月6日凌晨3点,

阿里通义千问大模型团队宣布,

正式推出最新的推理模型

QwQ-32B。


据通义千问大模型团队介绍,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。


值得注意的是,尽管DeepSeek-R1拥有6710亿的巨型参数量,但由于DeepSeek创新性地使用了MoE(混合专家模型)架构以及MLA(多头潜在注意力机制)的方法,每次推理仅激活370亿参数(占总量的5.5%)。这使得DeepSeek-R1虽然整体很大,但实际干活时只需要动用一小部分力量,能够做到节省资源,高效完成任务。


在数学推理、编程能力和通用能力的一系列基准测试中,通义千问大模型团队将QwQ-32B与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较,结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。



业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。


此外,QwQ-32B的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。


目前,阿里已采用宽松的Apache2.0协议,将QwQ-32B模型向全球开源,所有人都可免费下载及商用,也可以通过阿里云百炼平台直接调用模型API服务。同时,用户也可通过通义App免费体验最新的QwQ-32B模型。


来源 证券时报、界面新闻 编辑‬H

相关文章