3 月 6 日凌晨,阿里巴巴发布并开源全新的推理模子通义千问 QwQ-32B。通过大边界强化学习,千问 QwQ-32B 在数学、代码及通用才气上竣事质的飞跃,合座性能并列 DeepSeek-R1,同期,千问 QwQ-32B 还大幅裁汰了部署使用老本,在消费级显卡上也能竣事土产货部署。
当今,阿里已给与宽松的 Apache2.0 公约,将千问 QwQ-32B 模子向人人开源,统共东说念主都可免费下载及商用。同期,用户也将可通过通义 APP 免费体验最新的千问 QwQ-32B 模子。
据悉,千问 QwQ-32B 是阿里探索推理模子的最新恶果。在冷运行基础上,阿里通义团队针对数学和编程任务、通用才气分离进行了两轮大边界强化学习,在 32B 的模子尺寸上取得了令东说念主惊喜的推理才气普及,应证了大边界强化学习可显耀提高模子性能。
在一系列泰斗基准测试中,千问 QwQ-32B 模子阐发出色,险些皆备越过了 OpenAI-o1-mini,并列最强开源推理模子 DeepSeek-R1:在测试数学才气的 AIME24 评测集上,以及评估代码才气的 LiveCodeBench 中,千问 QwQ-32B 阐发与 DeepSeek-R1 特地,远胜于 o1-mini 及疏导尺寸的 R1 蒸馏模子;在由 Meta 首席科学家杨立昆领衔的"最难 LLMs 评测榜" LiveBench、谷歌等提议的领导撤职才气 IFEval 评测集、由加州大学伯克利分校等提议的评估准确调用函数或用具方面的 BFCL 测试中,千问 QwQ-32B 的得分均越过了 DeepSeek- R1。
千问 QwQ-32B 既能提供极强的推理才气,又能满足更低的资源豪侈需求,相配合适快速反应或对数据安全条款高的期骗场景,斥地者和企业不错在消费级硬件上简略将其部署到土产货成立中,进一步打造高度定制化的 AI 经管有蓄意。
此外,千问 QwQ-32B 模子中还集成了与智能体 Agent 掂量的才气,使其粗略在使用用具的同期进行批判性想考,并证据环境反馈调整推理经由。阿里通义团队默示,将来将接续探索将智能体与强化学习的集成,以竣事万古推理,探索更高智能进而最终竣事 AGI 的蓄意。
当今,千问 QwQ-32B 已在魔搭社区、HuggingFace 及 GitHub 等平台基于宽松的 Apache2.0 公约开源,统共东说念主都可免费下载模子进行土产货部署,或者通过阿里云百真金不怕火平台径直调用模子 API 干事。关于云霄部署需求,用户可通过阿里云 PAI 平台完成快速部署,并进行模子微调、评测和期骗搭建;或是遴荐容器干事 ACK 搭配阿里云 GPU 算力(如 GPU 云干事器、容器计较干事 ACS 等 ),竣事模子容器化部署和高效推理。
从 2023 年于今,阿里通义团队已开源 200 多款模子,包含诳言语模子千问 Qwen 及视觉生成模子万相 Wan 等两大基模系列,开源囊括文本生成模子、视觉默契 / 生成模子、语音默契 / 生成模子、文生图及视频模子等「全模态」,遮掩从 0.5B 到 110B 等参数「全尺寸」,规定派今,海表里 AI 开源社区中千问 Qwen 的繁衍模子数目冲破 10 万,越过好意思国 Llama 系列模子,成为人人最大的开源模子族群。(本文首发于钛媒体 APP,作家 | 张帅,裁剪 | 盖虹达)