阿里开源全新架构Qwen3-Next,80B参数新模型只需激活3B即可实现旗舰性能。
9月12日,阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B ,包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和深度思考的推理(Thinking)模型 。
据介绍,相比Qwen3的MoE(混合专家)模型结构 ,Qwen3-Next进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制(简称MTP,Multiple-Token Prediction)。
在核心技术方面 ,新模型采用全球首创混合架构,75%用Gated DeltaNet(线性注意力),25%用原创Gated Attention(门控注意力) ,总参数80B只需激活3B,就可以在性能上媲美Qwen3旗舰版235B模型,算力利用率约为3.7% ,帮助用户“极致省钱”。
在训练成本方面,Qwen3-Next模型较今年4月发布的密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上 。新模型在Qwen3预训练数据的子集15T tokens上进行预训练,仅需Qwen3-32B所用GPU计算资源的9.3% ,便能训练出性能更好的Qwen3-Next-Base基座模型,大幅提升了训练效率。
阿里通义团队指出,高稀疏MoE架构是Qwen3-Next面向下一代模型的最新探索。当前 ,MoE是主流大模型都采用的架构,通过激活大参数中的小部分专家完成推理任务 。此前,Qwen3系列的MoE专家激活比约为1比16 ,而Qwen3-Next通过更精密的高稀疏MoE架构设计,实现了1比50的极致激活比,创下业界新高。
在性能表现方面 ,Qwen3-Next指令模型的性能表现与参数规模更大的Qwen3-235B-A22B-Instruct-2507持平,思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。
Qwen3-Next-80B-A3B-Instruct指令模型性能评测图 。来源:阿里通义
目前,新模型已在魔搭社区和HuggingFace开源 ,开发者也可通过Qwen Chat免费体验,或直接调用阿里云百炼平台提供的API服务。
关于Qwen3-Next模型值得注意的创新点,Pine AI联合创始人 、首席科学家李博杰对澎湃新闻记者表示,Qwen3-Next采用了混合注意力机制和高稀疏MoE架构 ,从而大幅提升效率;除了这两大创新点以外,Qwen3-Next还在预训练时采用了多Token预测技术MTP(Mutiple-Token Prediction),模型推理速度大幅提升。
李博杰表示 ,虽然以上三种技术创新在学界已有研究,但阿里证明了其在工业界的实用性,同时还保持了开源:“Qwen3-Next第一次证明了这些技术能够放在一起共同运作 ,并且能够在实际的业务场景中展现出很好的能力表现 。从评测结果和模型架构来看,Qwen3-Next已经达到了谷歌Geimini 2.5 flash的水平。”
近期,阿里通义动作频频 ,包括推出超万亿参数的Qwen3-Max-Preview、文生图及编辑模型Qwen-Image-edit、语音识别模型Qwen3-ASR-Flash等。全球AI开源社区HuggingFace的最新数据显示,通义千问Qwen衍生模型数已超17万,稳坐全球第一开源模型。
9月1日 ,国际权威市场调研机构沙利文(Frost&Sullivan)发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》,报告显示,中国企业级大模型调用呈爆发式增长 ,2025年上半年日均调用量较2024年底实现363%的增长,目前超10万亿Tokens 。其中,阿里通义占比17.7%位列第一 ,是中国企业选择最多的大模型。
(文章来源:澎湃新闻)
买股票在什么证券公司开户好:怎么用股票杠杆-中央最新审判工作意见发布:重点部署金融审判工作 依法严惩操纵市场等违法犯罪
炒股的杠杆是什么意思:三亚股票配资-中信建投:储能增长的核心逻辑是新能源渗透率提升和储能系统成本下降的共振
股票的杠杆:股票配资业务-9月9日港股收盘:恒指涨1.19% 阿里健康领涨成分股
财经:配资 股票-港股午后拉升,港股互联网ETF(159568)上涨2.23%,阿里健康、京东健康涨超5%
资深的配资知识网:股票网上配资-英国、法国、德国强推安理会恢复对伊制裁!伊朗声明:此举非法、不合理且挑衅 损害核不扩散机制
股票:资本项下外汇业务指引-任职回报跌近30%,太平基金灵活配置混合解聘杨行远
股票怎么算主力和散户:有杠杆的股票交易平台-阿里吴泳铭:积极推进3800亿的AI基础设施建设 并计划追加更大的投入
买股票开户证券开户哪家好:什么是炒股加杠杆融资-淘宝闪购低调上线“到店团购” 前有美团、后有抖音 阿里如何啃下这块硬骨头?
同创优配-同创优配官网-炒股配资门户提示:文章来自网络,不代表本站观点。
同创优配-同创优配官网-炒股配资门户㉖我们关注客户体验的细节,从细节处提升服务质量,为客户创造更好的投资体验。
6月27日,沪指盘中震荡下探,上证50指数跌逾1%,创业板指相对强势,场内近3400只股飘红。 行业板块涨多跌少,...
界面新闻记者|龙力随着上市公司年报的披露,私募2024年第四季度的“新宠”也陆续浮出水面。Wind数...
外交部发言人宣布: 8月18日至20日,中共中央政治局委员、外交部长、中印边界问题中方特别代表王毅将应邀访问印度并...
1—5月份,全国规模以上工业企业实现利润总额27204.3亿元,同比下降1.1%(按可比口径计算,详见附注二)。 ...
作者:ACE1.对于中国的互联网大亨来说,刚刚过去的2021年,是被载入史册的一年。只不过,载入...
界面新闻编辑|江怡曼近期,多家A股上市公司披露2024年度分红计划,其中不乏大额分红预案。4月10日...
关于调整碳酸锂期货LC2509合约交易限额的通知 广期所发〔2025〕243号 各会员单位: 根据《广州期货交...
记者辛圆猪价近期呈现疲弱态势。农业农村部监测数据显示,2月份全国猪肉价格连续4周下降。另据中国养猪网数...
界面新闻记者|张艺去年更名易主的海南华铁(603300.SH)站上了算力风口,算力服务业务爆发式增长。...
实习记者|章宇璠记者|张一诺2024年,巴菲特连续四年《福布斯》位居美国最慷慨的25位亿...
文丨财联社《中国好声音》母公司港股星空华文(06698.HK)股价午后一度跌近20%,截至发稿,该股跌1...
界面新闻记者|邹文榕政策引导叠加企业融资需求旺盛,界面新闻记者关注到,开年以来,产业债一级市场发行量较往年明...
界面新闻记者|张艺PCB(印制电路板)龙头胜宏科技(300476.SZ)近期上演业绩股价“戴维斯双击”。在A...
根据新股发行安排,今日有2只新股申购,新亚电缆(001382.SZ)发行价格为7.40元/股;矽电股份(301629.S...
界面新闻记者|陈靖杜萌3月6日,证监会主席吴清出席十四届全国人大三次会议经济主题记者会,并就相关问题回答中...