![]()
阿里正式发布千问最强AI(人工智能)模型。
1月26日晚间,阿里正式发布预告已久的千问旗舰推理模型Qwen3-Max-Thinking。据介绍,该模型创下数项权威评测全球新纪录,性能媲美GPT-5.2、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型。通义团队还为其引入了两项核心创新:自适应工具调用能力和测试时扩展技术(Test-Time Scaling)。
从参数来看,千问新模型总参数超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。该模型进行了更大规模的强化学习后训练,并通过推理技术的系列创新,最终完成模型性能的大幅飞跃。
此前,预览版Qwen3-Max-Thinking已斩获数学推理AIME 25和HMMT 25的国内首个双满分。在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。
在多项关键性能基准测试中,千问表现超过了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型,刷新科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试的全球纪录。
![]()
千问在多项关键性能基准测试中的表现。
据介绍,在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展机制。业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。
此外,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练。模型能够自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供和专业人士一样水平的回答。同时,模型幻觉也大为降低。
目前,普通用户可以通过千问PC端和网页端试用模型,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务。据了解,千问APP也即将接入新模型,所有用户都可免费体验。
阿里Qwen大模型的研发始于2022年,已经成为全球排名第一的开源大模型。大模型Qwen3-Max发布于2025年9月,是通义千问家族中最大、最强的基础模型。
26日当天,阿里巴巴美股(NYSE:BABA)跌1.07%收于每股171.38美元,总市值4091亿美元;港股(9988.HK)27日盘前涨超2%。
8月末的成都,一场大雨将连续多日的暑气一扫而空。然而,在麓客岛这个以松弛感、年轻化著称的开放社区里,火热氛围依旧在延续,潘长江、大冰、安万等近千位来自快手平台的创作者齐...
2 张朝阳现身颐和园游泳训练 备战汕头南澳岛横渡挑战9月2日消息,昨日,搜狐创始人、董事局主席兼首席执行官张朝阳现身北京颐和园,完成了当日的游泳训练,为9月14日横渡广东汕头南澳岛积极备战。尽管当天颐和园外河道水流较急,张朝阳...
3 那些自愿把脸卖给AI的人,已经后悔了在不知情的情况下,你的脸出现在色情网站,又或者被人拿去搞诈骗,可能你下一秒就要报警了。但如果,有人主动找上门来,说要花一笔钱买你这张脸呢?Scott是一名外国的十八线小演员,最近...
4 初探苹果 iOS 26 电池设置,全面提升 iPhone 续航和耗电透明度9 月 6 日消息,科技媒体 MacRumors 昨日(9 月 5 日)发布博文,报道称在 iOS 26 系统中,苹果推出 5 项关键的电池优化功能,全面提升 iPhone 的续航表现与用电管理透明度。电池设置...
5 安卓桌面Nova Launcher创始人Kevin Barry离职,开源计划后路不明9 月 8 日消息,据科技媒体 Android Authority 今天报道,安卓第三方桌面 Nova Launcher 创始人兼原始开发者 Kevin Barry 上周末(9 月 6 日)宣布,他已经离开 Branch 公司,不再参与...
6 “刚买的iPhone 16 Pro成绝版?”苹果客服回应北京时间10日凌晨的新品发布会上,苹果公司推出了iPhone 17、iPhone 17 Pro以及iPhone Air等新品,定价 5999元~17999元不等。10日上午,“苹果官网下架iPhone16Pro系列&rdqu...
7 苹果 AirPods 实时翻译功能首发未覆盖欧盟 iPhone 用户9 月 12 日消息,科技媒体 MacRumors 昨日(9 月 11 日)发布博文,报道称苹果计划于 9 月 15 日发布的 iOS 26 稳定版中,为 AirPods 系列耳机推出实时翻译(Live Translation)功能,但首...
8 百度发布新一代文字识别 AI 模型 PP-OCRv5,仅 0.07B9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。百度介绍称,PP-OCRv5 是一个为缓解大型视觉语言模型(VLMs)局限性而设计的专用 OCR...
9 AI投资,走到哪了?AI赛道,从不缺少追梦人。多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰...
10 首个接受同行评审的大语言模型!DeepSeek-R1论文登《自然》封面9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: In...
备案号:琼ICP备20001864号-1 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有