千问诞生后,负责人吴嘉首次回应15个关键问题
文|邓咏仪 编辑|苏建勋 1月15日,阿里西溪总部园区内,人山人海。 DeepSeek时刻一年之后,大模型的风向已然改变。数日前,智谱创始人唐杰在和Qwen技术负责人林俊旸、腾讯姚顺雨等同台论道时就明确表示:在DeepSeek之后,Chat的战争已经结束,接下来是Agent的战争。 阿里就在打这场明牌的仗。 2025年11月,千问上线之初,阿里就曾对外描绘过这个图景:一个AI助手,接入淘宝、高德、
文|邓咏仪 编辑|苏建勋 1月15日,阿里西溪总部园区内,人山人海。 DeepSeek时刻一年之后,大模型的风向已然改变。数日前,智谱创始人唐杰在和Qwen技术负责人林俊旸、腾讯姚顺雨等同台论道时就明确表示:在DeepSeek之后,Chat的战争已经结束,接下来是Agent的战争。 阿里就在打这场明牌的仗。 2025年11月,千问上线之初,阿里就曾对外描绘过这个图景:一个AI助手,接入淘宝、高德、闪购、支付宝等产品,从Chat发展到真正可用的工具,完成更高难度的任务。 急行军中的阿里,如今急需一场新战场的胜利。 千问是继淘宝闪购、高德扫街榜之后,阿里集团层面的又一次大规模协同作战。在发布会前,阿里就已经展开了声势颇大的宣传阵势:射灯把千问的巨大Logo,投影到杭州西溪园区的总部大楼上。 阿里提前官宣了千问的成绩单:两个月,千问C端产品月活破亿。 千问的新版本6.0,可以说是一次“山洪爆发式”的更新:一口气接入了闪购、淘宝、飞猪、支付宝等产品,上新了超过400项新功能。 如今,通用AI助手已然成为大厂的游戏——元宝凭借DeepSeek一飞冲天,发力足够早的字节豆包,如今在市场一骑绝尘,日活已经稳定破亿。 在阿里切换AI To C抓手的当口,阿里集团副总裁、千问C端事业群总裁吴嘉,第一次明确了“夸克”和“千问”的定位:夸克是AI浏览器,是AI搜索;千问是AI助理,他更像是一个人。 “对话框会演变,AI浏览器、AI搜索也不会消失,无论是夸克还是千问,只是面对用户不同的服务界面。”他解释,如今的AI助手市场仍处在相当早期,DAU数字上是8000万还是1亿,差别不大。 千问团队也向我们表示:“我们C端月活跃用户增长超过了我们的预期,大家都很关心千问到底投入了多少钱,其实,千问花的钱远比竞��对手要少。” 对千问而言,再复刻可爱、亲民、走陪伴路线的助手,已经不是最优解。千问选择的是另一条路:连接阿里庞大的线下生态,可以购物、办事。而且,还要做得足够专业。 目前,Agent功能需要通过千问端内的“任务助理”按钮调用,仍采取邀请制,此后将会陆续全量上线。 在授权支付宝、飞猪、高德等权限后,点击任务助理,就能开始给Agent派任务: 比如,想要一杯奶茶,确认需求后千问能直接下单(在你确认支付动作后,送到指定地点)。《智能涌现》体验了数个场景,千问已经做得足够丝滑,平均一个任务在1-2分钟内就可以给出结果。但依然有不稳定,卡顿等情况,不少时候需要人类接管。 △来源:千问 千问的另一大主打场景是办公、教育、政务等场景,着重在提效上。 比如,面对近百张格式不一的电子发票,只需一句”帮我生成年度报销台账”,千问就能自动识别关键信息,生成结构清晰的表格; △来源:千问 《智能涌现》体感上觉得最爽的功能,是一键办护照:用户不需要在不同部门网站间奔波,只需和千问说一句”杭州户口怎么办护照”,千问就可以连接支付宝,完成政策解读、材料清单梳理,并直接跳转到办理入口。 △来源:千问 千问如今的探索,也走在前所未有的一条路上。 在海外,无论是谷歌的Gemini、OpenAI的ChatGPT,还是Anthropic的Claude,这些模型巨头都没有购物、支付、出行等线下业务。它们的做法是和亚马逊、Paypal、Uber等厂商打通接口,直接调用服务。 相较之下,国内的移动互联网生态更加独立,也更加封闭。阿里、腾讯、字节等巨头体系内都有丰富多元的业务,而阿里手持的王牌在于:电商、闪购、地图、支付——这些高频刚需场景,全在自己手里。 但再造一个AI To C入口,对体系庞杂的阿里来说,难解之处在于:要在技术快速变化之际,理顺各个业务间的关系、资源,集中资源办大事。 换句话说,AI通用助手之争,已经远不止卷产品和技术本身,而是在考量谁能把巨头的庞大业态、资源和能力,真正塞进一个AI助手里。 一位接近阿里高层的人士对《智能涌现》表示:如果谁能把AI To C这场仗打赢、打好,这会是记入阿里历史的一次关键功绩。 关于千问上线这60天都做了什么,未来发展有什么计划,包括《智能涌现》等媒体在会后和千问C端事业群总裁吴嘉进行了交流。 以下为吴嘉的的主要观点,为阅读友好,《智能涌现》编辑、整理成了15个核心问题: 谈产品 1.现在千问的发展主线是什么? 吴嘉:我们现在还是围绕提升模型的智力水平来做,也就是思考、执行能力,以及接入阿里生态这两条主线。 今天发布的是千问6.0的第一个版本。未来半年内,我们会继续接入阿里丰富的生态,扩展办事能力的边界。 大家现在也知道,在生活场景,做到人人满意还是有难度的。相比之下,办公和学习场景的标准一致性会好一些,比如K12教育、大学教育、数字化办公等。 这三部分结合起来,把生活场景做好,绝对是全球领先的产品。 2.做AI助手,在产品哲学上会有冲突吗?怎么在大模型生成答案和精准推理、完成任务之间,找到平衡点? 吴嘉:我们有一个理念叫“恰当”。我认为AI不应该等同于极简,这是我们的哲学。 就像传统互联网产品,比如做搜索,希望搜索次数多,但次数多不代表满意;做信息流,可能我们希望刷新次数更多。 但到了AI时代,所有目标都会变成找最快、最便捷、最直接的路径吗?其实不太对。 尤其是办公场景里,有些任务是长链路的。比如我写一份调研报告,不是想让AI给我写个初稿,而是希望AI和我共同完成。 我们肯定要给AI主动提供信息。我跟AI说,这三个合不合适,AI看到后说“对,这是你要的”,但你可能又会说“能不能帮我改改?”沟通了很多轮,但没有解决问题。 生活场景也是这样,AI和人的沟通必不可少,不能说我跟AI定好以后就不用理了。 现阶段的智能,更多体现在提升效率,但更高阶的智能,不一定就是完全追求效率,我们最终还是得交付。 AI关键在于智能,不是单纯效果。AI应该像人一样思考,提供相对恰当的方案。 我们没刻意追求人均对话轮次越多越好,最看重的是用户需求的满意度和交付率。 AI时代的宽容度远远超过传统时代。传统时代的接口必须严丝合缝,错了就不行,调用不了。 现在AI没有那么死板,没这个东西也没关系。但肯定得让淘宝平台和千问做一些平台间的对接,这非常重要。 同样,我们也不需要专门给AI做交互界面,因为AI能看懂人看的界面,有行动力,这才是关键。 3.千问怎么衡量做什么,和不做什么? 吴嘉:AI目前还不是万能的,我们今天还是做高频刚需的需求,这是很重要的。 我们今天在中国市场处于领先位置。所以在选择上,我们没有说哪个都不做。 大家的视角,还是聚焦在做AI产品和传统产品之间的区别。以前做传统产品,可能一个东西拆成几十个项目,比如满意度多少、功能多少。 现在不一样了。模型能力已经在那了,90%的场景可能都能达到80%的满意度。那我们花70%的精力,是花在提升token能力、执行力、规划能力上。 我们很重要的一点,是从高频刚需场景出发,结合模型能力和阿里巴巴生态,抽象用户需求。第一阶段,我们看到的是生态的厚度、广度和影响力都很好。 我们现在是三条线并行推进。第一条是长期主线,就是模型和Agent。 从用户需求角度来看,我们会把市面上所有产品对这类需求的满意度作为基准,然后结合这三条线,分层次来理解。 每个季度,我们会有一个模型大版本,这个版本我们会跟通义实验室一起来做,这是非常重要的。 基于此,我们的Agent能力也会提升,需要做一些后训练(Post-training)来进行提升,这是第二条线。 第三条是产品线。整体来看,我们今天还是技术数据加生态驱动的模式,而不是一个bad case fix(修bug)的迭代模式,因为现在还在处在AI能力增长的快速阶段。 举个例子,比如我们下一个版本的生活助理,重点会放在个性化上。但把这个需求翻译下,它会涉及到模型能力的问题。 所以,我们不会说下一个版本,就是把点外卖做得特别好——我们肯定会做,但会先把能够抽象出来的能力先做好。 另外,还有一些体验性的功能,比如大家有提到的,能不能把取件码也显示在订单上?这些开放性功能我们也会做。 4.现在千问的商品推荐里,有商业化的考量吗? 吴嘉:我们现在还没有商业化,基本上是在价格最优、送达时间最快等因素来综合考量。 我们目前没有任何商业客户。未来,我们会在用户授权的情况下,把用户的context带过来,给用户同时推几个方案,大家可以切换。这个过程还需要一段时间,让模型知道你的偏好。 在中国的很多生活场景里,很多人都会有这种感觉,AI肯定会走向推荐,但不能只局限于这一块。AI代替传统推荐算法的机会还是很大的。 5.之前,阿里主推的AI To C入口是夸克,现在是千问。现在还是有不少用户会有困惑感,你怎么解释千问和夸克的区别? 吴嘉:夸克是AI浏览器,是AI搜索;千问是AI助理,他更像是一个人。 对话框会演变,AI浏览器、AI搜索的需求也不会消失,无论是夸克还是千问,只是面对用户不同的服务界面。 这也是一个用户习惯的问题,不存在说,AI浏览器的用户就会放弃千问。现在我们看到的是,PC端用户其实是一半一半,一半人喜欢用千问,另一半喜欢在浏览器里打开夸克。 这里面的共同点是,所有的AI功能都是千问提供的能力,我觉得没必要纠结。 谈协作 6.各个事业群之间资源怎么分配?昨天我试了用千问点外卖,看到有红包补贴,补贴是千问自己出的吗?如果成交,你们和其他业务怎么分账? 吴嘉:补贴我们会和其他业务一起出,同时也要看看用户的一些反馈。 至于怎么分账,我们现在没算得那么清楚。现在第一目标是体验好,让用户用起来。 7.怎么评估千问对现有零售或电商业务的影响?一旦用户通过千问完成订单,可能就不会打开闪购、打开淘宝。不打开的话,怎么卖广告? 吴嘉:我们会有共同的业务目标。我们现在还没看到打开千问就不打开淘宝的情况,这个数据我还没完全确认。 千问做得越大,我们创造的生活服务增量就越多。未来AI会带来大量新的生活服务,绝对不只是存量。 因为方便、门槛低,习惯会带来增量。比如,也���能排除有一部分人,未来会习惯在我这里点外卖,但他也会在传统平台点啊。 8.千问App对模型能力的需求、目标,和基模团队是一样的吗? 有观点认为,模型越聪明不代表办事能力越强,很多场景其实需要不同层次的智力。比如天气这种场景,可能就不需要太高的模型智力。 吴嘉:我们的模型需求,是基模团队迭代目标的一个子集。因为千问模型团队,服务的是整个阿里巴巴生态里的B端客户。 当然,对于一些应用侧的需求,我们也会对模型做一些后训练,但这些也是基于千问的基模之上。基本上,我们会把三个月内看到的一些需求提出来,和基模团队同步。 9.在做通用AI助手这件事上,提升模型能力,还是努力做工程上的优化,从哪个方向去发力,效率会更高? 吴嘉:关键的前提是,模型要够聪明,它需要知道什么问题需要简单推理,什么问题要复杂处理。 其实我们没有那么多模型。现在模型数量减少后,首先解决了你说的两个问题,我们和模型的迭代进程也更清晰了。 现在网上很多人都在讨论这个话题:给模型更多数据会不会更好,还是提升模型能力更重要?还有说C端其实不需要那么高的智能的。 但在我看来,中国的AI产品已经过了那个阶段。不是说智力低的地方,就用小尺寸的大模型,智力高的地方,就用尺寸大的模型。 现在,数据变得特别重要,尤其是在生活场景里。因为模型训练是某个时间点的网络快照,而中国的数据供给有限且变化快,时效性的问题就很突出。 但能力的核心构建,长期来看肯定还是依赖模型能力的发展。 从效率来评估,放眼一年两年,模型提升绝对还是最关键的。如果短期的效率、迭代效率和功能实现上,可能后训练会更明显一些,提供的价值也会更突出。 10.千问C端事业群,怎么和阿里各个事业群如何对接、协同资源? 吴嘉:在AI时代,其实我们不会专门为了接某一个服务做特别多独立的事情。 各个事业群只要把自己的工具能力,在千问里对接下就行了。 在这个过程中,我们会需要功能上调试。现在我们的做法是,跟集团所有二方(各个事业群)组成一个共同的虚拟团队,来完成这件事。 现在我们还在开发阶段,技术上的工作确实还占70%,因为要把产品做出来。但从今天开始,大家点