阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

总裁现场喊话AI点40杯奶茶,然后骑手送到了!阿里千问这次玩真的。

1月15日,千问App上线超400项AI办事功能,成为全球首个能完成真实生活复杂任务的AI助手。千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票AI购物功能,并向所有用户开放测试。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

同时,千问App“任务助理”开启邀测,包括移动端和网页端两个版本,覆盖报表制作、查资料做报告、信息可视化、做工具网页、旅游路线规划、教育板书讲解等众多典型应用场景。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

阿里巴巴副总裁、阿里千问C端事业群总裁吴嘉提到,千问App上线两个月以来,C端月度活跃用户已突破1亿。他说,现在这只是千问App办事的第一个版本,未来大家可能只需要下载千问一个App,而不像传统互联网时代,需要在多个App中频繁切换

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

在发布会上,吴嘉现场演示了用千问App点“第一杯奶茶”。他给千问App下达一句话指令:“帮我点40杯霸王茶姬的伯牙绝弦”,千问App迅速调用淘宝闪购下单,无需任何跳转即在端内完成AI支付。不久后,淘宝闪购骑手就将奶茶送达现场。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

01 .阿里吴嘉:三大底层能力突破驱动千问现实“办事”能力升级

吴嘉称,千问App上线办事能力,这不仅是在线上数字世界帮大家办事,更是要进入物理世界,在生活环境中帮人们办事,形成AI办事的完整形态。

在数字世界,AI将从副驾驶走向主驾驶。千问App主要依赖三大能力:全模态理解AI Coding超长上下文工程。千问大模型Coding能力的大幅提升,使其能实时构建工具;全模态理解能力的突破,让千问能够看懂界面听懂声音同时读懂图文报表;最后是超长上下文的处理能力大幅提升复杂上下文的交付上限。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问App“任务助理”即日起开启邀测,将在不久后全面开放。吴嘉称,千问App“任务助理”几乎可以处理数字世界的任何事务,覆盖报表制作、查资料做报告、信息可视化、做工具网页、旅游路线规划、教育板书讲解等众多典型场景。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

在真实生活场景,模型需要深度理解真实世界生活需求,并且具备从消费到交易的全链路能力,对此阿里提供丰富的商品和服务供给,并且具备海量的真实反馈和交易。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问App宣布全面接入阿里生态场景,包括淘宝、支付宝、淘宝闪购、飞猪、高德、1688、盒马、优酷、大麦娱乐、阿里健康、菜鸟生态业务组,点外卖、买东西、订机票、订酒店等AI购物功能开放测试。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

吴嘉称:“千问是第一个真正能帮你办事的AI,我们的独特优势在于‘Qwen最强模型’与‘阿里最丰富生态’的结合,AI办事时代才刚刚开始。”

02 .现场演示千问生活办事:一句话点奶茶、AI电话订餐馆、50项政务民生服务

一句话点奶茶背后,是千问与淘宝闪购、支付宝原生AI支付能力“AI付”的系统级打通。

用户只要在聊天框里说一句“帮我点两杯拿铁”,千问就能调用淘宝闪购的服务能力,精准定位、推荐合适的商家、生成订单,并通过内置的“支付宝AI付”功能一键付款,实现“说一句,就送到”。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

当需求更复杂时,比如团建时不同人想喝不同的奶茶,千问App可以给出1-3套的可选方案,在多店下单。除了一句话点奶茶,千问App还支持“打电话订奶茶”、“打电话订餐”。千问AI助手会给商家打电话,声音几乎与真人无异,能够和商家通过对话方式订好餐,问清楚各种情况。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问团队提到,过去两个月,用户在千问上主动询问商品推荐次数,月环比增长300%。从这一需求出发,千问联合淘宝推出“一句话购物”能力。接入淘宝后,千问App可以真正帮助用户解决“买什么、怎么选、值不值得买”的难题。千问App不仅能根据用户的真实需求给出购物建议,更能基于淘宝庞大的商品数据库和评价体系,智能生成具体的商品推荐方案。用户只需一个指令,即可在千问App完成从消费决策到交易的闭环。比如当用户输入为父母购买一台扫地机器人,千问能够深入理解到“家里有猫”等条件涉及的精细需求,推理出“防缠绕”、“高温杀菌”等隐含刚需,从而推荐几款更适合用户的扫地机器人。当用户点击进去,就可以看到商品详情并完成下单,省去了用户查攻略的繁琐。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

一个用户在春节期间要规划旅游计划,他可以在千问App中完成查询、订票等一系列操作。千问会根据用户的具体情况,推荐多套出行方案。这体现了强大的跨应用协同能力。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

▲用千问在对话中订机票

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

▲用千问在对话中订酒店

吴嘉谈道,对于消费场景,互联网上的营销信息繁杂、噪音巨大。如何训练模型的理解分辨能力很关键。千问App不仅仅依靠世界知识,更能利用阿里巴巴独特的交易和服务数据来增强模型,从而保障AI购物功能保持客观和准确

对于更广泛的生活服务,千问App接入支付宝政务服务,上线签证、户口、公积金等50项民生服务。用户不再需要像过去那样在不同部门网站间奔波,只需一句“杭州户口怎么办护照”,千问即可完成政策解读、材料清单梳理,并直达办理入口。

03 .现场演示千问任务助理:做程序、制表格、搜资料、做汇报

即日起,千问 “任务助理”功能在App和Web端开始定向邀测。该功能具备类人化的多步骤规划能力,覆盖应用开发、Office办公、咨询调研及生活办事等核心场景,支持一键处理报表整理、研报撰写及小工具生成等复杂任务。测试结束后,该功能将面向用户免费开放。

千问团队在现场提及了人们工作中常见的“四大黑洞”,千问 “任务助理”都能起到作用:

黑洞1:有想法没技术,到处找工具。 用户可以基于千问App进行“一句话做应用开发”,比如千问团队现场用任务助理做了一个抽奖程序,在接收了脱敏后的现场数据后,千问快速完成了任务。

黑洞2:做不完的表格,浪费时间。 千问App支持调用Office办公工具帮用户完成工作任务。比如当用户上传一批发票让千问App基于此做表格,从现场演示结果来看,其将101张发票全部录入。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

用户点击“启动核查”,就能够对结合进行二次检查,快速发现问题并保证准确率。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

黑洞3:活干得漂亮,但不会汇报。 如下图所示,千问App能够帮用户将比较原始的工作文档和数据进行处理,提取重点并用可视化的方式呈现,帮用户做好工作汇报。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

黑洞4:信息太多,资料查到手软。 当现场演示员向千问了解近期的现象级应用“死了么”的情况,千问累计进行了80多次搜索,仅花了8分钟就反馈了24页深度报告,通过文字和表格多种形式将相关信息总结给用户。千问团队提到,传统的搜索是线性的,千问收到指令后,在后台裂变为上百个节点,就像一棵树不断生长分叉,最后生成更具深度和广度的结果。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

除了通用办公助手,千问App的办事能力还在快速进入各个垂直行业。前几天,千问推出了千问备考大礼包,包括“一句话找卷子”、“错题举一反三”、“千问小讲堂”、“超千万真人讲题”、“拍照讲题”、“作业批改”六大能力,成为学生学习复习的便捷工具。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

04 .结语:推开“AI办事”时代的大门

千问App的此次升级,是AI从“对话玩具”迈向“生产力工具”的关键里程碑。它首次将顶尖大模型的复杂推理、规划与代码能力,与真实、丰富且闭环的阿里生态进行了系统级融合。

“AI办事”时代的大门正在被推开。虽然千问App的办事功能尚处发展初期,但AI能真正理解并操盘现实世界复杂需求链的能力正在形成闭环——从“想喝什么”的意图,到调用合适服务、完成比价下单与支付的全过程,都在被AI深度重塑。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/18111

(0)
上一篇 2026年1月15日 下午1:39
下一篇 2026年1月15日 下午4:38

相关推荐

  • 具身智能商业化破局:影智XBOT以非人形设计实现400万杯咖啡落地,引领AI机器人实用化浪潮

    新年伊始,AI行业便已进入高强度竞技状态。 在全球科技风向标CES展会上,机器人×AI成为真正的主角。在拉斯维加斯的霓虹灯下,中国机器人军团站到了舞台中央——他们并非仅靠堆砌概念,而是凭借实实在在的订单和规模化落地速度,赢得了关注。 CES创新奖评委Chris Pereira指出,中国厂商正展现出将新兴技术快速转化为可量产、可交付、并能在全球市场销售的成熟产…

    2026年1月11日
    17500
  • Meta的AI战略转型:内部冲突、资源博弈与科技巨头的历史轮回

    随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能,Meta正经历着自成立以来最深刻的结构性变革。这一转变不仅涉及数十亿美元的资源重新分配,更引发了公司内部在战略方向、文化理念和资源优先级上的激烈博弈。本文将从多个维度深入分析Meta当前面临的挑战、转型逻辑及其在科技巨头竞争格局中的独特处境。 今年,扎克伯格对Meta的人工智能业务进行了彻底重组,并以约…

    2025年12月12日
    21000
  • MotionTrans:人类VR数据零样本迁移,开启机器人技能学习新范式

    近期,由清华大学、北京大学、武汉大学和上海交通大学联合研究团队发布的MotionTrans框架,在机器人技能学习领域取得了突破性进展。该研究由清华大学硕士生袁承博、武汉大学本科生周睿和北京大学博士生刘梦真主导,清华大学交叉信息研究院高阳助理教授担任通讯作者。这项研究的核心创新在于,首次实现了从人类VR数据到机器人的端到端零样本动作迁移,为机器人技能学习开辟了…

    2025年11月5日
    17900
  • 解码新范式:北大团队提出Language Ranker框架,用推荐系统思维重塑LLM生成过程

    在大语言模型(LLM)的快速发展浪潮中,学术界和工业界的研究焦点普遍集中于模型架构优化、参数规模扩展、训练数据增强以及奖励信号强化等方向,这些努力本质上都是在优化模型的输出概率分布。然而,一个长期被相对忽视的关键环节是:如何将这些复杂的概率分布高效、精准地转化为高质量的文本生成结果——即解码(decoding)阶段。传统的解码策略,如贪婪解码、束搜索(Bea…

    2025年11月30日
    18700
  • GPT-5.2突袭Cursor:OpenAI以编程为战场,打响对Gemini 3的反击战

    在人工智能领域竞争白热化的当下,OpenAI与谷歌之间的技术对决已进入关键阶段。近期,开发者社区流传的截图显示,在Cursor IDE的模型下拉菜单中,赫然出现了gpt-5.2和gpt-5.2-thinking的选项,这标志着GPT-5.2可能已悄然上线,而其首战场并非ChatGPT网页端,而是选择了编程集成开发环境Cursor。这一战略部署意味深长:Ope…

    2025年12月11日
    18800