阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

总裁现场喊话AI点40杯奶茶,然后骑手送到了!阿里千问这次玩真的。

1月15日,千问App上线超400项AI办事功能,成为全球首个能完成真实生活复杂任务的AI助手。千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票AI购物功能,并向所有用户开放测试。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

同时,千问App“任务助理”开启邀测,包括移动端和网页端两个版本,覆盖报表制作、查资料做报告、信息可视化、做工具网页、旅游路线规划、教育板书讲解等众多典型应用场景。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

阿里巴巴副总裁、阿里千问C端事业群总裁吴嘉提到,千问App上线两个月以来,C端月度活跃用户已突破1亿。他说,现在这只是千问App办事的第一个版本,未来大家可能只需要下载千问一个App,而不像传统互联网时代,需要在多个App中频繁切换

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

在发布会上,吴嘉现场演示了用千问App点“第一杯奶茶”。他给千问App下达一句话指令:“帮我点40杯霸王茶姬的伯牙绝弦”,千问App迅速调用淘宝闪购下单,无需任何跳转即在端内完成AI支付。不久后,淘宝闪购骑手就将奶茶送达现场。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

01 .阿里吴嘉:三大底层能力突破驱动千问现实“办事”能力升级

吴嘉称,千问App上线办事能力,这不仅是在线上数字世界帮大家办事,更是要进入物理世界,在生活环境中帮人们办事,形成AI办事的完整形态。

在数字世界,AI将从副驾驶走向主驾驶。千问App主要依赖三大能力:全模态理解AI Coding超长上下文工程。千问大模型Coding能力的大幅提升,使其能实时构建工具;全模态理解能力的突破,让千问能够看懂界面听懂声音同时读懂图文报表;最后是超长上下文的处理能力大幅提升复杂上下文的交付上限。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问App“任务助理”即日起开启邀测,将在不久后全面开放。吴嘉称,千问App“任务助理”几乎可以处理数字世界的任何事务,覆盖报表制作、查资料做报告、信息可视化、做工具网页、旅游路线规划、教育板书讲解等众多典型场景。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

在真实生活场景,模型需要深度理解真实世界生活需求,并且具备从消费到交易的全链路能力,对此阿里提供丰富的商品和服务供给,并且具备海量的真实反馈和交易。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问App宣布全面接入阿里生态场景,包括淘宝、支付宝、淘宝闪购、飞猪、高德、1688、盒马、优酷、大麦娱乐、阿里健康、菜鸟生态业务组,点外卖、买东西、订机票、订酒店等AI购物功能开放测试。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

吴嘉称:“千问是第一个真正能帮你办事的AI,我们的独特优势在于‘Qwen最强模型’与‘阿里最丰富生态’的结合,AI办事时代才刚刚开始。”

02 .现场演示千问生活办事:一句话点奶茶、AI电话订餐馆、50项政务民生服务

一句话点奶茶背后,是千问与淘宝闪购、支付宝原生AI支付能力“AI付”的系统级打通。

用户只要在聊天框里说一句“帮我点两杯拿铁”,千问就能调用淘宝闪购的服务能力,精准定位、推荐合适的商家、生成订单,并通过内置的“支付宝AI付”功能一键付款,实现“说一句,就送到”。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

当需求更复杂时,比如团建时不同人想喝不同的奶茶,千问App可以给出1-3套的可选方案,在多店下单。除了一句话点奶茶,千问App还支持“打电话订奶茶”、“打电话订餐”。千问AI助手会给商家打电话,声音几乎与真人无异,能够和商家通过对话方式订好餐,问清楚各种情况。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问团队提到,过去两个月,用户在千问上主动询问商品推荐次数,月环比增长300%。从这一需求出发,千问联合淘宝推出“一句话购物”能力。接入淘宝后,千问App可以真正帮助用户解决“买什么、怎么选、值不值得买”的难题。千问App不仅能根据用户的真实需求给出购物建议,更能基于淘宝庞大的商品数据库和评价体系,智能生成具体的商品推荐方案。用户只需一个指令,即可在千问App完成从消费决策到交易的闭环。比如当用户输入为父母购买一台扫地机器人,千问能够深入理解到“家里有猫”等条件涉及的精细需求,推理出“防缠绕”、“高温杀菌”等隐含刚需,从而推荐几款更适合用户的扫地机器人。当用户点击进去,就可以看到商品详情并完成下单,省去了用户查攻略的繁琐。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

一个用户在春节期间要规划旅游计划,他可以在千问App中完成查询、订票等一系列操作。千问会根据用户的具体情况,推荐多套出行方案。这体现了强大的跨应用协同能力。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

▲用千问在对话中订机票

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

▲用千问在对话中订酒店

吴嘉谈道,对于消费场景,互联网上的营销信息繁杂、噪音巨大。如何训练模型的理解分辨能力很关键。千问App不仅仅依靠世界知识,更能利用阿里巴巴独特的交易和服务数据来增强模型,从而保障AI购物功能保持客观和准确

对于更广泛的生活服务,千问App接入支付宝政务服务,上线签证、户口、公积金等50项民生服务。用户不再需要像过去那样在不同部门网站间奔波,只需一句“杭州户口怎么办护照”,千问即可完成政策解读、材料清单梳理,并直达办理入口。

03 .现场演示千问任务助理:做程序、制表格、搜资料、做汇报

即日起,千问 “任务助理”功能在App和Web端开始定向邀测。该功能具备类人化的多步骤规划能力,覆盖应用开发、Office办公、咨询调研及生活办事等核心场景,支持一键处理报表整理、研报撰写及小工具生成等复杂任务。测试结束后,该功能将面向用户免费开放。

千问团队在现场提及了人们工作中常见的“四大黑洞”,千问 “任务助理”都能起到作用:

黑洞1:有想法没技术,到处找工具。 用户可以基于千问App进行“一句话做应用开发”,比如千问团队现场用任务助理做了一个抽奖程序,在接收了脱敏后的现场数据后,千问快速完成了任务。

黑洞2:做不完的表格,浪费时间。 千问App支持调用Office办公工具帮用户完成工作任务。比如当用户上传一批发票让千问App基于此做表格,从现场演示结果来看,其将101张发票全部录入。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

用户点击“启动核查”,就能够对结合进行二次检查,快速发现问题并保证准确率。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

黑洞3:活干得漂亮,但不会汇报。 如下图所示,千问App能够帮用户将比较原始的工作文档和数据进行处理,提取重点并用可视化的方式呈现,帮用户做好工作汇报。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

黑洞4:信息太多,资料查到手软。 当现场演示员向千问了解近期的现象级应用“死了么”的情况,千问累计进行了80多次搜索,仅花了8分钟就反馈了24页深度报告,通过文字和表格多种形式将相关信息总结给用户。千问团队提到,传统的搜索是线性的,千问收到指令后,在后台裂变为上百个节点,就像一棵树不断生长分叉,最后生成更具深度和广度的结果。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

除了通用办公助手,千问App的办事能力还在快速进入各个垂直行业。前几天,千问推出了千问备考大礼包,包括“一句话找卷子”、“错题举一反三”、“千问小讲堂”、“超千万真人讲题”、“拍照讲题”、“作业批改”六大能力,成为学生学习复习的便捷工具。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

04 .结语:推开“AI办事”时代的大门

千问App的此次升级,是AI从“对话玩具”迈向“生产力工具”的关键里程碑。它首次将顶尖大模型的复杂推理、规划与代码能力,与真实、丰富且闭环的阿里生态进行了系统级融合。

“AI办事”时代的大门正在被推开。虽然千问App的办事功能尚处发展初期,但AI能真正理解并操盘现实世界复杂需求链的能力正在形成闭环——从“想喝什么”的意图,到调用合适服务、完成比价下单与支付的全过程,都在被AI深度重塑。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/18111

(0)
上一篇 2026年1月15日 下午1:39
下一篇 2026年1月15日 下午4:38

相关推荐

  • 《面向人工智能的数据标注合规指南》:数据标注合规标准化进程的里程碑与产业影响分析

    随着人工智能技术的快速发展和规模化应用,数据标注作为模型训练的基础环节,其合规性已成为影响AI产业健康发展的关键因素。近日,由中国电子商会归口管理、智合标准中心组织编制、中移互联网有限公司牵头起草的全国首部AI数据标注合规标准《面向人工智能的数据标注合规指南》团体标准已完成多轮研讨和修订,即将进入报批环节。该标准吸引了来自人工智能、数据标注领域的50余家单位…

    2025年12月4日
    31600
  • 极简主义编程助手pi-mono:仅凭四个核心工具击败竞品,揭秘OpenClaw背后的技术架构

    最近,一个名为 openClaw 的 Agent 框架项目在 Terminal-Bench 基准测试中表现出色,击败了众多功能丰富的竞品。其背后的核心是开发者 Zechner Mario Zechner 的理念:厌倦了 Claude Code 这类工具变得像“80%功能都用不上的宇宙飞船”,他决定亲手打造一个极简的 AI 编程助手。他的原则很简单:如果不需要…

    2026年2月21日
    2.1K00
  • Meta收购Moltbook:AI社交网络神话破灭,科技巨头悄然收网

    刚刚,据多家媒体报道,Meta 已正式收购了专为 AI 智能体打造的社交网络 Moltbook,这场轰轰烈烈的全网社会实验就此落幕。 是的,Meta 已将 Moltbook 的两位核心创始人 Matt Schlicht 和 Ben Parr 招致麾下。这两位用“AI 社交网络”搅动风云的人物,将于 3 月 16 日正式加入由前 Scale AI 首席执行官 …

    2026年3月11日
    36400
  • 谷歌Gemma 4引爆手机AI革命:口袋里的Gemini平替,40 token/秒的魔法速度

    谷歌近期开源的全新模型 Gemma 4,为行业带来了显著影响。 该模型采用了与 Gemini 3 同源的技术架构,支持原生全模态处理,并在 Arena AI 排行榜上位列全球第三。其提供了多个型号,其中较小的 E2B(有效参数 2.3B)和 E4B(有效参数 4.5B)版本可直接部署于手机端本地运行,并具备 128K 的上下文窗口,堪称“口袋中的 Gemin…

    2026年4月7日
    30700
  • 像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

    让模型真正“能行动”,往往需要一个可执行、可验证的符号世界模型(Symbolic World Model)。它并非抽象的文字描述,而是能被规划器或执行器直接调用的形式化定义,例如PDDL领域/问题,或可运行的环境代码/模拟器。一旦世界被“写成可运行的规则”,我们就能在同一套约束下进行推演、测试与复现:模型不再停留在“会说”,而是能回答“如果我这样做,会发生什…

    2026年2月2日
    52200