阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

总裁现场喊话AI点40杯奶茶,然后骑手送到了!阿里千问这次玩真的。

1月15日,千问App上线超400项AI办事功能,成为全球首个能完成真实生活复杂任务的AI助手。千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票AI购物功能,并向所有用户开放测试。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

同时,千问App“任务助理”开启邀测,包括移动端和网页端两个版本,覆盖报表制作、查资料做报告、信息可视化、做工具网页、旅游路线规划、教育板书讲解等众多典型应用场景。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

阿里巴巴副总裁、阿里千问C端事业群总裁吴嘉提到,千问App上线两个月以来,C端月度活跃用户已突破1亿。他说,现在这只是千问App办事的第一个版本,未来大家可能只需要下载千问一个App,而不像传统互联网时代,需要在多个App中频繁切换

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

在发布会上,吴嘉现场演示了用千问App点“第一杯奶茶”。他给千问App下达一句话指令:“帮我点40杯霸王茶姬的伯牙绝弦”,千问App迅速调用淘宝闪购下单,无需任何跳转即在端内完成AI支付。不久后,淘宝闪购骑手就将奶茶送达现场。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

01 .阿里吴嘉:三大底层能力突破驱动千问现实“办事”能力升级

吴嘉称,千问App上线办事能力,这不仅是在线上数字世界帮大家办事,更是要进入物理世界,在生活环境中帮人们办事,形成AI办事的完整形态。

在数字世界,AI将从副驾驶走向主驾驶。千问App主要依赖三大能力:全模态理解AI Coding超长上下文工程。千问大模型Coding能力的大幅提升,使其能实时构建工具;全模态理解能力的突破,让千问能够看懂界面听懂声音同时读懂图文报表;最后是超长上下文的处理能力大幅提升复杂上下文的交付上限。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问App“任务助理”即日起开启邀测,将在不久后全面开放。吴嘉称,千问App“任务助理”几乎可以处理数字世界的任何事务,覆盖报表制作、查资料做报告、信息可视化、做工具网页、旅游路线规划、教育板书讲解等众多典型场景。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

在真实生活场景,模型需要深度理解真实世界生活需求,并且具备从消费到交易的全链路能力,对此阿里提供丰富的商品和服务供给,并且具备海量的真实反馈和交易。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问App宣布全面接入阿里生态场景,包括淘宝、支付宝、淘宝闪购、飞猪、高德、1688、盒马、优酷、大麦娱乐、阿里健康、菜鸟生态业务组,点外卖、买东西、订机票、订酒店等AI购物功能开放测试。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

吴嘉称:“千问是第一个真正能帮你办事的AI,我们的独特优势在于‘Qwen最强模型’与‘阿里最丰富生态’的结合,AI办事时代才刚刚开始。”

02 .现场演示千问生活办事:一句话点奶茶、AI电话订餐馆、50项政务民生服务

一句话点奶茶背后,是千问与淘宝闪购、支付宝原生AI支付能力“AI付”的系统级打通。

用户只要在聊天框里说一句“帮我点两杯拿铁”,千问就能调用淘宝闪购的服务能力,精准定位、推荐合适的商家、生成订单,并通过内置的“支付宝AI付”功能一键付款,实现“说一句,就送到”。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

当需求更复杂时,比如团建时不同人想喝不同的奶茶,千问App可以给出1-3套的可选方案,在多店下单。除了一句话点奶茶,千问App还支持“打电话订奶茶”、“打电话订餐”。千问AI助手会给商家打电话,声音几乎与真人无异,能够和商家通过对话方式订好餐,问清楚各种情况。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

千问团队提到,过去两个月,用户在千问上主动询问商品推荐次数,月环比增长300%。从这一需求出发,千问联合淘宝推出“一句话购物”能力。接入淘宝后,千问App可以真正帮助用户解决“买什么、怎么选、值不值得买”的难题。千问App不仅能根据用户的真实需求给出购物建议,更能基于淘宝庞大的商品数据库和评价体系,智能生成具体的商品推荐方案。用户只需一个指令,即可在千问App完成从消费决策到交易的闭环。比如当用户输入为父母购买一台扫地机器人,千问能够深入理解到“家里有猫”等条件涉及的精细需求,推理出“防缠绕”、“高温杀菌”等隐含刚需,从而推荐几款更适合用户的扫地机器人。当用户点击进去,就可以看到商品详情并完成下单,省去了用户查攻略的繁琐。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

一个用户在春节期间要规划旅游计划,他可以在千问App中完成查询、订票等一系列操作。千问会根据用户的具体情况,推荐多套出行方案。这体现了强大的跨应用协同能力。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

▲用千问在对话中订机票

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

▲用千问在对话中订酒店

吴嘉谈道,对于消费场景,互联网上的营销信息繁杂、噪音巨大。如何训练模型的理解分辨能力很关键。千问App不仅仅依靠世界知识,更能利用阿里巴巴独特的交易和服务数据来增强模型,从而保障AI购物功能保持客观和准确

对于更广泛的生活服务,千问App接入支付宝政务服务,上线签证、户口、公积金等50项民生服务。用户不再需要像过去那样在不同部门网站间奔波,只需一句“杭州户口怎么办护照”,千问即可完成政策解读、材料清单梳理,并直达办理入口。

03 .现场演示千问任务助理:做程序、制表格、搜资料、做汇报

即日起,千问 “任务助理”功能在App和Web端开始定向邀测。该功能具备类人化的多步骤规划能力,覆盖应用开发、Office办公、咨询调研及生活办事等核心场景,支持一键处理报表整理、研报撰写及小工具生成等复杂任务。测试结束后,该功能将面向用户免费开放。

千问团队在现场提及了人们工作中常见的“四大黑洞”,千问 “任务助理”都能起到作用:

黑洞1:有想法没技术,到处找工具。 用户可以基于千问App进行“一句话做应用开发”,比如千问团队现场用任务助理做了一个抽奖程序,在接收了脱敏后的现场数据后,千问快速完成了任务。

黑洞2:做不完的表格,浪费时间。 千问App支持调用Office办公工具帮用户完成工作任务。比如当用户上传一批发票让千问App基于此做表格,从现场演示结果来看,其将101张发票全部录入。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

用户点击“启动核查”,就能够对结合进行二次检查,快速发现问题并保证准确率。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

黑洞3:活干得漂亮,但不会汇报。 如下图所示,千问App能够帮用户将比较原始的工作文档和数据进行处理,提取重点并用可视化的方式呈现,帮用户做好工作汇报。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

黑洞4:信息太多,资料查到手软。 当现场演示员向千问了解近期的现象级应用“死了么”的情况,千问累计进行了80多次搜索,仅花了8分钟就反馈了24页深度报告,通过文字和表格多种形式将相关信息总结给用户。千问团队提到,传统的搜索是线性的,千问收到指令后,在后台裂变为上百个节点,就像一棵树不断生长分叉,最后生成更具深度和广度的结果。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

除了通用办公助手,千问App的办事能力还在快速进入各个垂直行业。前几天,千问推出了千问备考大礼包,包括“一句话找卷子”、“错题举一反三”、“千问小讲堂”、“超千万真人讲题”、“拍照讲题”、“作业批改”六大能力,成为学生学习复习的便捷工具。

阿里千问App全球首发AI办事功能:一句话点奶茶背后的全模态理解与AI Coding革命

04 .结语:推开“AI办事”时代的大门

千问App的此次升级,是AI从“对话玩具”迈向“生产力工具”的关键里程碑。它首次将顶尖大模型的复杂推理、规划与代码能力,与真实、丰富且闭环的阿里生态进行了系统级融合。

“AI办事”时代的大门正在被推开。虽然千问App的办事功能尚处发展初期,但AI能真正理解并操盘现实世界复杂需求链的能力正在形成闭环——从“想喝什么”的意图,到调用合适服务、完成比价下单与支付的全过程,都在被AI深度重塑。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/18111

(0)
上一篇 2026年1月15日 下午1:39
下一篇 2026年1月15日 下午4:38

相关推荐

  • Nano Banana Pro深度解析:时空重构AI的突破与局限

    近期,Nano Banana Pro凭借其“时空重现”能力引发广泛关注。这款AI模型只需输入坐标和可选时间参数,就能生成对应时空的拟真影像,从技术角度看,这标志着多模态AI在时空理解与生成领域迈出了重要一步。 从技术架构分析,Nano Banana Pro的核心突破在于实现了从“推理”到“创造”的能力跃迁。早期版本已能通过图像反推拍摄坐标,展现出色的地理空间…

    2025年11月26日
    17400
  • COMET框架:突破AI加速器性能瓶颈,显式建模集体通信与复合操作数据流

    关键词:复合操作数据流建模、集体通信操作、内存层级优化、机器学习加速器、性能建模与优化 在人工智能技术日新月异的今天,大语言模型、状态空间模型等复杂神经网络已成为推动技术发展的核心引擎。然而,这些模型所依赖的复合操作——即由多个基础操作(如矩阵乘法、归一化、逐元素变换)组合而成的结构化模块——正在对现有的硬件加速器数据流设计与性能优化提出严峻挑战。 传统的数…

    2026年1月26日
    16200
  • 国产GPU生态崛起:摩尔线程MDC 2025大会深度解析与产业前瞻

    2025年12月20日至21日,摩尔线程在北京中关村国际创新中心举办首届MUSA开发者大会(MDC 2025),标志着国产全功能GPU生态建设进入新阶段。作为国内首个聚焦全功能GPU的开发者盛会,大会以“创造、链接、汇聚”为核心理念,直面技术自立自强与产业升级的时代命题,汇聚全球AI与GPU领域开发者、技术领袖及产业先锋,共同探索国产算力的突破路径。 从产业…

    2025年12月9日
    22800
  • AI大模型2月重磅更新盘点:阿里、阶跃星辰、智谱AI等巨头竞相发布,编程、视频、文档处理全面突破

    2月1日 【开源】阿里通义千问发布 Qwen3-Coder-Next 阿里发布了编程智能体模型 Qwen3-Coder-Next。该模型采用总参数为 800 亿的混合专家架构,每次推理仅激活 30 亿参数。在 SWE-Bench Verified 测试中,其问题解决率超过 70%,在保证高性能的同时有效控制了算力成本,适合对算力敏感的本地化开发场景。 技术博…

    AI产业动态 2026年3月2日
    30900
  • 算力基建危机:从微软GPU闲置到太空数据中心革命

    当前全球AI算力竞赛正面临一个被长期忽视的底层危机:芯片制造能力已远超基础设施承载极限。近期两则看似独立的新闻——微软囤积GPU却无法部署、英伟达H100被发射至太空组建数据中心——实则共同揭示了算力生态系统的结构性失衡。本文将深入剖析这一困境的技术根源、产业影响与创新解决方案。 微软CEO萨提亚·纳德拉在与OpenAI山姆·奥特曼的对话中透露,公司手握大量…

    2025年11月4日
    14800