2026年1月17日 • 周六
14:33

1月17日 AI安全情报:Claude Cowork文件窃取漏洞 / Superhuman AI邮件数据泄露 / 谷歌Antigravity凭证窃取

🚨 Claude Cowork通过Anthropic API端点窃取用户文件

威胁等级/类型:提示词注入 / 高危
Prompt Armor发现Claude Cowork的域白名单包含api.anthropic.com,攻击者可构造恶意提示,让AI代理将用户文件上传至攻击者控制的Anthropic API端点,实现数据窃取。
🔗 查看情报源

🚨 Superhuman AI通过Google Forms泄露敏感邮件数据

威胁等级/类型:提示词注入 / 高危
攻击者通过恶意邮件中的提示词注入,操纵Superhuman AI将用户收件箱中的财务、法律、医疗等敏感邮件内容提交至攻击者的Google Form,利用CSP规则允许docs.google.com域加载的漏洞。
🔗 查看情报源

🚨 谷歌Antigravity IDE通过Webhook.site窃取AWS凭证

威胁等级/类型:提示词注入 / 高危
攻击者通过1px字体隐藏的恶意指令,操纵Gemini收集用户.env文件中的AWS凭证,并通过webhook.site域(默认在白名单中)进行数据窃取。AI通过run_command绕过.gitignore文件访问限制。
🔗 查看情报源

🚨 OpenAI推出”忏悔”机制应对模型奖励函数攻击

威胁等级/类型:模型安全 / 中危
OpenAI研究团队提出”忏悔”训练方法,让模型产生第二个输出专门用于诚实报告,防止模型”欺骗”奖励函数。该方法为模型提供匿名举报渠道,提高模型行为透明度。
🔗 查看情报源

🚨 MCP颜色分类法系统化应对提示词注入风险

威胁等级/类型:安全框架 / 中危
Tim Kellogg提出MCP工具颜色分类法:红色工具暴露于恶意指令,蓝色工具涉及关键操作。通过自动化标注200+工具,防止AI代理同时使用红蓝工具,降低提示词注入风险。
🔗 查看情报源

🚨 AI安全中的”偏差正常化”现象引发系统性风险

威胁等级/类型:组织安全 / 高危
Johann Rehberger指出AI领域存在”偏差正常化”风险,企业将概率性、非确定性的模型输出视为可靠安全,降低安全标准。缺乏成功攻击案例导致安全警惕性下降,类似航天飞机挑战者号灾难的组织失败模式。
🔗 查看情报源

🚨 PostHog平台SSRF+SQL注入+RCE攻击链分析

威胁等级/类型:系统漏洞 / 严重
攻击者利用PostHog webhook系统URL验证不严,构造SSRF攻击访问内部ClickHouse,结合ClickHouse PostgreSQL函数转义0day和默认PostgreSQL凭证,通过COPY FROM PROGRAM执行bash反向shell实现RCE。
🔗 查看情报源

🚨 Anthropic投资150万美元支持Python软件基金会安全

威胁等级/类型:生态安全 / 中危
Anthropic与PSF建立两年期合作,投资150万美元重点支持CPython和PyPI安全改进,同时资助开发者驻场计划、社区支持、核心基础设施维护等,提升整个Python生态系统的安全性。
🔗 查看情报源

🚨 浏览器厂商计划2026年11月移除XSLT消除安全风险

威胁等级/类型:基础设施安全 / 中危
Chrome、Firefox、WebKit计划在2026年11月移除XSLT支持,因libxslt等底层C/C++库存在内存安全漏洞风险,可能导致任意代码执行。XSLT主要用于Atom/RSS feed转换,Jake Archibald已提供替代方案。
🔗 查看情报源

🚨 Substack内容过滤器阻止SQL注入攻击示例传播

威胁等级/类型:内容安全 / 低危
Substack内容过滤器检测到包含/etc/hosts和完整SQL注入攻击示例的新闻稿,阻止发布以防止恶意代码传播。该过滤器基于Hacker News讨论的已知触发字符串,体现平台对安全内容传播的管控。
🔗 查看情报源

13:59

1月17日 AI日报:支付宝首发ACT协议 / 谷歌Veo 3.1重磅升级 / 美团开源LongCat-Flash-Thinking-2601

大模型与智能体

● 支付宝首发ACT协议,打造中国首个AI智能体商业协同标准
支付宝推出中国首个AI智能体商业开放协议ACT,旨在构建跨平台协同的通用语言与信任机制,解决智能体在订餐、理财等场景中高效可信协作的关键难题。
🔗 原文

● 美团推出 LongCat-Flash-Thinking-2601,开源工具调用能力再登高峰
美团LongCat团队开源了最新AI模型LongCat-Flash-Thinking-2601,该模型在智能体搜索、工具调用及推理等多项核心评测中达到开源模型最高水平。其核心优势在于卓越的工具调用能力,能有效处理依赖工具的复杂任务,显著降低真实场景中对新工具的适应成本。
🔗 原文

● OpenAI 发布 GPT-5.2-Codex 编程模型,API 正式开放
OpenAI发布GPT-5.2-Codex,这是其最强的代理式编程模型,基于GPT-5.2系列,专为复杂长周期软件开发优化。模型将AI从代码助手升级为能自主处理工程任务的“代理”,在长程任务性能和可靠性上实现质的飞跃,并能理解超大规模代码库。
🔗 原文

● Claude Code两大更新震撼来袭:MCP工具搜索+Tab键智能补充,AI开发效率飙升!
Claude Code发布两大更新:MCP工具搜索支持动态加载,减少上下文占用;提示交互功能增强,提升使用灵活性。这些改进已逐步推送,旨在优化开发者体验。
🔗 原文

● 视频会议巨头“跨界”登顶,Zoom 凭借联邦 AI 刷新全球最难 AI 考试纪录
视频会议巨头Zoom在顶级AI基准测试中刷新世界纪录,以48.1%的成绩超越谷歌等巨头,其成功关键在于采用联邦式AI路径,而非直接训练底层模型。
🔗 原文

多模态与生成式AI

● 谷歌Veo 3.1重磅升级!多图参考一致性拉满+原生竖版+4K超分
Google DeepMind旗下AI视频生成模型Veo3.1迎来重大更新,核心优化“Ingredients to Video”功能,显著提升人物、物体、纹理与背景的一致性,新增原生竖版输出和专业级4K超分能力,使AI视频从演示工具升级为实用生产工具。
🔗 原文

● 腾讯混元3D Studio1.2开启公测:新增笔刷交互与八视图生成,3D 建模更精准
腾讯混元3D Studio升级至1.2版本并开放公测,显著提升了3D资产生成的专业性与可控性。其组件生成能力PartGen升级至1.5版本,核心拆分精度提高至1536³分辨率,更好地保留模型细节。新版本还引入了创新的“笔刷交互”功能,增强了用户操作体验。
🔗 原文

● MongoDB推Voyage AI新模型,用自然语言“对话”数据库,向量搜索准确率再升级
MongoDB推出Voyage AI模型系列,优化向量搜索性能,新增AI助手与自动嵌入功能,使数据库能理解语义并智能交互。核心突破在于提升数据语义理解精度,让开发者可通过自然语言查询数据,无需编写复杂查询语句。
🔗 原文

● Opera AI 今日上线:侧边栏里的全能智能体,懂网页更懂隐私
Opera 浏览器正式推出全新人工智能功能 Opera AI,面向旗下 Opera One、Opera GX 和 Opera Air 用户开放。作为 Aria 的升级版,Opera AI 在速度和智能化方面显著提升,是 Opera 实现“浏览器即 AI 接口”战略的重要一步。用户可在浏览器右上角便捷访问改进后的界面。
🔗 原文

行业应用与商业动态

● 蔚来组建“AI天团”:李斌成立人工智能委员会,力推AI覆盖全业务链
蔚来汽车成立人工智能技术委员会,由近30名专家组成,旨在加速AI技术在公司各领域的应用。CEO李斌表示,2026年是关键一年,公司将通过三次重大更新提升智能驾驶能力,并计划推出AI手机和AI芯片,以增强产品竞争力。
🔗 原文

● B站发布一站式AI营销工具,发力年轻人消费市场
B站用户日均使用时长增至112分钟,平均年龄达26岁,消费能力增强。为此,B站全面引入AI技术提升广告效率,加速商业化进程。
🔗 原文

● 森马服饰回应投资者:AI已深度融入设计、直播、供应链等全链路,加速服装行业数智化转型
森马服饰正全面推进AI在时尚产业全链路应用,覆盖创意设计到终端服务,强调系统性布局,已应用于知识库构建、营销文案生成、视觉内容拍摄、短视频制作及服装设计辅助等多个环节。
🔗 原文

● 1.2万平方米AI机器人盛宴空降安庆!人形机甲、教育机器人齐亮相,青少年可零距离“触摸未来”
一场融合科技与艺术的AI盛宴将在安徽安庆举行。展览面积1.2万平方米,集中展示竞技、教育、特种作业及人形机器人等前沿成果,打造沉浸式互动体验,旨在普及科技知识,激发创新热情。
🔗 原文

国际动态与监管

● ​马斯克旗下Grok因生成不雅图像惹众怒,日本政府发出“整改通牒”
日本加入对X平台AI生成内容的国际调查,要求其说明未经授权真人图像的处理机制,凸显全球对AI内容合规的监管收紧。
🔗 原文

● OpenAI 发布“美国制造”招募令:全面构建本土 AI 硬件供应链
OpenAI发布提案征集,旨在提升美国本土AI硬件生产能力,以应对全球AI竞争。公司强调AI生态不仅依赖高性能芯片,还需复杂物理硬件支撑。为此,OpenAI正招募美国本土制造商与供应商,提供从核心计算硬件到数据中心冷却系统等关键基础设施组件。
🔗 原文

● DeepMind CEO哈萨比斯罕见肯定中国AI进展:仅落后数月,但“颠覆性创新”仍是关键差距
DeepMind CEO哈萨比斯称中美AI差距仅数月,点名表扬DeepSeek等中国公司模型性能出色,挑战西方对中国AI的低估判断。
🔗 原文

● ​Anthropic 挺进印度:前微软高管坐镇,正面硬刚 OpenAI
Anthropic宣布进军印度市场,任命前微软高管负责印度业务,旨在与OpenAI等竞争对手争夺这一关键增长市场。
🔗 原文

开源与工具

● TaiXu-Admin V0.0.10发布,支持与 Ollama 模型适配
TaiXu-Admin V0.0.10版本发布,支持适配Ollama模型,增强了网络模型灵活性,方便用户进行智能对话与信息检索。同时优化了RAG(知识检索增强生成)处理能力,提升了大模型应用性能。
🔗 原文

2026年1月14日 • 周三
15:46

1月14日 AI日报:智谱华为开源GLM-Image / 爱诗科技发布PixVerse R1 / 商汤上线办公小浣熊

模型发布与开源

● 智谱联合华为开源首个国产芯片训练的多模态SOTA模型GLM-Image
智谱AI与华为联合开源新一代图像生成模型GLM-Image,是首个在国产昇腾Atlas 800T A2芯片上完成全流程训练的SOTA多模态模型。在复杂视觉文字生成(CVTG-2K)和长文本渲染(LongText-Bench)榜单中取得开源模型最优成绩。
🔗 原文

● 全球首个通用实时世界模型 PixVerse R1
PixVerse正式发布全球首个通用实时世界模型PixVerse R1,开创视频内容从“录好再播”到“因你而生”的新范式。模型支持无限流生成、多模态交互与即时响应,最高支持1080P分辨率。
🔗 原文

● 百川开源全球最强医疗大模型Baichuan-M3
百川智能开源全球最强医疗大模型Baichuan-M3,在权威评测HealthBench中以65.1分综合成绩位列全球第一,首次在医疗领域全面超越GPT-5.2。模型幻觉率低至3.5%,为全球最低。
🔗 原文

● 千寻智能开源具身智能基础模型Spirit v1.5
国产具身智能模型千寻Spirit v1.5在权威真机评测基准RoboChallenge上以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5模型,登顶全球榜首。
🔗 原文

● 多模态检索新标杆,Qwen3-VL-Embedding&Reranker开源!
通义千问团队正式开源多模态检索模型Qwen3-VL-Embedding与Qwen3-VL-Reranker。该系列模型基于Qwen3-VL构建,专为图文、视频等混合内容的理解与检索设计。
🔗 原文

产品与功能上线

● 商汤「办公小浣熊」APP上线!
商汤科技正式上线「办公小浣熊APP」iOS移动版应用。APP主打移动办公场景下的AI生产力工具,支持用户通过手机进行复杂表格数据分析、语音输入快速记录,并实现电脑与手机间的任务无缝接力。
🔗 原文

● 一年融2.2亿,DeepWisdom终于发布了第一款产品Atoms
AI编程平台DeepWisdom正式发布核心产品Atoms,平台基于多智能体架构,让用户“用一句话启动一家创业公司”。公司在2025年完成累计2.2亿元人民币融资。
🔗 原文

● Anthropic 发布 Cowork:面向所有人版本的 Claude Code 助手
Anthropic发布Claude Cowork,是其智能体编码工具Claude Code面向包括非开发者在内的所有用户的衍生版本。工具允许用户授权Claude访问电脑指定文件夹,使其能在其中读取、编辑和创建文件。
🔗 原文

● OpenAI 推出 ChatGPT Health 模式,为健康设立专属空间
OpenAI正式推出专注于健康领域的“ChatGPT Health”模式。为用户提供了一个独立的对话空间,更系统、安全地讨论健康问题。核心特性包括将健康对话与普通聊天记录隔离以保护隐私。
🔗 原文

● 谷歌联合零售巨头推出通用商务协议 UCP
谷歌联合Shopify、沃尔玛、Target等零售巨头推出全新开放标准——通用商务协议(UCP),为AI智能体购物场景建立全流程标准化框架。协议支持智能体参与从商品发现到售后支持的全部环节。
🔗 原文

融资与商业动态

● 自变量获字节、红杉等10亿元投资,构建物理世界的基础模型
具身智能机器人公司“自变量”近期完成10亿元A++轮融资,投资方包括字节跳动、红杉中国、深创投等顶级机构。公司是国内唯一同时获得字节、美团、阿里投资的具身智能企业。
🔗 原文

● Humanify 获数千万元首轮融资打造 AI OS
AI初创公司Humanify(人格智能)近日宣布完成数千万元种子轮融资,由五源资本领投,奇绩创坛跟投。公司专注于开发具备“类人认知与自主意识”的下一代AI模型与原生操作系统。
🔗 原文

● MiniMax 港股挂牌,历史上IPO规模最大的AI大模型公司诞生
全球化AI大模型公司MiniMax(股票代码:0100.HK)在香港联交所主板正式挂牌上市。开盘后股价一度大涨超50%,截至发稿涨幅达63%,报269港元,市值约831亿港元。
🔗 原文

● 智谱上市了,全球大模型第一股,股票代码“02513”
北京智谱华章技术股份有限公司(简称“智谱”)正式在香港交易所挂牌上市,股票代码为“02513”,成为全球“大模型第一股”。公司以“智能是且仅是我们唯一的产品”为核心。
🔗 原文

● xAI完成200亿美元E轮融资,英伟达再次出手
马斯克旗下xAI公司完成200亿美元E轮融资,超额完成原定目标。投资方包括英伟达、思科等知名机构及中东资本。数据显示,Grok月活跃用户已达6亿,Grok 5正在训练中。
🔗 原文

● LMArena完成1.5亿美元Series A融资
AI初创公司LMArena完成1.5亿美元A轮融资,投后估值达17亿美元。核心产品为“模型竞技场”平台,通过众包方式让用户比较不同AI模型的性能,月活用户超500万,每月产生6000万次对话。
🔗 原文

技术与框架更新

● ChatDev 2.0:零代码构建多智能体,快速开发一切
清华大学、上海交通大学、OpenBMB与面壁智能联合团队正式开源多智能体框架ChatDev 2.0。新版实现了从“代码驱动”到“零代码可视化交互”的飞跃,用户通过简单“拖拽+配置”即可在无限画布上构建复杂多智能体系统。
🔗 原文

● 智元发布首个大语言模型驱动的开源仿真平台:Genie Sim 3.0
智元机器人在CES上发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0。平台基于NVIDIA Isaac Sim构建,融合三维重建与视觉生成技术,可实现数字孪生级高保真仿真环境。
🔗 原文

● 英伟达发布重磅AI计算平台Vera Rubin
英伟达CEO黄仁勋发布了重磅AI计算平台Vera Rubin,打破五年未发消费级显卡的惯例。平台包含6款全新芯片,其中Rubin GPU推理算力达50 PFLOPS,是Blackwell的5倍。
🔗 原文

● 亚马逊上线 Alexa网页版,加速补齐网页端能力
亚马逊正式推出Alexa+网页版,重新启用Alexa.com域名,允许用户通过浏览器直接与AI助手对话。标志着Alexa从智能音箱设备扩展到网页端,与ChatGPT、Google Gemini等AI聊天机器人展开正面竞争。
🔗 原文

2026年1月2日 • 周五
20:59

1月2日 AI日报:月之暗面斩获5亿美元C轮融资 / 小米大模型MiMo公测延长 / 腾讯开源10亿参数文生3D动作神器

大模型与开源

● 月之暗面斩获5亿美元C轮融资:手握百亿现金不急IPO,剑指AGI世界巅峰
月之暗面完成5亿美元C轮融资,现金储备超百亿元,创始人表示不急于IPO,将专注长期技术研发与人才激励。
🔗 原文

● 小米大模型 MiMo 公测延长,用户可免费体验至 2026 年!
小米宣布将自研大模型MiMo-V2-Flash的公测限免期延长20天,至2026年1月20日。该模型参数量达3090亿,激活参数150亿,在推理和代码生成方面表现优异。
🔗 原文

● MiniMax重磅推出M2.1编程模型,AI开发新纪元即将开启!
MiniMax开源M2.1编程模型,已在Hugging Face、ModelScope和GitHub上线,方便开发者接入。该模型获vLLM“Day-0”支持,可立即实现高效推理,并通过KTransformers技术优化性能。
🔗 原文

● 源 Yuan3.0Flash:开源多模态基础大模型引领 AI 新潮流
YuanLab.ai发布开源多模态大模型Yuan3.0Flash,参数规模达40B,采用稀疏混合专家架构,推理时仅激活约3.7B参数,显著提升效率。模型提供16bit与4bit权重、技术报告及训练方法,支持二次开发和行业定制。
🔗 原文

● 以色列 AI 公司 AI21Labs 澄清与英伟达无交易协议
AI21Labs CEO澄清与英伟达交易传闻,称双方未达成具体协议。公司虽与包括英伟达在内的多方洽谈合作,但讨论仍在进行中。此前媒体曾报道其估值达20-30亿美元。
🔗 原文

AI产品与应用

● 腾讯炸场!10亿参数文生3D动作神器开源,游戏NPC一键“活”了!
腾讯混元团队开源HY-Motion1.0模型,基于DiT架构与流匹配技术,通过文本描述即可生成高质量3D骨骼动画,兼容主流3D工具,大幅降低动画制作门槛。该模型采用全阶段训练策略,利用超3000小时动作数据优化生成效果。
🔗 原文

● 夸克AI眼镜首次OTA:AI能力进一步增强,新增图文备忘录等五项功能
夸克AI眼镜于12月31日完成首次OTA升级,新增录音纪要、图文备忘录、多意图理解与执行、蓝环支付及社区服务五大功能,并对翻译、行程查询等既有功能进行优化。通过自研语音增强模型与硬件配置,其录音功能现支持十米范围清晰收音与有效降噪。
🔗 原文

● 罗永浩发布AI讲书App“且听”:深度解读书籍1-2小时,年费不到40元
罗永浩创业公司“细红线”发布AI产品“且听”,定位为深度语音听库。该产品运用自然语言处理与知识图谱技术,对书籍进行结构化拆解,提供长达1-2小时、字数过万的“深度精讲”,提炼书籍核心内容。
🔗 原文

● 苏州乐享发布具身智能品牌“元点智能”,全尺寸机器人原型首度亮相
乐享科技发布全新具身智能品牌“元点智能”,并推出首款全尺寸人形机器人原型,正式进军通用机器人领域。品牌已构建覆盖户外、家庭等场景的产品矩阵,包括履带式户外机器人W1等,致力于打造全场景智能机器人解决方案。
🔗 原文

● 京东正式上线自营租赁业务,百万级人形机器人触手可及
京东与宇树科技合作的全球首家线下门店在北京开业,标志着具身智能产品走向全渠道零售。京东推出“只租不卖”的自营机器人租赁服务,以更低价格和灵活周期降低体验门槛,推动机器人进入大众生活。
🔗 原文

● 智能眼镜、手环也能享以旧换新补贴!2026年“两新”政策新增AI产品支持
2026年“两新”政策升级,首次将智能眼镜、智能家居产品纳入以旧换新补贴范围,推动智能化终端融入普惠消费体系。政策明确对手机、平板、智能手表、智能眼镜四类数码与智能产品提供补贴。
🔗 原文

行业趋势与洞察

● 2030年前,20万欧洲银行岗位面临 AI 威胁
摩根士丹利预测,到2030年人工智能将威胁欧洲金融业约20万个银行职位,主要影响后端和中间办公岗位,如数据处理和文书工作。金融科技发展推动传统银行采用智能化方案以提升效率、降低成本。
🔗 原文

● 2026 年企业 AI 投资将集中减少供应商,投资者展望新趋势
企业AI应用正从试点转向规模化投资,预计到2026年预算将大幅增长,并集中投向少数已验证有效的供应商。投资者认为,企业将整合资源,选择优胜者,标志着实验阶段的结束。
🔗 原文

● AI “套壳” 产品能否脱颖而出?揭示创业机会与竞争策略
AI套壳产品并非简单应用,关键在于能否融入用户工作流程、积累独特数据并应对巨头竞争,这决定了其市场生存能力。
🔗 原文

● 印度数据中心迅猛发展,但实施进展缓慢
印度数据中心行业增长迅速,但面临落实挑战。卡纳塔克邦等新兴地区政策推进缓慢,而孟买、钦奈等成熟市场仍占主导。行业瓶颈包括政策碎片化、电力限制、人才短缺及基础设施不足,制约了资本密集型项目的进一步发展。
🔗 原文

公司与人事

● OpenAI 员工年均股权激励达150万美元,引发科技行业薪酬大战
OpenAI员工薪酬创科技初创企业新高,平均股权激励达150万美元,约合人民币1051万元,远超谷歌2003年水平。
🔗 原文

● 快手副总裁周国睿即将离职,前路成谜!加入 Meta 或 TikTok?
快手副总裁周国睿被曝将离职,可能加入Meta或TikTok。其内部状态显示为休假,邮件签名已改为“Log Out”。周国睿拥有硕士学历,技术背景深厚。
🔗 原文

● ​谷歌 Nano Banana AI 工具引发 1.5 亿用户隐私担忧
谷歌被指控未经用户同意,利用Google Photos中的照片为其AI系统提供数据,涉及全球15亿用户隐私。这一指控来自竞争对手Proton,而非监管机构,引发对照片分析与存储的新担忧。
🔗 原文

● 2025 年度百度文心AI提示词发布:“工作”
百度文心AI发布2025年度提示词“工作”,去年关键词为“答案”。过去一年,用户通过AI寻求生活、梦想等答案,推动AI理解人类情感与思维。2025年,人们转向向AI倾诉工作中的期待与困惑。
🔗 原文

2026年1月1日 • 周四
12:56

1月1日 AI日报:Kimi完成5亿美元融资 / 软银完成对OpenAI225亿美元投资 / MiniMax今起招股

融资与资本动态

● Kimi 完成 5 亿美元新融资
中国大模型公司月之暗面完成5亿美元C轮融资,由IDG资本领投1.5亿美元,投后估值达43亿美元。公司现金储备已超100亿元人民币,本轮融资将用于加速K3大模型的研发和扩增算力。🔗 原文

● 软银完成对OpenAI承诺的225亿美元额外投资
软银向OpenAI的400亿美元(约合人民币2799亿元)巨额投资已全部到账,使其持股比例达到约11%。这笔史上最大额AI投资的前提是OpenAI需在年底前完成重组并转为营利组织。🔗 原文

● MiniMax今起招股,1月9日敲钟代码00100
中国AI公司MiniMax正式启动港股上市进程,预计于2026年1月9日挂牌,股票代码00100。此次IPO发行估值超461亿港元,拟募资超6亿美元。🔗 原文

● 九章云极宣布完成新一轮战略融资
人工智能基础设施提供商九章云极宣布完成新一轮战略融资,由北京信息产业发展投资基金与北京市人工智能产业投资基金联合领投。本轮融资将重点用于AI加速计算技术研发和普惠智算云平台建设。🔗 原文

● 面壁智能完成数亿元融资,加码投入领跑端侧 AI
面壁智能近日宣布完成数亿元融资,投资方包括京国瑞、国科投资、中金保时捷基金等多家机构。本轮融资将主要用于加大端侧高效大模型的研发投入,加速端侧AI的商业化进程。🔗 原文

● 曦诺未来宣布完成超亿元天使轮融资,宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资,由宁德时代旗下溥泉资本领投,小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1。🔗 原文

产品发布与更新

● Vidu Agent全球正式上线,商业广告一键成片
Vidu推出AI视频创作工具Vidu Agent,支持20多种语言和200多种音色,覆盖商业广告、产品TVC、剧情片等多种创作场景,能一键生成高质量视频。🔗 原文

● 腾讯混元开源翻译模型Tencent-HY-MT1.5版本,端侧可部署
腾讯混元开源翻译模型Tencent-HY-MT1.5系列版本,包含1.8B和7B两个模型,支持33种语种互译及5种民汉/方言。1.8B模型专为端侧部署优化,仅需1GB内存即可流畅运行。🔗 原文

● 京东AI购抢先实测,一句话搞定吃喝穿用
京东上线AI原生应用“京东AI购”,目前处于App Store内测阶段。应用以对话为主要交互方式,用户通过自然语言即可完成外卖点单、商品导购等操作。🔗 原文

● 腾讯元宝“任务”功能上线:一句话安排时间,到点就提醒
腾讯元宝AI助手正式上线“任务”功能,用户只需将时间安排或计划用一句话告知元宝,即可获得准时提醒服务。功能支持提前测试、手动管理和自定义提醒。🔗 原文

● 钉钉发布全球首个为 AI 打造的工作智能操作系统 Agent OS
钉钉发布AI工作操作系统“Agent OS”,重构企业工作方式。系统作为全球首个为AI打造的工作智能操作系统,可统一调度和管理各类AI智能体。🔗 原文

● 扣子编程,开启免费公开测试
在火山引擎Force大会上,扣子开发平台正式升级为“扣子编程”并开启免费公开测试。此次升级标志着平台从AI应用搭建工具转型为赋能开发者创造力的平台。🔗 原文

● 即梦网页版全面升级,打造一站式AI片场
即梦AI网页版全面升级,打造一站式“AI片场”。核心更新包括:上线基于Seedance 1.5 Pro的“视频3.5 Pro”模型,支持音视频联合生成及方言口型匹配。🔗 原文

技术突破与开源

● Z.ai新突破:GLM-4.7登顶Artificial Analysis全球开源榜首
智谱AI宣布GLM-4.7模型在全球权威评测平台Artificial Analysis Intelligence Index中取得突破性成绩,以68分的综合得分荣登全球开源模型与国产模型双料榜首。🔗 原文

● MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA
通义实验室开源通用GUI智能体基座MAI-UI,登顶多项SOTA。模型原生集成用户交互、MCP工具调用与端云协同三大能力,能主动澄清模糊指令。🔗 原文

● MiniMax正式开源了MiniMax M2.1多语言编程模型
MiniMax公司宣布将MiniMax M2.1模型正式开源,已在Hugging Face和GitHub平台发布。模型专为真实世界复杂任务设计,在多语言编程、全栈开发、Web与App开发以及Agent能力方面表现卓越。🔗 原文

● 阿里最强“PS模型”开源:Qwen-Image-Edit-2511
阿里开源图像编辑模型Qwen-Image-Edit-2511,显著提升人物一致性与风格稳定性,集成LoRA模块实现光照、材质及视角控制。🔗 原文

● 生数科技联合清华发布 TurboDiffusion提速200倍
生数科技联合清华大学开源视频生成加速框架TurboDiffusion,最高可实现200倍推理加速,推动AI视频生成迈入“实时生成”时代。🔗 原文

● 字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5
字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。模型采用全新的Agentic Prover架构,能自主调用数学库搜索、代码执行等工具进行增量式证明。🔗 原文

● 阿里发布新一代端到端语音交互模型:Fun-Audio-Chat
阿里通义发布新一代端到端语音交互模型Fun-Audio-Chat,模型采用创新的端到端序列到序列架构,实现从语音输入直接生成语音输出,无需传统ASR+LLM+TTS多模块拼接,显著降低延迟。🔗 原文

2025年12月29日 • 周一
23:33

12月29日 AI日报:GLM-4.7登顶全球开源榜首 / 京东AI购上线 / 火山引擎成春晚独家AI合作伙伴

模型发布与开源

● Z.ai新突破:GLM-4.7登顶Artificial Analysis全球开源榜首
智谱AI宣布GLM-4.7模型在全球权威评测平台Artificial Analysis Intelligence Index中以68分综合得分荣登全球开源模型与国产模型双料榜首,位列全球总榜第六。🔗 原文

● MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA
通义实验室开源通用GUI智能体基座MAI-UI,原生集成用户交互、MCP工具调用与端云协同三大能力,能主动澄清模糊指令并优先调用结构化工具,显著提升任务成功率。🔗 原文

● MiniMax正式开源了MiniMax M2.1多语言编程模型
MiniMax公司宣布将MiniMax M2.1模型正式开源,已在Hugging Face和GitHub平台发布。模型专为真实世界复杂任务设计,在多语言编程、全栈开发、Web与App开发以及Agent能力方面表现卓越。🔗 原文

● 阶跃星辰推出高性价比深度研究模型 Step-DeepResearch
阶跃星辰开源320亿参数深度研究模型Step-DeepResearch,能在开放环境中自主探索信息并生成专业报告。其研究能力接近OpenAI o3-mini等顶级商业模型,但部署成本仅为传统模型的十分之一,单次调用成本低于0.5元人民币。🔗 原文

产品与应用

● 京东AI购抢先实测,一句话搞定吃喝穿用
京东上线AI原生应用“京东AI购”,目前处于App Store内测阶段。应用以对话为主要交互方式,用户通过自然语言即可完成外卖点单、商品导购等操作,核心功能包括“灵感空间”预设指令卡片、AI试穿及智能比价等。🔗 原文

● 腾讯元宝“任务”功能上线:一句话安排时间,到点就提醒
腾讯元宝AI助手正式上线“任务”功能,用户只需将时间安排或计划用一句话告知元宝,即可获得准时提醒服务。功能支持提前测试、手动管理和自定义提醒,需更新至最新版本使用。🔗 原文

● 蚂蚁旗下 AI 健康助手 AQ 启用中文名“蚂蚁阿福”
蚂蚁集团旗下的AI健康助手AQ更新版本并启用中文名“蚂蚁阿福”,同时上线“健康小目标”功能。应用可提供健康咨询、图片解读(报告、病例、处方、药盒均支持)、个人和家庭健康档案管理以及预约挂号、云陪诊等医疗健康服务。🔗 原文

● B站小红书视频一键变手绘分镜!开源神器ClipSketch AI,短视频创作者省时利器
ClipSketch AI是一款开源工具,可将长视频快速转为手绘风格故事板,并自动生成社交媒体文案,提升内容创作效率。其核心功能是支持解析B站、小红书等平台链接,智能提取视频内容。🔗 原文

融资与商业动态

● 九章云极宣布完成新一轮战略融资
人工智能基础设施提供商九章云极宣布完成新一轮战略融资,由北京信息产业发展投资基金与北京市人工智能产业投资基金联合领投。本轮融资将重点用于AI加速计算技术研发和普惠智算云平台建设。🔗 原文

● 曦诺未来宣布完成超亿元天使轮融资,宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资,由宁德时代旗下溥泉资本领投,小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1,拥有25个自由度,自重仅380克,负载超30公斤。🔗 原文

● 软银据称洽谈收购 DigitalBridge,加码 AI 数据中心基础设施
软银正就收购数字基础设施投资公司DigitalBridge进行深入谈判,最快或于周一宣布。此举旨在加速布局AI浪潮下的数据中心等数字资产,以应对生成式AI和算力需求的增长。🔗 原文

● 火山引擎官宣成为春晚独家AI云合作伙伴:从直播红包到AI大模型
火山引擎将深度参与2026年央视春晚制作,提供节目制作、线上互动和视频直播技术支持。作为字节跳动旗下云和AI服务平台,火山引擎曾成功保障2021年春晚703亿次红包互动,展现强大并发承载能力。🔗 原文

行业与政策

● 广州海珠区成立全国首个区级人工智能发展局
广州市海珠区成立全国首个区级人工智能发展局,旨在集中资源解决产业管理分散、资源不足等问题,推动人工智能产业发展。🔗 原文

● 微软CEO亲自出马:微软 Copilot 整合效果不佳,急需整改
微软CEO纳德拉对AI助手Copilot表现不满,亲自介入整改,批评其与Gmail和Outlook整合效果不佳且智能不足,近期频繁参与产品管理。🔗 原文

● OpenAI确认探索ChatGPT广告模式!免费用户或成新收入来源,2030年广告收入或达15亿美元
OpenAI正研究在ChatGPT中引入广告,以应对运营成本压力并维持免费服务。公司强调将探索尊重用户信任的广告形式,此前因Gemini用户激增暂缓,现因营收压力重新推进。🔗 原文

● ​年薪55.5万美元起!OpenAI全网寻人:紧急招募新任“防灾”负责人
OpenAI高薪招聘准备工作负责人,年薪约400万元,旨在应对AI前沿风险。CEO坦言当前模型已带来真实挑战,如计算机安全能力过强等问题。🔗 原文

技术突破

● 小红书开源 InstanceAssemble:让 AI 精准还原复杂图像排版
小红书与复旦大学联合推出布局控制生成方案InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述,在对应位置高精度生成图像,解决了布局对齐不准的行业难题。🔗 原文

● ​AI 编程利器再升级:Windsurf Wave13正式发布,SWE-1.5模型限时免费开放
Windsurf发布Wave13版本,聚焦模型能力、多智能体协同和终端体验升级。新版默认搭载SWE-1.5模型,具备SWE-Bench-Pro级别性能,可处理复杂代码任务。🔗 原文

● 腾讯 AI Lab 副主任离职,混元团队迎来新老交替,腾讯 AI 发展路在何方?
腾讯AI Lab副主任俞栋因个人发展原因离职,曾负责语音处理、自然语言处理及数字人技术研发,在深度学习和语音识别领域经验丰富。🔗 原文

2025年12月28日 • 周日
20:04

本周(2025-12-22起) AI日报:智谱/字节/MiniMax冲刺IPO / 钉钉发布Agent OS / 通义千问Qwen Code生态升级

大模型与开源

● 智谱AI上线并开源新一代大模型GLM-4.7
该版本在编码、推理与智能体能力上实现显著提升。在SWE-bench Verified中获得73.8%的SOTA分数,工具调用任务τ²-Bench得分87.4分,超越Claude Sonnet 4.5。
🔗 原文

● MiniMax发布新一代大模型MiniMax M2.1
该版本在多语言编程与真实世界复杂任务处理上实现显著突破。在SWE-bench Verified基准测试中获得74分,超越Claude Sonnet 4.5。其创新的VIBE基准测试显示,M2.1在全栈应用构建能力上接近顶级闭源模型水平。
🔗 原文

● 字节跳动发布新一代形式化数学推理专用模型Seed Prover 1.5
模型采用全新的Agentic Prover架构,能自主调用数学库搜索、代码执行等工具进行增量式证明。在IMO 2025测试中,模型以35/42的成绩达到金牌分数线;在Putnam竞赛历史题集上解决率达88%,刷新多项SOTA记录。
🔗 原文

● 阿里开源图像编辑模型Qwen-Image-Edit-2511
显著提升人物一致性与风格稳定性,集成LoRA模块实现光照、材质及视角控制。实测显示其人像融合、文字渲染效果自然,但几何推理与精细镜头控制仍有不足。
🔗 原文

● 小米正式发布并开源新模型MiMo-V2-Flash
模型采用MoE架构,总参数3090亿,活跃参数150亿。在多项基准测试中表现优异,其编程能力尤为突出,在SWE-bench测试中以73.4%的解决率超越所有开源模型。模型通过混合滑动窗口注意力、多Token预测等技术创新,实现了150 tokens/秒的高推理速度及极低的推理成本。
🔗 原文

● 英伟达开源通用游戏AI模型NitroGen
模型能通过观看游戏画面直接生成手柄操作信号,支持跨1000余款不同类型游戏的零样本游玩。模型基于4万小时游戏视频数据集训练,采用为机器人设计的GR00T架构,具备强大的跨游戏泛化能力。
🔗 原文

视频与音频生成

● 生数科技联合清华大学开源视频生成加速框架TurboDiffusion
最高可实现200倍推理加速,推动AI视频生成迈入“实时生成”时代。框架通过低比特注意力加速、稀疏-线性注意力等四项核心技术,在单张RTX 5090显卡上能将生成1080P高清视频的时间从分钟级压缩至秒级,几乎不影响生成质量。
🔗 原文

● 字节跳动发布新一代音视频创作模型Seedance 1.5 pro
实现音视频联合生成。模型支持从文本到音视频的合成及图像引导生成,在精准音画同步、多语言与方言口型匹配、电影级运镜控制及动态叙事表现上取得突破。
🔗 原文

● 美团发布并开源SOTA级虚拟人视频生成模型LongCat-Video-Avatar
模型在动作拟真度、长视频稳定性与身份一致性三大维度实现显著突破。模型原生支持音视频联合生成及视频续写等功能,通过创新的跨片段隐空间拼接技术,有效解决了长视频生成中的画质退化问题,可稳定生成5分钟高质量视频。
🔗 原文

● 阿里巴巴发布通义万相2.6多模态模型
是国内首个支持角色扮演功能的视频生成系统。模型支持音画同步、多镜头叙事和音频驱动生成,可直出15秒高清视频。角色扮演功能允许用户上传参考视频,AI能复刻角色外观与音色,生成单人或多人表演内容。
🔗 原文

● 阿里通义发布新一代端到端语音交互模型Fun-Audio-Chat
模型采用创新的端到端序列到序列架构,实现从语音输入直接生成语音输出,无需传统ASR+LLM+TTS多模块拼接,显著降低延迟。在OpenAudioBench、MMAU等多个权威评测中,模型在同尺寸模型中排名第一,综合性能超越GLM4-Voice、Kimi-Audio等主流产品。
🔗 原文

● Meta发布首个统一多模态音频分离模型SAM Audio
支持通过文本、视觉或时间段提示从复杂音频中精准提取目标声音。模型基于感知编码器视听技术,用户可点击视频中物体分离对应音频,或输入“狗吠”等文本指令过滤噪音。
🔗 原文

AI编程与开发工具

● 智谱推出轻量级AI IDE编程工具:Zcode
深度融合AI Agent与开发工具链。工具支持跨仓库全代码库理解、多仓库上下文推理及自动化代码审查,具备对话变更自动保存、代码回滚、可视化Git界面等功能,针对前端开发集成内置浏览器和元素选择器,助力开发者高效协作,无缝融入现有工作流。
🔗 原文

● 通义千问Qwen Code发布v0.5.0版本
实现从命令行工具向开发生态的关键升级。本次更新重磅推出VSCode插件,开发者可在IDE内直接唤出AI对话界面进行编程。同时发布的TypeScript SDK允许开发者以编程方式集成其智能能力,便于构建Web或移动应用。
🔗 原文

● OpenAI发布迄今最先进的智能体编码模型GPT-5.2-Codex
模型在复杂软件工程任务中实现重大突破。新版本显著提升了指令遵循能力、长上下文理解及网络安全防护性能,在SWE-Bench Pro和Terminal-Bench 2.0等基准测试中达到最先进水平。独特的上下文压缩技术可高效处理大型代码库,支持复杂重构与迁移任务。
🔗 原文

AI应用与产品

● 钉钉发布全球首个为AI打造的工作智能操作系统Agent OS
重构企业工作方式。系统作为全球首个为AI打造的工作智能操作系统,可统一调度和管理各类AI智能体。核心组件包括交互界面“钉钉ONE”、通用智能体“悟空”及企业级AI硬件“DingTalk Real”。
🔗 原文

● 小红书开源InstanceAssemble:让AI精准还原复杂图像排版
小红书与复旦大学联合推出布局控制生成方案InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述,在对应位置高精度生成图像,解决了布局对齐不准的行业难题。
🔗 原文

● 商汤科技发布AI办公智能体“小浣熊3.0”
实现从生成草稿到交付成品的三大跃迁。智能体具备一键生成高质量PPT能力,支持图表、图片等全元素编辑,可交付直接可用的演示文稿。其“长链条思考”能力支持百万级数据量秒级处理与多模态分析,能深度理解复杂任务。
🔗 原文

● 腾讯正式发布混元世界模型1.5(WorldPlay)
是国内首个支持实时交互体验的世界模型。用户通过文字或图片输入即可生成专属3D互动世界,能通过键盘、鼠标或手柄自由探索。模型具备24FPS实时生成、分钟级3D几何一致性及空间记忆能力,离开后返回场景保持一致。
🔗 原文

● 苹果公司宣布开源其新型AI模型SHARP
能在一秒内将单张2D照片转换为逼真的3D场景。与传统方案相比,处理速度提升了三个数量级,实现了近乎实时的3D转换体验。模型基于先进的3D高斯泼溅技术,通过神经网络单次前馈即可预测数百万个3D高斯球的位置与外观。
🔗 原文

行业动态与融资

● MiniMax通过港交所聆讯,有望成为“AGI全球第一股”
MiniMax通过港交所聆讯并披露招股书,冲刺IPO。MiniMax成立于2022年初,若成功上市,将是全球从成立到IPO最快的AI公司。2024年,MiniMax收入同比增长782%至3050万美元,净亏损为4.65亿美元。
🔗 原文

● 智谱冲刺港股“大模型第一股”,估值244亿
智谱通过港交所聆讯,冲刺港股“大模型第一股”。智谱成立于2019年6月,是中国最大型的独立通用大模型开发商、中国第二大整体通用大模型开发商。其MaaS平台提供语言、多模态、智能体、代码四类模型,支持本地化和云端部署。2025年11月,智谱日均token消耗量达4.2万亿,已为约8000万台设备提供支持。
🔗 原文

● 曦诺未来宣布完成超亿元天使轮融资,宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资,由宁德时代旗下溥泉资本领投,小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1,拥有25个自由度,自重仅380克,负载超30公斤。
🔗 原文

● 面壁智能完成数亿元融资,加码投入领跑端侧AI
面壁智能近日宣布完成数亿元融资,投资方包括京国瑞、国科投资、中金保时捷基金等多家机构。本轮融资将主要用于加大端侧高效大模型的研发投入,加速端侧AI的商业化进程。
🔗 原文

2025年12月26日 • 周五
18:00

2025-12-26 AI日报:智谱Zcode/Qwen Code升级/小红书开源InstanceAssemble/曦诺未来融资/元宝报告/Grok接管X算法

🇨🇳 国内动态

智谱推出轻量级AI IDE编程工具:Zcode
智谱发布AI编程工具Zcode,深度融合AI Agent与开发工具链,支持跨仓库全代码库理解、多仓库上下文推理及自动化代码审查,具备对话变更自动保存、代码回滚、可视化Git界面等功能,针对前端开发集成内置浏览器和元素选择器。
🔗 直达原文

Qwen Code重磅更新:让AI编程跳出命令行
通义千问Qwen Code发布v0.5.0版本,实现从命令行工具向开发生态的关键升级。本次更新重磅推出VSCode插件,开发者可在IDE内直接唤出AI对话界面进行编程。同时发布的TypeScript SDK允许开发者以编程方式集成其智能能力。
🔗 直达原文

小红书开源InstanceAssemble:让AI精准还原复杂图像排版
小红书与复旦大学联合推出布局控制生成方案InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述,在对应位置高精度生成图像,解决了布局对齐不准的行业难题。
🔗 直达原文

曦诺未来宣布完成超亿元天使轮融资,宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资,由宁德时代旗下溥泉资本领投,小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1,拥有25个自由度,自重仅380克,负载超30公斤。
🔗 直达原文

元宝X混元2025年度报告发布:超7成用户请求选择快思考模式
元宝平台2025年报告显示,混元大模型实现AI能力多维度升级。平台提供“快思考”与“深度思考”两种模式:超七成用户选择“快思考”,近半数问题首轮即可解决;“深度思考”适用于复杂场景,对话通常持续三轮以上,近半数能输出多步骤结构化内容。
🔗 直达原文

腾讯元宝电脑端上线“录音笔”功能:多端同步与长音频转写效率升级
腾讯AI应用“元宝”PC端新增“录音笔”功能,强化办公场景生产力。此次更新实现了移动端与桌面端的协同闭环,用户可直接在电脑上录音或上传音频文件,无需跨设备传输,提升了音频处理效率。
🔗 直达原文

快看漫画联手MiniMax发布AI互动漫画,首批顶级IP已开启沉浸模式
快看漫画推出“AI陪伴互动漫画”,结合AI技术让漫画角色“活”起来,标志着漫画行业进入“AI体验第四赛道”。该产品由MiniMax提供技术支持,融合视频与语音生成模型,为用户带来沉浸式互动体验。
🔗 直达原文

联想将发布全球首款“AI超级智能体”,全生态硬件互联对标豆包
联想将在CES发布首款全球AI超级智能体,对标字节跳动“豆包手机助手”,通过系统级AI应用重塑硬件交互体验,展现其AI战略布局。
🔗 直达原文

🌍 全球前沿

Grok全面接管X算法!每日分析超1亿帖子,彻底颠覆信息流体验
社交平台X(原Twitter)宣布其推荐系统全面升级,由xAI开发的Grok大模型驱动,从传统规则转向纯AI智能推荐。该变革旨在为全球用户提供更精准、个性化的内容体验,被视为社交媒体算法演进的重要里程碑。Grok每日处理超过1亿条帖子。
🔗 直达原文

NVIDIA+斯坦福联手放大招!开源AI“通玩”1000款游戏,4万小时训练数据全公开
NVIDIA与斯坦福大学联合发布通用游戏AI智能体NitroGen,在1000多款游戏、4万小时数据上训练而成,具备强大跨游戏泛化能力。研究团队将开源数据集和模型权重,推动全球AI与游戏研究发展。
🔗 直达原文

AI编程圣诞大战打响!OpenAI推节日版Codex,三巨头齐发限时福利抢夺开发者
圣诞假期期间,OpenAI、Anthropic与Google纷纷推出AI编程工具节日促销活动,通过模型升级、额度翻倍和价格优惠等方式吸引开发者。OpenAI上线“圣诞版Codex”,API额度翻倍,旨在抢占技术人群市场,掀起一场年终AI编程竞赛。
🔗 直达原文

2.6B参数碾压百亿级巨兽!Liquid AI最新实验性模型LFM2-2.6B-Exp发布
圣诞节当天,边缘AI初创公司Liquid AI发布开源模型LFM2-2.6B-Exp,仅26亿参数,却在多项基准测试中表现优异,指令跟随能力甚至超越数百亿参数的DeepSeek R1-0528,被赞为“最强3B级模型”。该模型基于第二代LFM2基础模型,通过纯强化学习实现实验性突破。
🔗 直达原文

OpenAI、Meta狂撒真金白银,AI人才争夺战已卷入底层系统
科技巨头为争夺AI人才,已将战火蔓延至实习生与研究员。Meta等公司开出媲美全职岗位的高薪,甚至以巨额投资锁定核心团队,凸显行业对顶尖后备军的激烈争夺。
🔗 直达原文

三星日历应用迎来AI大更新:自动生成视觉背景与智能化体验
三星日历应用通过One UI 8.5更新引入AI功能,可根据日程标题自动生成匹配的视觉背景,提升交互体验。
🔗 直达原文

ChatGPT界面大升级!OpenAI上线“富文本编辑块”,写邮件、写博客无需再复制到Word
OpenAI为ChatGPT推出“格式化模块”功能,用户可在聊天界面直接使用富文本编辑工具,如加粗、斜体等,无需借助外部编辑器,提升了结构化内容创作的便捷性。
🔗 直达原文

意大利勒令Meta暂停WhatsApp AI禁令!欧盟同步调查,Meta被指滥用市场支配地位打压竞品聊天机器人
意大利监管机构紧急叫停Meta限制第三方AI接入WhatsApp Business API的政策,认为其涉嫌滥用市场支配地位,损害AI市场竞争与消费者利益。此举紧随欧盟同类调查,显示欧洲正对Meta的AI入口布局展开系统性反垄断审查。
🔗 直达原文

🛠️ 工具与开源

TurboDiffusion:AI视频加速框架,最高可实现200倍推理加速
生数科技联合清华大学开源视频生成加速框架TurboDiffusion,最高可实现200倍推理加速,推动AI视频生成迈入“实时生成”时代。框架通过低比特注意力加速、稀疏-线性注意力等四项核心技术,在单张RTX 5090显卡上能将生成1080P高清视频的时间从分钟级压缩至秒级,几乎不影响生成质量。
🔗 直达原文

1美元跑200个浏览器任务!开源浏览器操控神器BU-30B-A3B-Preview横空出世
开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview,被誉为网页代理领域新标杆。该模型采用混合专家(MoE)架构,总参数达300亿,但推理时仅激活部分参数,兼顾强大性能与轻量化运行,显著降低了AI浏览器操作的成本与门槛。
🔗 直达原文

灵光公布最新数据,上线1个月用户成功创建1200万个闪应用
通用AI助手灵光宣布其“闪应用”功能已创建1200万个应用。用户无需编程,仅用自然语言描述需求,最快30秒即可生成可编辑、可交互的小应用。上线两周时创建量为330万个,不到一个月迅速增长,显示该产品正被普通用户广泛接受和持续使用。
🔗 直达原文

2025年12月25日 • 周四
18:00

2025-12-25 AI日报:智谱推出轻量级AI IDE编程工具Zcode / 通义千问Qwen Code重磅升级至v0.5.0 / 小红书联合复旦开源InstanceAssemble

模型与框架

● 智谱推出轻量级AI IDE编程工具:Zcode
智谱发布AI编程工具Zcode,深度融合AI Agent与开发工具链,支持跨仓库全代码库理解、多仓库上下文推理及自动化代码审查,具备对话变更自动保存、代码回滚、可视化Git界面等功能,针对前端开发集成内置浏览器和元素选择器。🔗 原文

● 通义千问Qwen Code重磅升级至v0.5.0!从命令行工具迈向完整开发生态
阿里云通义实验室发布Qwen Code v0.5.0版本,国产AI编程工具从命令行工具升级为全链路开发生态平台。新版本强化核心编码能力,并突破插件集成、工程上下文理解和开发者协作支持,引入多工具协同架构,构建开发者“数字工作台”。🔗 原文

● 小红书联合复旦开源 InstanceAssemble:实现 AI 图像精准排版控制
小红书与复旦大学联合发布AI绘画新技术InstanceAssemble,解决AI绘画“构图难”问题,实现从简单到复杂场景的精准图像生成。相关论文已被顶级会议NeurIPS2025收录。🔗 原文

● 2.6B参数碾压百亿级巨兽!Liquid AI最新实验性模型LFM2-2.6B-Exp发布
圣诞节当天,边缘AI初创公司Liquid AI发布开源模型LFM2-2.6B-Exp,仅26亿参数,却在多项基准测试中表现优异,指令跟随能力甚至超越数百亿参数的DeepSeek R1-0528,被赞为“最强3B级模型”。该模型基于第二代LFM2基础模型,通过纯强化学习实现实验性突破。🔗 原文

● 1美元跑200个浏览器任务!开源浏览器操控神器BU-30B-A3B-Preview横空出世
近日,开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview,被誉为网页代理领域新标杆。该模型采用混合专家(MoE)架构,总参数达300亿,但推理时仅激活部分参数,兼顾强大性能与轻量化运行,显著降低了AI浏览器操作的成本与门槛。🔗 原文

产品与发布

● 灵光公布最新数据,上线1个月用户成功创建1200万个闪应用
通用AI助手灵光宣布其“闪应用”功能已创建1200万个应用。用户无需编程,仅用自然语言描述需求,最快30秒即可生成可编辑、可交互的小应用。上线两周时创建量为330万个,不到一个月迅速增长,显示该产品正被普通用户广泛接受和持续使用。🔗 原文

● ChatGPT界面大升级!OpenAI上线“富文本编辑块”,写邮件、写博客无需再复制到Word
OpenAI为ChatGPT推出“格式化模块”功能,用户可在聊天界面直接使用富文本编辑工具,如加粗、斜体等,无需借助外部编辑器,提升了结构化内容创作的便捷性。🔗 原文

● ​腾讯元宝电脑端上线“录音笔”功能:多端同步与长音频转写效率升级
腾讯AI应用“元宝”PC端新增“录音笔”功能,强化办公场景生产力。此次更新实现了移动端与桌面端的协同闭环,用户可直接在电脑上录音或上传音频文件,无需跨设备传输,提升了音频处理效率。🔗 原文

● 三星日历应用迎来 AI 大更新:自动生成视觉背景与智能化体验
三星日历应用通过One UI 8.5更新引入AI功能,可根据日程标题自动生成匹配的视觉背景,提升交互体验。🔗 原文

● ​联想将发布全球首款“AI超级智能体”,全生态硬件互联对标豆包
联想将在CES发布首款全球AI超级智能体,对标字节跳动“豆包手机助手”,通过系统级AI应用重塑硬件交互体验,展现其AI战略布局。🔗 原文

行业与融资

● AI编程圣诞大战打响!OpenAI推节日版Codex,三巨头齐发限时福利抢夺开发者
圣诞假期期间,OpenAI、Anthropic与Google纷纷推出AI编程工具节日促销活动,通过模型升级、额度翻倍和价格优惠等方式吸引开发者。OpenAI上线“圣诞版Codex”,API额度翻倍,旨在抢占技术人群市场,掀起一场年终AI编程竞赛。🔗 原文

● OpenAI、Meta 狂撒真金白银,AI 人才争夺战已卷入底层系统
科技巨头为争夺AI人才,已将战火蔓延至实习生与研究员。Meta等公司开出媲美全职岗位的高薪,甚至以巨额投资锁定核心团队,凸显行业对顶尖后备军的激烈争夺。🔗 原文

● 快看漫画联手 MiniMax 发布 AI 互动漫画 首批顶级 IP 已开启沉浸模式
快看漫画推出“AI陪伴互动漫画”,结合AI技术让漫画角色“活”起来,标志着漫画行业进入“AI体验第四赛道”。该产品由MiniMax提供技术支持,融合视频与语音生成模型,为用户带来沉浸式互动体验。🔗 原文

● 意大利勒令Meta暂停WhatsApp AI禁令!欧盟同步调查,Meta被指滥用市场支配地位打压竞品聊天机器人
意大利监管机构紧急叫停Meta限制第三方AI接入WhatsApp Business API的政策,认为其涉嫌滥用市场支配地位,损害AI市场竞争与消费者利益。此举紧随欧盟同类调查,显示欧洲正对Meta的AI入口布局展开系统性反垄断审查。核心争议在于政策为何只禁ChatGPT类AI,却不禁客服机器人。🔗 原文

● 迈向智能时代:PayPal 高管揭示 AI 技术的未来趋势
信息时代因计算机小型化和万维网普及而兴起,但人工智能的崛起标志着其终结。PayPal高管指出,我们已从信息时代进入新阶段,AI正重塑技术格局。🔗 原文

● 工信部:2023 年人工智能产业首次突破万亿大关
工信部数据显示,2023年电信业务总量预计增长约9%,软件业务收入增长约12%,数字产业收入增长约9%,体现了我国数字经济发展势头良好,产业链供应链韧性增强。🔗 原文

应用与工具

● 一键生成能动的GIF表情包
优化了AI视频的门路,价格低至4.9元一次。表情包彻底自由,上传一张人物图片,全自动一次性生成16张能动的GIF表情图。🔗 原文

● Infographic:蚂蚁开源的信息图可视化引擎
内置200多套模板,适合用来画信息图、流程图,生成的内容可以编辑,用来做PPT也不错。🔗 原文

● 把Banana图片变成可编辑的PPT文件
这个网站可以把Banana生成的PPT图片,OCR成可以编辑的PPT源文件,准确度不错,但是细节的切分会稍有问题。只有5次免费次数。🔗 原文

2025年12月24日 • 周三
18:00

2025-12-24 AI日报:字节发布Seed Prover 1.5 / 上海与商汤发布规划资源AI大模型 / 云深处科技启动上市辅导

模型与算法

● 字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5
字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5,采用全新的Agentic Prover架构,能自主调用数学库搜索、代码执行等工具进行增量式证明。在IMO 2025测试中,模型以35/42的成绩达到金牌分数线;在Putnam竞赛历史题集上解决率达88%,刷新多项SOTA记录。
🔗 原文

● 上海与商汤发布规划资源 AI 基础大模型
全国首个规划资源领域AI大模型“云宇星空”(专业版)近日在上海正式发布。模型由上海市规划资源局与商汤科技联合研发,具备“问不倒、能调图、会统计、能识图、会报告”五大核心能力,参数量达6000亿。
🔗 原文

行业与融资

● 云深处科技已正式启动上市辅导
杭州云深处科技股份有限公司已启动上市辅导,辅导机构为中信建投证券。公司成立于2017年,专注于四足及人形机器人研发,创始人朱秋国为浙江大学副教授,目前合计控制公司32.60%的股份。云深处科技近期完成了超5亿元人民币的C轮融资,并于11月初完成股改。
🔗 原文

● 面壁智能完成数亿元融资,加码投入领跑端侧 AI
面壁智能近日宣布完成数亿元融资,投资方包括京国瑞、国科投资、中金保时捷基金等多家机构。本轮融资将主要用于加大端侧高效大模型的研发投入,加速端侧AI的商业化进程。
🔗 原文

产品与工具

● 钉钉发布全球首个为 AI 打造的工作智能操作系统 Agent OS
钉钉发布AI工作操作系统“Agent OS”,重构企业工作方式。系统作为全球首个为AI打造的工作智能操作系统,可统一调度和管理各类AI智能体。核心组件包括交互界面“钉钉ONE”、通用智能体“悟空”及企业级AI硬件“DingTalk Real”。
🔗 原文

● 智谱推出轻量级AI IDE编程工具:Zcode
智谱推出AI编程工具Zcode,深度融合AI Agent与开发工具链。工具支持跨仓库全代码库理解、多仓库上下文推理及自动化代码审查,具备对话变更自动保存、代码回滚、可视化Git界面等功能,针对前端开发集成内置浏览器和元素选择器,助力开发者高效协作,无缝融入现有工作流。
🔗 原文

● Qwen Code 重磅更新:让 AI 编程跳出命令行
通义千问Qwen Code发布v0.5.0版本,实现从命令行工具向开发生态的关键升级。本次更新重磅推出VSCode插件,开发者可在IDE内直接唤出AI对话界面进行编程。同时发布的TypeScript SDK允许开发者以编程方式集成其智能能力,便于构建Web或移动应用。
🔗 原文

● Skywork Sheets 2.0重磅上线:一键解锁高效办公新体验
Skywork Sheets 2.0版本近日正式上线,核心突破在于实现了“表格与报告的深度融合”。用户仅需输入数据,AI即可自动完成整理分析、生成可视化图表并撰写完整报告,实现“输入数据,输出成果”的闭环。
🔗 原文

● 小红书开源 InstanceAssemble:让 AI 精准还原复杂图像排版
小红书与复旦大学联合推出布局控制生成方案InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述,在对应位置高精度生成图像,解决了布局对齐不准的行业难题。
🔗 原文

● 曦诺未来宣布完成超亿元天使轮融资,宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资,由宁德时代旗下溥泉资本领投,小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1,拥有25个自由度,自重仅380克,负载超30公斤。
🔗 原文

● 阿里最强“PS模型”开源:Qwen-Image-Edit-2511
阿里开源图像编辑模型Qwen-Image-Edit-2511,显著提升人物一致性与风格稳定性,集成LoRA模块实现光照、材质及视角控制。实测显示其人像融合、文字渲染效果自然,但几何推理与精细镜头控制仍有不足。
🔗 原文

● 生数科技联合清华发布 TurboDiffusion提速200倍
生数科技联合清华大学开源视频生成加速框架TurboDiffusion,最高可实现200倍推理加速,推动AI视频生成迈入“实时生成”时代。框架通过低比特注意力加速、稀疏-线性注意力等四项核心技术,在单张RTX 5090显卡上能将生成1080P高清视频的时间从分钟级压缩至秒级,几乎不影响生成质量。
🔗 原文

● GLM-4.7上线并开源:更强的编码
智谱AI正式上线并开源新一代大模型GLM-4.7,该版本在编码、推理与智能体能力上实现显著提升。在多项主流基准测试中,编程能力达到开源模型领先水平,在SWE-bench Verified中获得73.8%的SOTA分数,工具调用任务τ²-Bench得分87.4分,超越Claude Sonnet 4.5。
🔗 原文

● MiniMax M2.1:多语言编程SOTA,为真实世界复杂任务而生
MiniMax发布新一代大模型MiniMax M2.1,该版本在多语言编程与真实世界复杂任务处理上实现显著突破。模型系统性提升了Rust、Java、Golang等十余种编程语言能力,在SWE-bench Verified基准测试中获得74分,超越Claude Sonnet 4.5。其创新的VIBE基准测试显示,M2.1在全栈应用构建能力上接近顶级闭源模型水平。
🔗 原文

● 阿里发布新一代端到端语音交互模型:Fun-Audio-Chat
阿里通义发布新一代端到端语音交互模型Fun-Audio-Chat,模型采用创新的端到端序列到序列架构,实现从语音输入直接生成语音输出,无需传统ASR+LLM+TTS多模块拼接,显著降低延迟。在OpenAudioBench、MMAU等多个权威评测中,模型在同尺寸模型中排名第一,综合性能超越GLM4-Voice、Kimi-Audio等主流产品。
🔗 原文

● 英伟达新模型NitroGen能打遍几乎所有游戏
英伟达开源通用游戏AI模型NitroGen,模型能通过观看游戏画面直接生成手柄操作信号,支持跨1000余款不同类型游戏的零样本游玩。模型基于4万小时游戏视频数据集训练,采用为机器人设计的GR00T架构,具备强大的跨游戏泛化能力。
🔗 原文

● 通用Agent模型Seed1.8正式发布
字节跳动正式发布通用Agent模型Seed1.8,模型集成了搜索、代码生成与图形界面交互等多元能力,支持图文输入并具备原生视觉理解功能。在多项基准测试中表现优异,其在GUI Agent任务上的OSWorld得分达61.9,搜索任务BrowseComp-en得分67.6,均处于行业领先水平。
🔗 原文

● 更大更强!限时免费!阶跃星辰 GUI Agent 全面升级
阶跃星辰宣布其GUI Agent模型Step-GUI全面升级,新版模型支持200多个任务场景,具备更长推理步骤、更强语义理解与泛化能力。模型可在手机、PC、汽车等多端使用,并实现最短10分钟快速部署。公司开放了API供免费使用,并公开发布了技术报告与GUI-MCP协议。
🔗 原文

● Meta 发布 SAM Audio,多模态音频分离新突破
Meta发布首个统一多模态音频分离模型SAM Audio,支持通过文本、视觉或时间段提示从复杂音频中精准提取目标声音。模型基于感知编码器视听技术,用户可点击视频中物体分离对应音频,或输入”狗吠”等文本指令过滤噪音。
🔗 原文

点击加载更多