2025-12-23 AI日报：智谱开源GLM-4.7 / MiniMax发布M2.1 / 阿里发布Fun-Audio-Chat

模型发布与开源

● 智谱AI正式上线并开源新一代大模型GLM-4.7
该版本在编码、推理与智能体能力上实现显著提升，在SWE-bench Verified中获得73.8%的SOTA分数，工具调用任务τ²-Bench得分87.4分，超越Claude Sonnet 4.5。🔗 原文

● MiniMax发布新一代大模型MiniMax M2.1
该版本在多语言编程与真实世界复杂任务处理上实现显著突破，在SWE-bench Verified基准测试中获得74分，超越Claude Sonnet 4.5，其创新的VIBE基准测试显示全栈应用构建能力接近顶级闭源模型水平。🔗 原文

● 阿里通义发布新一代端到端语音交互模型Fun-Audio-Chat
模型采用创新的端到端序列到序列架构，实现从语音输入直接生成语音输出，无需传统ASR+LLM+TTS多模块拼接，显著降低延迟。在OpenAudioBench、MMAU等多个权威评测中，模型在同尺寸模型中排名第一。🔗 原文

融资与商业动态

● 面壁智能完成数亿元融资，加码投入领跑端侧AI
面壁智能近日宣布完成数亿元融资，投资方包括京国瑞、国科投资、中金保时捷基金等多家机构。本轮融资将主要用于加大端侧高效大模型的研发投入，加速端侧AI的商业化进程。🔗 原文

● 钉钉发布全球首个为AI打造的工作智能操作系统Agent OS
钉钉发布AI工作操作系统“Agent OS”，重构企业工作方式。系统作为全球首个为AI打造的工作智能操作系统，可统一调度和管理各类AI智能体。核心组件包括交互界面“钉钉ONE”、通用智能体“悟空”及企业级AI硬件“DingTalk Real”。🔗 原文

行业动态与产品更新

● 智谱推出轻量级AI IDE编程工具：Zcode
智谱推出AI编程工具Zcode，深度融合AI Agent与开发工具链。工具支持跨仓库全代码库理解、多仓库上下文推理及自动化代码审查，具备对话变更自动保存、代码回滚、可视化Git界面等功能，针对前端开发集成内置浏览器和元素选择器。🔗 原文

● Qwen Code重磅更新：让AI编程跳出命令行
通义千问Qwen Code发布v0.5.0版本，实现从命令行工具向开发生态的关键升级。本次更新重磅推出VSCode插件，开发者可在IDE内直接唤出AI对话界面进行编程。同时发布的TypeScript SDK允许开发者以编程方式集成其智能能力。🔗 原文

● Skywork Sheets 2.0重磅上线：一键解锁高效办公新体验
Skywork Sheets 2.0版本近日正式上线，核心突破在于实现了“表格与报告的深度融合”。用户仅需输入数据，AI即可自动完成整理分析、生成可视化图表并撰写完整报告，实现“输入数据，输出成果”的闭环。🔗 原文

● 小红书开源InstanceAssemble：让AI精准还原复杂图像排版
小红书与复旦大学联合推出布局控制生成方案InstanceAssemble，通过创新“实例组装注意力”机制，实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述，在对应位置高精度生成图像。🔗 原文

● 曦诺未来宣布完成超亿元天使轮融资，宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资，由宁德时代旗下溥泉资本领投，小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1，拥有25个自由度，自重仅380克，负载超30公斤。🔗 原文

● 阿里最强“PS模型”开源：Qwen-Image-Edit-2511
阿里开源图像编辑模型Qwen-Image-Edit-2511，显著提升人物一致性与风格稳定性，集成LoRA模块实现光照、材质及视角控制。实测显示其人像融合、文字渲染效果自然，但几何推理与精细镜头控制仍有不足。🔗 原文

● 生数科技联合清华发布TurboDiffusion提速200倍
生数科技联合清华大学开源视频生成加速框架TurboDiffusion，最高可实现200倍推理加速，推动AI视频生成迈入“实时生成”时代。框架通过低比特注意力加速、稀疏-线性注意力等四项核心技术，在单张RTX 5090显卡上能将生成1080P高清视频的时间从分钟级压缩至秒级。🔗 原文

● 字节跳动发布新一代形式化数学推理专用模型Seed Prover 1.5
字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。模型采用全新的Agentic Prover架构，能自主调用数学库搜索、代码执行等工具进行增量式证明。在IMO 2025测试中，模型以35/42的成绩达到金牌分数线；在Putnam竞赛历史题集上解决率达88%。🔗 原文

● 上海与商汤发布规划资源AI基础大模型
全国首个规划资源领域AI大模型“云宇星空”（专业版）近日在上海正式发布。模型由上海市规划资源局与商汤科技联合研发，具备“问不倒、能调图、会统计、能识图、会报告”五大核心能力，参数量达6000亿。🔗 原文

● 云深处科技已正式启动上市辅导
杭州云深处科技股份有限公司已启动上市辅导，辅导机构为中信建投证券。公司成立于2017年，专注于四足及人形机器人研发，创始人朱秋国为浙江大学副教授，目前合计控制公司32.60%的股份。云深处科技近期完成了超5亿元人民币的C轮融资。🔗 原文

● 英伟达新模型NitroGen能打遍几乎所有游戏
英伟达开源通用游戏AI模型NitroGen，模型能通过观看游戏画面直接生成手柄操作信号，支持跨1000余款不同类型游戏的零样本游玩。模型基于4万小时游戏视频数据集训练，采用为机器人设计的GR00T架构，具备强大的跨游戏泛化能力。🔗 原文

● 扣子编程，开启免费公开测试
在火山引擎Force大会上，扣子开发平台正式升级为“扣子编程”并开启免费公开测试。此次升级标志着平台从AI应用搭建工具转型为赋能开发者创造力的平台，推出全新的Vibe Coding开发范式。用户只需用自然语言描述业务需求，即可自动生成智能体、工作流及跨端应用。🔗 原文

● OpenAI最强代码模型GPT-5.2-Codex上线
OpenAI发布迄今最先进的智能体编码模型GPT-5.2-Codex，模型在复杂软件工程任务中实现重大突破。新版本显著提升了指令遵循能力、长上下文理解及网络安全防护性能，在SWE-Bench Pro和Terminal-Bench 2.0等基准测试中达到最先进水平。🔗 原文