2025-12-23 AI日报:智谱开源GLM-4.7 / MiniMax发布M2.1 / 阿里发布Fun-Audio-Chat

模型发布与开源

● 智谱AI正式上线并开源新一代大模型GLM-4.7
该版本在编码、推理与智能体能力上实现显著提升,在SWE-bench Verified中获得73.8%的SOTA分数,工具调用任务τ²-Bench得分87.4分,超越Claude Sonnet 4.5。🔗 原文

● MiniMax发布新一代大模型MiniMax M2.1
该版本在多语言编程与真实世界复杂任务处理上实现显著突破,在SWE-bench Verified基准测试中获得74分,超越Claude Sonnet 4.5,其创新的VIBE基准测试显示全栈应用构建能力接近顶级闭源模型水平。🔗 原文

● 阿里通义发布新一代端到端语音交互模型Fun-Audio-Chat
模型采用创新的端到端序列到序列架构,实现从语音输入直接生成语音输出,无需传统ASR+LLM+TTS多模块拼接,显著降低延迟。在OpenAudioBench、MMAU等多个权威评测中,模型在同尺寸模型中排名第一。🔗 原文

融资与商业动态

● 面壁智能完成数亿元融资,加码投入领跑端侧AI
面壁智能近日宣布完成数亿元融资,投资方包括京国瑞、国科投资、中金保时捷基金等多家机构。本轮融资将主要用于加大端侧高效大模型的研发投入,加速端侧AI的商业化进程。🔗 原文

● 钉钉发布全球首个为AI打造的工作智能操作系统Agent OS
钉钉发布AI工作操作系统“Agent OS”,重构企业工作方式。系统作为全球首个为AI打造的工作智能操作系统,可统一调度和管理各类AI智能体。核心组件包括交互界面“钉钉ONE”、通用智能体“悟空”及企业级AI硬件“DingTalk Real”。🔗 原文

行业动态与产品更新

● 智谱推出轻量级AI IDE编程工具:Zcode
智谱推出AI编程工具Zcode,深度融合AI Agent与开发工具链。工具支持跨仓库全代码库理解、多仓库上下文推理及自动化代码审查,具备对话变更自动保存、代码回滚、可视化Git界面等功能,针对前端开发集成内置浏览器和元素选择器。🔗 原文

● Qwen Code重磅更新:让AI编程跳出命令行
通义千问Qwen Code发布v0.5.0版本,实现从命令行工具向开发生态的关键升级。本次更新重磅推出VSCode插件,开发者可在IDE内直接唤出AI对话界面进行编程。同时发布的TypeScript SDK允许开发者以编程方式集成其智能能力。🔗 原文

● Skywork Sheets 2.0重磅上线:一键解锁高效办公新体验
Skywork Sheets 2.0版本近日正式上线,核心突破在于实现了“表格与报告的深度融合”。用户仅需输入数据,AI即可自动完成整理分析、生成可视化图表并撰写完整报告,实现“输入数据,输出成果”的闭环。🔗 原文

● 小红书开源InstanceAssemble:让AI精准还原复杂图像排版
小红书与复旦大学联合推出布局控制生成方案InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述,在对应位置高精度生成图像。🔗 原文

● 曦诺未来宣布完成超亿元天使轮融资,宁德时代和小米投了
杭州灵巧手企业曦诺未来今日宣布完成超亿元天使轮融资,由宁德时代旗下溥泉资本领投,小米战投等跟投。该公司成立数月即研发出全球首款全自研高自由度腱绳驱动灵巧手Xynova Flex 1,拥有25个自由度,自重仅380克,负载超30公斤。🔗 原文

● 阿里最强“PS模型”开源:Qwen-Image-Edit-2511
阿里开源图像编辑模型Qwen-Image-Edit-2511,显著提升人物一致性与风格稳定性,集成LoRA模块实现光照、材质及视角控制。实测显示其人像融合、文字渲染效果自然,但几何推理与精细镜头控制仍有不足。🔗 原文

● 生数科技联合清华发布TurboDiffusion提速200倍
生数科技联合清华大学开源视频生成加速框架TurboDiffusion,最高可实现200倍推理加速,推动AI视频生成迈入“实时生成”时代。框架通过低比特注意力加速、稀疏-线性注意力等四项核心技术,在单张RTX 5090显卡上能将生成1080P高清视频的时间从分钟级压缩至秒级。🔗 原文

● 字节跳动发布新一代形式化数学推理专用模型Seed Prover 1.5
字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。模型采用全新的Agentic Prover架构,能自主调用数学库搜索、代码执行等工具进行增量式证明。在IMO 2025测试中,模型以35/42的成绩达到金牌分数线;在Putnam竞赛历史题集上解决率达88%。🔗 原文

● 上海与商汤发布规划资源AI基础大模型
全国首个规划资源领域AI大模型“云宇星空”(专业版)近日在上海正式发布。模型由上海市规划资源局与商汤科技联合研发,具备“问不倒、能调图、会统计、能识图、会报告”五大核心能力,参数量达6000亿。🔗 原文

● 云深处科技已正式启动上市辅导
杭州云深处科技股份有限公司已启动上市辅导,辅导机构为中信建投证券。公司成立于2017年,专注于四足及人形机器人研发,创始人朱秋国为浙江大学副教授,目前合计控制公司32.60%的股份。云深处科技近期完成了超5亿元人民币的C轮融资。🔗 原文

● 英伟达新模型NitroGen能打遍几乎所有游戏
英伟达开源通用游戏AI模型NitroGen,模型能通过观看游戏画面直接生成手柄操作信号,支持跨1000余款不同类型游戏的零样本游玩。模型基于4万小时游戏视频数据集训练,采用为机器人设计的GR00T架构,具备强大的跨游戏泛化能力。🔗 原文

● 扣子编程,开启免费公开测试
在火山引擎Force大会上,扣子开发平台正式升级为“扣子编程”并开启免费公开测试。此次升级标志着平台从AI应用搭建工具转型为赋能开发者创造力的平台,推出全新的Vibe Coding开发范式。用户只需用自然语言描述业务需求,即可自动生成智能体、工作流及跨端应用。🔗 原文

● OpenAI最强代码模型GPT-5.2-Codex上线
OpenAI发布迄今最先进的智能体编码模型GPT-5.2-Codex,模型在复杂软件工程任务中实现重大突破。新版本显著提升了指令遵循能力、长上下文理解及网络安全防护性能,在SWE-Bench Pro和Terminal-Bench 2.0等基准测试中达到最先进水平。🔗 原文

上一篇:

下一篇: