图像编辑 - 鲸林向海

开源项目

DeepGen 1.0：5B参数统一多模态生成编辑模型开源，4060ti 10秒出图，多项指标超越大4倍工业模型

DeepGen 1.0：开源统一多模态生成编辑模型近年来，统一多模态生成编辑模型正朝着参数规模庞大的方向发展，动辄数十亿参数，这为普通研究团队的复现和个人本地部署带来了显著挑战。近日，由上海创智学院、复旦大学和中国科学技术大学等机构的研究团队联合发布了统一多模态生成编辑模型 DeepGen 1.0。该模型总参数量为 5B（其中视觉语言模型部分3B，扩散T…

2天前

98000

AI产业动态

AI大模型周报：蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

2月11日【开源】蚂蚁集团旗下团队 inclusionAI 发布 Ring-2.5-1T，这是 Ring-1T 的升级版本，核心特性可概括为“快、深、长”。其生成效率提升超过 3 倍，访存开销降低 10 倍；具备国际数学奥林匹克竞赛金牌级别的深度思考能力，并能连续工作 2 小时编写出迷你操作系统。该模型采用 MIT 协议完全开源。模型详情：https:…

2026年2月16日

85000

AI产业动态

AI模型周报：通义千问、MiniMax、智谱AI等巨头齐发新版，图像编辑与编程能力全面升级

12月23日【闭源】通义千问发布图像编辑模型快照通义千问团队发布了 qwen-image-edit-plus-2025-12-15 图像编辑模型的最新快照。该版本在角色一致性、工业设计能力和几何推理能力上相较前代实现显著提升，优化了编辑后图片与原图在空间布局、纹理和风格上的匹配度，编辑效果更为精准细腻，旨在为专业图像处理提供更强大的工具支持。【开源】Mi…

2025年12月29日

245000

AI产品库

腾讯混元与厦大联合推出JarvisEvo：首个具备自我评估与反思能力的智能修图Agent，精准调用200+专业工具

一句话让照片变大片，比专业软件简单、比AI修图更可控！腾讯混元携手厦门大学推出JarvisEvo——一个统一的图像编辑智能体，旨在模拟人类专家设计师，通过迭代编辑、视觉感知、自我评估和自我反思来完成图像处理。 “像专家一样思考，像工匠一样打磨”。JarvisEvo不仅能调用Lightroom等专业工具进行修图，更能“看见”修图后的变化并进行自我评判，从而实…

2025年12月26日

177000

AI产业动态

Video4Edit：将图像编辑视为退化时序过程，以1%数据实现SOTA性能

在AI图像编辑领域，高质量训练数据的稀缺一直是制约模型性能与泛化能力的关键瓶颈。传统基于扩散模型的编辑方法通常依赖大规模三元组数据（指令-源图像-编辑后图像）进行监督训练，这不仅带来高昂的数据采集与标注成本，也难以覆盖用户多样化的编辑意图。更根本的是，现有方法往往陷入“结构保持”与“纹理修改”的权衡困境：过度强调结构一致性会限制编辑的灵活性，而追求大幅语义修…

2025年12月6日

211000