图像生成 - 鲸林向海

AI产品库

Luma发布Uni-1图像生成模型：统一理解与生成，中文文字渲染能力突出

上周，谷歌推出了 Nano Banana 2 模型，以其快速且经济的特性在社交平台上引发了广泛关注。与此同时，海外 AI 初创公司 Luma 发布了一款全新的图像生成模型 Uni-1。 Uni-1 是 Luma 首个将“理解”与“生成”功能统一在同一架构下的模型，旨在使 AI 不仅能够生成图像，还能更好地理解指令。例如，它可以生成极具视觉冲击力的时尚杂志…

2026年3月6日

203000

AI产业动态

ArcFlow：非线性流技术实现40倍推理加速，2步生成媲美原画

ArcFlow：非线性流技术实现40倍推理加速，2步生成媲美原画在图像生成领域，扩散模型通常需要数十步的迭代去噪才能生成高质量图像，这带来了高昂的计算成本，阻碍了实时应用。为了加速推理，常见的知识蒸馏方法试图将生成过程压缩到几步之内，但它们通常假设从噪声到图像的路径是一条直线，而预训练教师模型的实际生成轨迹往往是复杂的曲线。这种“几何失配”导致学生模型在几…

2026年2月15日

114000

AI产业动态

像素级革命：何恺明团队pMF实现单步无潜空间图像生成，FID达2.22刷新效率边界

何恺明团队新论文，再次「大道至简」。此次研究直指当前以 DiT 为代表的主流扩散模型与流匹配模型存在的通病，并提出了一种用于单步、无潜空间（Latent-free）的图像生成新框架。论文标题：One-step Latent-free Image Generation with Pixel Mean Flows arXiv 地址：https://arxiv…

2026年2月3日

112000

2026年1月AI大模型前沿速览：通义、腾讯、智谱等巨头密集发布语音、视觉与智能体新突破

1月5日【闭源】阿里通义发布CosyVoice语音合成模型cosyvoice-v3-flash，新增24个音色以覆盖多元场景需求。新增音色包括：方言类（龙嘉怡、龙老铁）、出海营销类、诗词朗诵类（龙飞）、语音助手类（龙小淳、龙小夏、YUMI）、社交陪伴类（龙橙、龙泽、龙哲、龙颜、龙星、龙天、龙婉、龙嫣、龙菲菲、龙浩）、有声书类（龙三叔、龙媛、龙悦、龙修、龙楠…

AI产业动态 2026年2月2日

567000

大模型工程

阶跃星辰发布NextStep-1.1：自回归流匹配模型通过RL增强大幅提升图像生成质量

当国产大模型在年底轮番冲刺、热议不断时，阶跃星辰一度显得颇为安静。 Kimi凭借K2模型重获关注，智谱与MiniMax在发布新SOTA模型的同时推进IPO进程，DeepSeek也因新功能引发热议。相比之下，作为“六小龙”中坚持自研路线的选手，阶跃星辰近期的声量似乎有所减弱。直到其最新图像模型 NextStep-1.1 的发布，打破了这份“安静”。 Next…

2025年12月27日

239000

AI产业动态

谷歌Nano Banana 2预览版深度解析：AI图像生成的新纪元与多模态能力突破

近日，谷歌下一代AI图像生成模型Nano Banana 2（简称NB2）的预览版在第三方平台Media IO意外亮相，引发了科技界的广泛关注。尽管尚未正式发布，但基于泄露的测试结果，NB2展现出的性能飞跃已足以重新定义当前AI图像生成的边界。本文将从技术能力、应用场景及行业影响三个维度，对NB2进行全面剖析。在技术层面，NB2的核心提升体现在生成速度、分辨…

2025年11月9日

203000