图像生成
-
2026年1月AI大模型前沿速览:通义、腾讯、智谱等巨头密集发布语音、视觉与智能体新突破
1月5日 【闭源】阿里通义发布CosyVoice语音合成模型cosyvoice-v3-flash,新增24个音色以覆盖多元场景需求。新增音色包括:方言类(龙嘉怡、龙老铁)、出海营销类、诗词朗诵类(龙飞)、语音助手类(龙小淳、龙小夏、YUMI)、社交陪伴类(龙橙、龙泽、龙哲、龙颜、龙星、龙天、龙婉、龙嫣、龙菲菲、龙浩)、有声书类(龙三叔、龙媛、龙悦、龙修、龙楠…
-
阶跃星辰发布NextStep-1.1:自回归流匹配模型通过RL增强大幅提升图像生成质量
当国产大模型在年底轮番冲刺、热议不断时,阶跃星辰一度显得颇为安静。 Kimi凭借K2模型重获关注,智谱与MiniMax在发布新SOTA模型的同时推进IPO进程,DeepSeek也因新功能引发热议。相比之下,作为“六小龙”中坚持自研路线的选手,阶跃星辰近期的声量似乎有所减弱。 直到其最新图像模型 NextStep-1.1 的发布,打破了这份“安静”。 Next…
-
谷歌Nano Banana 2预览版深度解析:AI图像生成的新纪元与多模态能力突破
近日,谷歌下一代AI图像生成模型Nano Banana 2(简称NB2)的预览版在第三方平台Media IO意外亮相,引发了科技界的广泛关注。尽管尚未正式发布,但基于泄露的测试结果,NB2展现出的性能飞跃已足以重新定义当前AI图像生成的边界。本文将从技术能力、应用场景及行业影响三个维度,对NB2进行全面剖析。 在技术层面,NB2的核心提升体现在生成速度、分辨…