视频生成模型
-
字节豆包AI全面升级:多模态Agent、图像视频生成大版本革新,引爆春节AI大战
「2026 年或将成为人类历史上最忙碌、也最具决定性的一年。」xAI 联创 Jimmy Ba 在离职宣言中如是说。 这话并非夸张。1 月初,Anthropic 推出 Agent 工具 Claude Cowork,并发布 11 个配套插件;一周前,Anthropic 与 OpenAI 又几乎同时推出新版本基础大模型 Claude Opus 4.6 与 GPT-…
-
中国AI视频双雄并起:Seedance 2.0与Vidu Q3组团席卷全球
在AI视频创作领域,Seedance 2.0的爆火不是偶然。这一次真正“破圈”,很大程度上源于它所具备的“导演思维”——剧本驱动、分镜清晰、节奏精准。它让人们意识到,一个好的AI视频更需要创意调度。而过去,创作者在AI视频中最难掌握的两个要素,恰恰就是理解故事结构与镜头语言。 与此同时,另一款国产视频生成模型生数科技的Vidu Q3,也在创作者社群中走红,并…
-
华为天才少年创业:全球首个虚实融合实时交互视频模型X1,让童年幻想“滚球兽”走进现实
还记得童年的那个愿望吗? 随着《数码宝贝》进化曲的响起,屏幕前的你我或许都曾幻想过:要是那只从数码蛋中破壳而出的滚球兽,真的可以从电视屏幕那端跳出来,就好了。 彼时,我们只能将这种天马行空的「美梦」寄希望于「次元裂缝」的开启。再后来,增强现实(AR)技术曾一度带来了希望,但几经潮起潮落,结果仍停留在「预先制作的内容叠加」层面,数字角色无法真正感知环境。 而现…
-
火山引擎发布豆包视频生成模型Seedance 1.5 Pro,实现音画高精度同步
火山引擎在FORCE原动力大会上推出最新豆包视频生成模型Seedance 1.5 Pro。该模型主打音画高精度同步功能,能够通过单一Prompt同时生成人物对白配音、背景音乐和音效。 Seedance 1.5 Pro的核心亮点包括: 1. 音画高精度同步:背景音乐、音效和人物对话均能按照剧情发展保持高度一致。 2. 支持多人多方言:原生支持四川话、粤语、上海…
-
阿里万相2.6发布:国内首个声画一致角色定制模型,将专业影棚搬入手机
2025年,视频生成技术迎来突破性进展,行业范式正在重塑。9月,OpenAI发布的Sora 2通过“客串”功能攻克了长期困扰行业的角色一致性难题,使AI视频从随机生成转向可控创作。商业应用同步加速:B端AI短剧与漫剧批量上线,显著降低制作成本;C端社交平台涌现“粘土滤镜”等爆款特效,众多博主开始常态化使用AI制作剧情短片。 然而,顶尖技术对普通用户而言仍存在…
-
视频仿真革命:Google DeepMind用Veo模型重塑机器人策略评估范式
在通用型机器人技术快速发展的当下,如何高效、安全地评估机器人策略已成为制约行业进步的关键瓶颈。传统基于真实硬件的评估方法不仅成本高昂、耗时漫长,更在安全性测试方面存在难以逾越的障碍。Google DeepMind Gemini Robotics团队最新提出的基于Veo视频模型的机器人策略评估系统,为这一难题提供了突破性的解决方案。 传统评估体系面临的根本性挑…
-
AI前沿速递:长视频生成突破、视觉文本压缩创新与轻量MoE模型发布
10月26日 【开源】美团LongCat-Video视频生成模型美团LongCat团队发布基于Diffusion Transformer架构的LongCat-Video模型。该模型创新性地通过“条件帧数量”实现任务区分,原生支持文生视频、图生视频、视频续写三大核心任务,能够实现分钟级长视频的连贯生成,从根源上保障了跨帧时序一致性与物理运动的合理性。 模型链接…
-
美团视频生成模型来了!一出手就是开源SOTA
美团推出开源视频生成模型LongCat-Video,该模型在文生视频、图生视频和长视频生成等多个任务上达到先进水平,通过技术创新实现了高质量、长时序的视频内容生成,为视频创作和AI世界模型研究提供了新的工具和思路。
