AI前沿速递:长视频生成突破、视觉文本压缩创新与轻量MoE模型发布

AI前沿速递:长视频生成突破、视觉文本压缩创新与轻量MoE模型发布

10月26日

【开源】美团LongCat-Video视频生成模型
美团LongCat团队发布基于Diffusion Transformer架构的LongCat-Video模型。该模型创新性地通过“条件帧数量”实现任务区分,原生支持文生视频、图生视频、视频续写三大核心任务,能够实现分钟级长视频的连贯生成,从根源上保障了跨帧时序一致性与物理运动的合理性。

模型链接:https://modelscope.cn/models/meituan-longcat/LongCat-Video

【开源】清华&智谱AI发布Glyph视觉-文本压缩框架
清华大学CoAI实验室与智谱AI联合发布Glyph框架,通过视觉-文本压缩技术扩展上下文长度。该框架可将24万token的《简·爱》文本渲染为约8万视觉token的图像,实现3倍的压缩比。在MMLongBench-Doc基准测试中,相比基线VLM整体准确率提升13%,在PDF文档理解等真实多模态场景中表现优异。

模型链接:https://modelscope.cn/models/ZhipuAI/Glyph

10月27日

【开源】Minimax发布轻量MoE模型MiniMax-M2
Minimax发布MiniMax-M2,这是一款轻量、快速且极具成本效益的混合专家模型。该模型总参数量为230B,激活参数量仅为10B,专为Max级编码与智能体任务打造。凭借其高效的参数激活机制,在编码和智能体工具使用的基准测试中表现优异,同时更易于部署和扩展。

模型链接:https://modelscope.cn/models/MiniMax/MiniMax-M2

10月31日

【闭源】阿里发布Qwen图像编辑模型升级版
阿里发布qwen-image-edit-plus-2025-10-30,该版本在原有qwen-image-edit模型基础上,重点优化了推理性能与系统稳定性,大幅缩短了图像生成与编辑的响应时间。新版本还新增支持单次请求返回多张图片的功能。

详情链接:https://help.aliyun.com/zh/model-studio/qwen-image-edit-guide


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/14663

(0)
上一篇 2025年11月3日 上午11:44
下一篇 2025年11月3日 下午12:04

相关推荐

  • 从Roadster退款到52页备忘录:马斯克与奥特曼的OpenAI恩怨与Ilya证词深度解析

    近日,科技界两位重量级人物——埃隆·马斯克与萨姆·奥特曼在社交媒体平台X上的公开争执再次引发广泛关注。这场看似由特斯拉Roadster退款问题引发的口水战,实则折射出OpenAI自2015年创立以来复杂的权力演变、理念分歧与法律纠葛。本文将从事件背景、核心争议、Ilya Sutskever证词的关键披露以及行业影响四个维度进行深度分析。 **一、事件背景:从…

    2025年11月3日
    31600
  • 从“内容理解”到“用户角色认知”:快手TagCF框架如何重塑推荐系统的逻辑范式

    在当今数字时代,推荐系统已成为连接用户与内容的核心枢纽。传统推荐算法主要聚焦于“内容层”的理解——通过分析用户的点击、停留、互动等行为数据,推断其对特定视频、话题或商品的偏好。这种基于统计关联的方法虽然在一定程度上能够捕捉用户的兴趣点,但其本质仍停留在“知其然”的层面:系统知道用户喜欢什么内容,却难以理解“用户是谁”这一根本问题。快手消费策略算法团队敏锐地洞…

    2025年11月27日
    33500
  • AI量化科研领导力:中美科学合作格局的算法透视与未来预测

    2024年6月发表于《美国国家科学院院刊》(PNAS)的一项研究,通过机器学习模型对全球600万篇科研论文进行深度分析,揭示了中国在国际科研合作中领导地位的快速崛起。这项由中美学者合作完成的研究,不仅提供了评估科研团队领导力的创新方法论,更预测了中国将在2030年前于人工智能、半导体、能源和材料科学等关键领域实现与美国平起平坐的领导地位。 传统上,衡量国家科…

    2025年10月29日
    37900
  • 开源多模态推理新突破:MMFineReason框架以4B参数逆袭30B模型,开启数据驱动的高效推理时代

    长期以来,开源多模态模型在复杂推理任务上,始终与 GPT-4o、Gemini 等顶尖闭源模型存在一道难以逾越的鸿沟。 社区开发者们逐渐意识到,核心痛点或许不在于模型架构的精进或参数规模的扩大,而在于高质量、思维链(CoT)密集的推理数据极度匮乏。 在纯文本领域,DeepSeek-R1 的成功已验证了高质量后训练数据的威力。但在多模态领域,研究者们面对的是横亘…

    2026年2月13日
    35700
  • 机器人内卷新高度!Gen-1模型成功率99%,效率提升3倍,还能“即兴”处理突发状况

    机器人“内卷”新高度:Gen-1模型成功率99%,效率提升3倍,具备“即兴”处理能力 具身智能公司Generalist发布了其最新研究成果——Gen-1模型。该模型在精细操作任务上表现卓越,将机器人执行的成功率从64%大幅提升至99%,同时效率也显著提高。 以折叠标准纸箱为例,此前完成该任务平均耗时约34秒,而Gen-1仅需12.1秒即可完成,效率提升近3倍…

    2026年4月7日
    40800