AI周报:阿里通义语音模型升级、腾讯开源2B小模型、Qwen3-VL多模态检索新突破

AI周报:阿里通义语音模型升级、腾讯开源2B小模型、Qwen3-VL多模态检索新突破

1月5日

【闭源】 阿里通义发布语音合成模型 CosyVoice-v3-flash,新增24个音色以覆盖多元场景需求。新增音色包括:
* 方言类:龙嘉怡、龙老铁
* 出海营销类
* 诗词朗诵类:龙飞
* 语音助手类:龙小淳、龙小夏、YUMI
* 社交陪伴类:龙橙、龙泽、龙哲、龙颜、龙星、龙天、龙婉、龙嫣、龙菲菲、龙浩
* 有声书类:龙三叔、龙媛、龙悦、龙修、龙楠
* 新闻播报类:龙书

详情请参见:https://help.aliyun.com/zh/model-studio/cosyvoice-voice-list

1月6日

【闭源】 阿里通义千问发布语音识别模型 qwen3-asr-flash 和 qwen3-asr-flash-2025-09-08。该模型支持 OpenAI 兼容模式,为开发者提供标准化的语音文件识别接口,旨在简化集成流程,提升语音转文字应用的开发效率。

详情请参见:https://help.aliyun.com/zh/model-studio/qwen-speech-recognition

1月7日

【开源】 腾讯Youtu团队开源小型大语言模型 Youtu-LLM-2B。该模型仅包含19.6亿参数,支持128k长上下文,并具备原生智能体(agentic)能力。

详情请参见:https://modelscope.cn/models/Tencent-YouTu-Research/Youtu-LLM-2B

1月8日

【开源】 Qwen团队推出基于Qwen3-VL模型构建的 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型系列,专为多模态信息检索和跨模态理解场景设计。

该系列模型在统一框架下实现强大的多模态通用性,可高效处理文本、图像、截图和视频输入,在图文检索、视频文本匹配、VQA及多模态聚类等任务中表现领先。其中,Embedding模型通过共享语义空间生成跨模态向量表示,支持高效相似度计算;Reranker模型则用于精准评估混合模态输入对的相关性分数。两者协同的两阶段检索流程可显著提升检索精度。

模型继承了Qwen3-VL对30+语言的支持,提供灵活的向量维度、可定制指令及量化优化性能,便于集成到全球化应用场景中。

详情请参见:https://modelscope.cn/collections/Qwen/Qwen3-VL-Embedding-and-Rerank


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/17738

(0)
上一篇 2026年1月12日 上午8:56
下一篇 2026年1月12日 上午11:49

相关推荐

  • 英伟达Rubin架构深度解析:六芯片协同设计如何重塑AI算力基础设施与供应链格局

    Rubin架构开启AI新纪元:CES 2026的算力革命 2026年1月,拉斯维加斯国际消费电子展(CES 2026)如期而至。作为全球科技产业的“风向标”,本次展会聚焦AI、机器人、智能驾驶等前沿领域,而英伟达CEO黄仁勋长达90分钟的主题演讲,无疑成为整场展会的焦点。 演讲中,黄仁勋正式宣布新一代AI超级计算平台——Vera Rubin(以下简称“Rub…

    AI产业动态 2026年1月20日
    14300
  • AI智能体效能评估标准化:破解企业应用困局的关键路径

    随着大模型技术从概念验证迈向规模化应用,2025年企业关注的焦点已从技术探索转向业务实效。IDC最新报告指出,今年将成为企业从“AI实验”转向“通过AI重塑运营”的战略分水岭。在这一转型过程中,AI智能体作为连接技术能力与业务场景的关键载体,被寄予打通落地“最后一公里”的厚望。企业不再满足于基础对话功能,而是迫切需要能够处理复杂业务流程、交付确定性结果的业务…

    2025年12月19日
    9300
  • UI-Genie:移动GUI智能体的自我进化革命——从数据瓶颈到自主能力跃迁

    在人工智能技术快速演进的当下,多模态大模型正经历着从被动响应到主动执行的深刻转型。香港中文大学MMLab与vivo AI Lab联合团队的最新研究成果UI-Genie,为这一转型提供了极具启发性的技术路径。该研究由肖涵(第一作者,研究方向为多模态大模型和智能体学习)、王国志(研究方向为多模态大模型和Agent强化学习)共同完成,项目负责人任帅(研究方向为多模…

    2025年11月7日
    8000
  • 快手AI人才地震:大模型掌舵人离职,华为搜索实验室主任加盟,两年间9位高管变动

    AI人才换挡期来了? 据多个独立信源透露,快手科技副总裁、基础大模型及推荐模型负责人周国睿即将离职。其内部系统状态已显示为休假,签名改为“Log Out”。有消息称其或将加入Meta,也有传闻指向TikTok。 职场平台脉脉信息显示,周国睿于2021年加入快手,此前曾在阿里妈妈担任高级算法专家。在快手期间,他先后负责直播、本地生活推荐业务,并于2024年升任…

    2025年12月31日
    13500
  • 从“我不是机器人”到隐私监控:reCAPTCHA的演化与AI训练数据伦理困境

    近日,一段关于“猫屎团”验证码的调侃视频在社交媒体上引发热议。视频中,用户需要将灰色的“猫屎团”拖入垃圾桶,并勾选“我不是猫”才能通过验证。这一看似荒诞的场景,实际上折射出图形验证码(CAPTCHA)技术演化的深层逻辑——从单纯的人机识别工具,演变为大规模数据收集机制,最终引发隐私监控的伦理争议。 验证码技术的起源可追溯至2000年代初,其全称“全自动区分计…

    2025年11月12日
    9000