AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

10月21日

【闭源】阿里发布Qwen3-VL-32B系列模型
阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异,适用于通用场景下的复杂感知任务。

详情链接:https://help.aliyun.com/zh/model-studio/vision

【开源】DeepSeek发布DeepSeek-OCR
DeepSeek提出“上下文光学压缩”新范式,将长文本渲染成图像后,利用视觉编码器将其压缩为极少量视觉token。在≤10×压缩比下,其OCR精度可达97%,仅用100个token即可超越GOT-OCR2.0。该模型支持近百种语言及图表解析,单台A100可日处理20万页文档。

详情链接:https://modelscope.cn/models/deepseek-ai/DeepSeek-OCR

【开源】科大讯飞发布Spark-Scilit-X1-13B
科大讯飞发布了为学术研究场景量身定制的大规模语言模型Spark-Scilit-X1-13B。该模型在论文辅助阅读、学术翻译、英文润色和评论生成方面表现出色,其设计结合了长链思维推理和双过程理论的统一框架,支持快速和慢速两种思考模式。

详情链接:https://modelscope.cn/models/iflytek/Spark-Scilit-X1-13B

10月22日

【开源】腾讯混元发布世界模型1.1版本
腾讯混元发布了世界模型1.1版本HunyuanWorld-Mirror。新版本新增支持多视图及视频输入,可实现单卡部署,并能在秒级内创造3D世界。该模型在单次前向传递中可同时生成点云、多视图深度、相机参数、表面法线、3D高斯等多种3D表示。

详情链接:https://modelscope.cn/models/Tencent-Hunyuan/HunyuanWorld-Mirror

AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/14683

(0)
上一篇 2025年10月27日 上午7:58
下一篇 2025年10月27日 下午4:08

相关推荐

  • NeurIPS限制华为投稿引发学术震荡:CCF呼吁抵制,学者担忧AI会议政治化

    日前,NeurIPS会议宣布,依据美国相关法规,将不再接收或刊出来自华为等受制裁实体机构的投稿。这一决定在学术界引发了广泛震动。 众多国内外学者在社交媒体上表达了不满与质疑。 有学者结合自身经历指出,此类基于国籍或机构的限制并非首次,并批评了这种损害学术自由的行为。 值得关注的是,华为、字节跳动等被限制的企业,长期以来是NeurIPS会议的重要赞助商,多次位…

    2026年3月26日
    42900
  • 从破折号到数据源:ChatGPT标点偏好背后的AI训练数据溯源

    近期,OpenAI首席执行官山姆·奥特曼亲自宣布ChatGPT修复了过度使用破折号的问题,这一看似细微的更新引发了广泛关注。为何一个标点符号的调整能成为AI领域的热点事件?这背后折射出的是大语言模型训练数据、人类反馈强化学习(RLHF)机制以及AI文本生成“数字指纹”等深层次议题。 破折号在ChatGPT输出中的泛滥,已成为用户识别AI生成文本的显著标志。在…

    2025年11月16日
    38000
  • 全球最大智能手机ODM龙旗科技冲刺港股IPO:AI PC与汽车电子业务成新增长引擎

    全球最大的智能手机ODM厂商,正冲刺成为港股“消费电子ODM第一股”。 来自上海的龙旗科技,已成功通过港股聆讯,离敲钟上市仅一步之遥。此前,该公司已于2024年3月在上交所主板上市,当前最新市值约200亿元,即将完成“A+H”股的上市布局。 在智能手机ODM市场,龙旗占据全球约三分之一的市场份额。小米、三星、联想、荣耀、OPPO、vivo等主流品牌均为其客户…

    2026年1月12日
    40600
  • GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

    距离上代 GPT-Image-1.5 推出近 4 个月后,关于其继任者 GPT-Image-2 的消息开始在海外社区流传。 据悉,OpenAI 近期在大模型竞技场 Chatbot Arena 以多个代号对新一代多模态模型进行了测试,但相关测试目前已经下线。 根据流出的生成示例,该模型在文字渲染能力上表现突出。 信息显示,GPT-Image-2 曾使用「mas…

    2026年4月5日
    59400
  • 国产GPU生态崛起:摩尔线程首届开发者大会的技术战略与产业影响深度解析

    2025年12月20日至21日,摩尔线程将在北京中关村国际创新中心举办首届MUSA开发者大会(MDC 2025),这不仅是国内首个聚焦全功能GPU的开发者盛会,更是国产算力生态建设的重要里程碑。在国产GPU龙头完成IPO后,此次大会的战略意义远超普通技术会议,它标志着中国GPU产业从技术追赶阶段正式进入生态构建阶段。 从技术架构层面分析,MUSA统一系统架构…

    2025年12月9日
    40400