AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

10月21日

【闭源】阿里发布Qwen3-VL-32B系列模型
阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异,适用于通用场景下的复杂感知任务。

详情链接:https://help.aliyun.com/zh/model-studio/vision

【开源】DeepSeek发布DeepSeek-OCR
DeepSeek提出“上下文光学压缩”新范式,将长文本渲染成图像后,利用视觉编码器将其压缩为极少量视觉token。在≤10×压缩比下,其OCR精度可达97%,仅用100个token即可超越GOT-OCR2.0。该模型支持近百种语言及图表解析,单台A100可日处理20万页文档。

详情链接:https://modelscope.cn/models/deepseek-ai/DeepSeek-OCR

【开源】科大讯飞发布Spark-Scilit-X1-13B
科大讯飞发布了为学术研究场景量身定制的大规模语言模型Spark-Scilit-X1-13B。该模型在论文辅助阅读、学术翻译、英文润色和评论生成方面表现出色,其设计结合了长链思维推理和双过程理论的统一框架,支持快速和慢速两种思考模式。

详情链接:https://modelscope.cn/models/iflytek/Spark-Scilit-X1-13B

10月22日

【开源】腾讯混元发布世界模型1.1版本
腾讯混元发布了世界模型1.1版本HunyuanWorld-Mirror。新版本新增支持多视图及视频输入,可实现单卡部署,并能在秒级内创造3D世界。该模型在单次前向传递中可同时生成点云、多视图深度、相机参数、表面法线、3D高斯等多种3D表示。

详情链接:https://modelscope.cn/models/Tencent-Hunyuan/HunyuanWorld-Mirror

AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/14683

(0)
上一篇 2025年10月27日 上午7:58
下一篇 2025年10月27日 下午4:08

相关推荐

  • 突破智能体工作流瓶颈:ToolOrchestra框架如何通过强化学习实现动态资源调度

    在人工智能领域,智能体工作流的构建一直是提升任务执行效率的关键。然而,传统基于提示词工程的工作流设计存在明显的性能天花板,而静态路由策略则常导致计算资源的严重浪费。香港大学与NVIDIA团队的最新研究《ToolOrchestra: Learning to Orchestrate Tools with Multi-Objective Reinforcement…

    2025年11月28日
    7600
  • AI预测世界杯:中国八大模型挑战章鱼保罗,开启全民AI预测新时代

    这届世界杯,看点十足。 虽然国足未能入围,但中国大模型将首次集体亮相,参与一场前所未有的全球人机预测大战。 在2025联想天禧AI生态伙伴大会上,作为国际足联(FIFA)官方技术合作伙伴的联想集团,正式宣布发起 “AlphaGoal预测杯”。 这一次,国产大模型不再是关起门来做题或跑代码,而是让这些拥有千亿、万亿参数的“大脑”,直面充满汗水、草皮、误判与绝杀…

    2025年12月28日
    14700
  • 全球排名算法重塑高等教育:当大学灵魂被数字指标量化

    Nature近期发表的一篇深度评论揭示了高等教育领域一个令人不安的现实:全球大学排名系统已从外部参考工具演变为重塑大学内部运作的核心力量。Elizabeth Gadd在评论中尖锐指出,若想实现真正的大学改革,必须首先解构这场以算法和数据驱动的“排名游戏”。这一观点并非危言耸听,而是基于对全球高等教育体系结构性变化的系统性观察。 排名系统的渗透已远远超越表面声…

    2025年11月28日
    7400
  • 谷歌Gemini 3逆袭:ChatGPT三周年遭遇技术“斩首”,AI霸权格局重塑

    导读 ChatGPT问世三周年之际,其主导地位正面临严峻挑战。谷歌凭借Gemini 3的发布,发起了一场决定性的技术反击,重塑了AI领域的竞争格局。 如果将时间拨回2022年12月1日,那是一个相对安静的周三。旧金山的非营利实验室OpenAI,悄无声息地发布了一个名为“ChatGPT”的研究预览版。 ChatGPT三年前的样子 没有盛大的发布会,只有一个朴素…

    2025年12月1日
    7200
  • 从“中文屋”到GPT时代:约翰·塞尔的哲学遗产与AI理解之争

    哲学家约翰·塞尔(John Searle)于2024年9月16日逝世,享年93岁。这位以“中文屋”思想实验闻名于世的学者,其学术遗产在人工智能蓬勃发展的今天,依然引发着关于机器“理解”本质的深刻讨论。 塞尔于1980年提出的“中文屋”思想实验,已成为人工智能哲学史上的经典命题,常与“图灵测试”并列讨论。该实验设想一个不懂中文的人被关在房间内,仅凭一本英文规则…

    2025年11月30日
    10600