AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

10月21日

【闭源】阿里发布Qwen3-VL-32B系列模型
阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异,适用于通用场景下的复杂感知任务。

详情链接:https://help.aliyun.com/zh/model-studio/vision

【开源】DeepSeek发布DeepSeek-OCR
DeepSeek提出“上下文光学压缩”新范式,将长文本渲染成图像后,利用视觉编码器将其压缩为极少量视觉token。在≤10×压缩比下,其OCR精度可达97%,仅用100个token即可超越GOT-OCR2.0。该模型支持近百种语言及图表解析,单台A100可日处理20万页文档。

详情链接:https://modelscope.cn/models/deepseek-ai/DeepSeek-OCR

【开源】科大讯飞发布Spark-Scilit-X1-13B
科大讯飞发布了为学术研究场景量身定制的大规模语言模型Spark-Scilit-X1-13B。该模型在论文辅助阅读、学术翻译、英文润色和评论生成方面表现出色,其设计结合了长链思维推理和双过程理论的统一框架,支持快速和慢速两种思考模式。

详情链接:https://modelscope.cn/models/iflytek/Spark-Scilit-X1-13B

10月22日

【开源】腾讯混元发布世界模型1.1版本
腾讯混元发布了世界模型1.1版本HunyuanWorld-Mirror。新版本新增支持多视图及视频输入,可实现单卡部署,并能在秒级内创造3D世界。该模型在单次前向传递中可同时生成点云、多视图深度、相机参数、表面法线、3D高斯等多种3D表示。

详情链接:https://modelscope.cn/models/Tencent-Hunyuan/HunyuanWorld-Mirror

AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/14683

(0)
上一篇 2025年10月27日 上午7:58
下一篇 2025年10月27日 下午4:08

相关推荐

  • 从文本瓶颈到心灵感应:LatentMAS如何重塑多智能体协作范式

    在人工智能的演进历程中,多智能体系统(Multi-Agent Systems, MAS)正从理论构想走向工程实践,成为解决复杂任务的关键架构。传统基于大语言模型(LLM)的MAS依赖自然语言作为智能体间的通信媒介——智能体A生成文本输出,智能体B解析后再进行下一步推理。这种模式虽然具备良好的可解释性,却暴露了三大根本性缺陷:首先,文本序列化过程导致信息压缩与…

    2025年12月5日
    19700
  • Real Deep Research:AI研究自动化革命,让机器读懂整个学科

    在人工智能研究呈现指数级增长的今天,科研人员面临着一个日益严峻的挑战:如何从海量文献中高效追踪前沿动态、识别关键趋势并发现跨领域机遇?传统的人工文献综述方法已难以跟上研究产出的速度,而现有的自动化工具又往往缺乏领域深度和专家洞察。加州大学圣迭戈分校与Nvidia等机构联合提出的Real Deep Research(RDR)系统,正试图通过系统化的自动化流程与…

    2025年11月2日
    17000
  • 谷歌逆袭之战:从ChatGPT冲击到Gemini崛起,三年技术攻防全解析

    2025年12月1日,硅谷再次拉响了“红色警报”。不过这一次,发出警报的不是谷歌,而是OpenAI。 当OpenAI CEO萨姆・奥特曼在内部备忘录中宣布进入最高级别的“红色警报”状态,暂停广告、医疗AI智能体等所有非核心项目,将全部资源集中于改进ChatGPT时,整个科技圈都意识到风向变了。 三年前的同一幕还历历在目。2022年11月30日,ChatGPT…

    2026年1月1日
    31200
  • OpenAI推出首款ChatGPT浏览器,即刻免费体验!

    从今天起,使用ChatGPT有了OpenAI官方的浏览器选择。 这款名为ChatGPT Atlas(阿特拉斯,灵感来自古希腊神话中托举地球的神祇)的浏览器,是OpenAI首款AI原生的浏览器产品,现已正式上线。 它有哪些功能? 简言之,ChatGPT已有的核心能力正被全面整合进这款浏览器中,未来更多功能也将陆续融入。 这是OpenAI打造的全新入口,旨在让用…

    2025年10月22日
    44400
  • 马斯克万亿薪酬方案获准,特斯拉人形机器人Optimus引领AI与机器人时代

    马斯克的万亿薪酬方案获准,引领特斯拉迈向AI与机器人时代 特斯拉股东大会近期批准了一项极具雄心的十年期高管薪酬方案。该方案规定,若埃隆·马斯克能带领特斯拉实现一系列前所未有的增长目标,包括将公司市值提升至8.5万亿美元、交付2000万辆电动车、100万台人形机器人以及100万台投入商业运营的Robotaxi,他将有资格获得价值近1万亿美元的股票奖励。 超过7…

    2025年11月7日
    17800