AI大模型技术周报：阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

2025年10月27日下午12:09 • AI产业动态 • 阅读 205

10月21日

【闭源】阿里发布Qwen3-VL-32B系列模型
阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异，适用于通用场景下的复杂感知任务。

详情链接：https://help.aliyun.com/zh/model-studio/vision

【开源】DeepSeek发布DeepSeek-OCR
DeepSeek提出“上下文光学压缩”新范式，将长文本渲染成图像后，利用视觉编码器将其压缩为极少量视觉token。在≤10×压缩比下，其OCR精度可达97%，仅用100个token即可超越GOT-OCR2.0。该模型支持近百种语言及图表解析，单台A100可日处理20万页文档。

详情链接：https://modelscope.cn/models/deepseek-ai/DeepSeek-OCR

【开源】科大讯飞发布Spark-Scilit-X1-13B
科大讯飞发布了为学术研究场景量身定制的大规模语言模型Spark-Scilit-X1-13B。该模型在论文辅助阅读、学术翻译、英文润色和评论生成方面表现出色，其设计结合了长链思维推理和双过程理论的统一框架，支持快速和慢速两种思考模式。

详情链接：https://modelscope.cn/models/iflytek/Spark-Scilit-X1-13B

10月22日

【开源】腾讯混元发布世界模型1.1版本
腾讯混元发布了世界模型1.1版本HunyuanWorld-Mirror。新版本新增支持多视图及视频输入，可实现单卡部署，并能在秒级内创造3D世界。该模型在单次前向传递中可同时生成点云、多视图深度、相机参数、表面法线、3D高斯等多种3D表示。

详情链接：https://modelscope.cn/models/Tencent-Hunyuan/HunyuanWorld-Mirror

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：http://www.itsolotime.com/archives/14683

AI大模型技术周报：阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

10月21日

10月22日

相关推荐

从文本瓶颈到心灵感应：LatentMAS如何重塑多智能体协作范式

Real Deep Research：AI研究自动化革命，让机器读懂整个学科

谷歌逆袭之战：从ChatGPT冲击到Gemini崛起，三年技术攻防全解析

OpenAI推出首款ChatGPT浏览器，即刻免费体验！

马斯克万亿薪酬方案获准，特斯拉人形机器人Optimus引领AI与机器人时代