开源模型
-
硅谷AI圈中文现象深度解析:从人才流动到开源模型崛起的范式转移
硅谷AI领域近期出现了一个引人注目的文化现象:中文正在成为顶尖AI圈层的通用语言。这一现象不仅体现在人才聚集层面,更延伸至模型开发与产业选择,反映出全球AI力量格局的深刻变化。本文将从人才结构、开源模型竞争力、产业迁移三个维度进行系统分析,揭示这一现象背后的技术逻辑与市场动因。 **一、人才结构的范式转移:中文成为AI精英的隐性门槛** 传统认知中,英语是科…
-
DeepSeek OCR:颠覆传统,用视觉压缩破解AI扩展的“十亿美元级”文档处理难题
Part I: 文本的“隐形重量” 我们通常认为文本是“轻”的:易于存储、传输和计算。但在大语言模型时代,文本变得非常“重”。 处理一张发票的PDF扫描件,就可能消耗1,000至5,000个tokens。将这个数量级乘以企业日志、法律合同、监管文件和数字化档案,总token量将变得极其庞大——其中大部分是冗余、昂贵且处理缓慢的。虽然OpenAI的GPT-4-…
-
开源模型首夺国际物理奥赛金牌!上海AI Lab打造235B参数模型超越GPT-5与Grok-4
上海AI Lab研发的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中首次达到金牌分数线,并在涵盖全球13项顶级赛事的HiPhO基准测试中以12金1银的成绩与谷歌Gemini-2.5-Pro并列第一,超越GPT-5与Grok-4。该成果依托多阶段强化学习训练与协同进化多智能体系统PhysicsMinions,标志着开源模型在复杂物理推理能力上实现重要突破。
-
AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点
10月13日 【开源】 阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型,它们显存占用更低,具备多模态理解与推理能力,支持长视频、长文档等超长上下文输入,并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。 10月14日 【闭源】 腾讯混元发…