AI产业动态

视觉化文本处理：Glyph框架如何通过图像渲染突破长文本计算瓶颈

在人工智能快速发展的今天，处理长文本输入已成为大语言模型面临的核心挑战之一。传统的token扩展方法虽然在一定程度上缓解了上下文长度限制，但随之而来的算力成本呈指数级增长，使得百万级token的处理在经济和技术上都变得不可持续。当业界普遍在位置编码扩展和注意力机制优化上投入大量资源时，智谱AI推出的Glyph框架却开辟了一条全新的技术路径：将文本转化为图像，…

2025年10月29日

336000

AI产业动态

高通进军AI推理芯片市场：挑战英伟达霸权的移动技术新路径

在人工智能芯片领域，英伟达长期占据主导地位，其GPU在训练和推理市场均形成近乎垄断的格局。然而，这种局面正面临来自多方的挑战。高通作为移动通信和计算领域的巨头，近日宣布将于明年推出AI200芯片，并计划在2027年跟进AI250芯片，正式进军AI推理芯片市场。这一战略举措不仅反映了高通自身业务拓展的雄心，更揭示了AI芯片市场格局可能发生的深刻变化。高通此次…

2025年10月28日

288000

AI产业动态

美团视频生成模型来了！一出手就是开源SOTA

美团推出开源视频生成模型LongCat-Video，该模型在文生视频、图生视频和长视频生成等多个任务上达到先进水平，通过技术创新实现了高质量、长时序的视频内容生成，为视频创作和AI世界模型研究提供了新的工具和思路。

2025年10月27日

399000

AI产业动态

AI大模型技术周报：阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

10月21日【闭源】阿里发布Qwen3-VL-32B系列模型阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异，适用于通用场景下的复杂感知任务。详情链接：https://help.aliyun.c…

2025年10月27日

316000

AI产业动态

小模型专项训练新范式：Karpathy 如何通过数据增强让“蜜蜂大脑”学会字母计数

近日，OpenAI 联合创始人 Andrej Karpathy 在社交媒体上分享了一项引人深思的实验：他成功训练了一个参数量极小的语言模型 nanochat d32 完成一项看似简单却极具挑战性的任务——准确计算单词中特定字母（如字母“r”）的数量。这一实验不仅展示了小模型在特定任务上的潜力，更揭示了在资源受限条件下，如何通过精心设计的数据增强策略来弥补模型…

2025年10月26日

266000

AI产业动态

开源模型首夺国际物理奥赛金牌！上海AI Lab打造235B参数模型超越GPT-5与Grok-4

上海AI Lab研发的开源模型P1-235B-A22B在国际物理奥林匹克竞赛（IPhO）中首次达到金牌分数线，并在涵盖全球13项顶级赛事的HiPhO基准测试中以12金1银的成绩与谷歌Gemini-2.5-Pro并列第一，超越GPT-5与Grok-4。该成果依托多阶段强化学习训练与协同进化多智能体系统PhysicsMinions，标志着开源模型在复杂物理推理能力上实现重要突破。

2025年10月25日

489000

AI产业动态

SGLang Model Gateway 0.2：一体化AI原生编排解决方案的突破性实践

在AI模型部署与推理的复杂生态中，尽管市场上涌现了众多GPU内核优化、推理引擎加速项目以及从传统云原生演进而来的AI网关工具，但真正实现一体化、原生AI编排的解决方案却长期处于空白状态。实际生产环境中，开发者往往需要自行整合多个组件，形成效率低下、维护困难的“缝合怪”系统。Oracle与SGLang团队敏锐地捕捉到这一痛点，近期推出了生产就绪的SGLang …

2025年10月25日

294000

AI产业动态

AI在线强化学习实现“实践式学习”，斯坦福团队助力7B小模型性能大幅提升，表现超越GPT-4o

斯坦福团队推出AgentFlow框架，通过在线强化学习让仅7B参数的小模型在流式协作中“边做边学”。该方法使模型在搜索、数学等10项任务中性能显著提升，部分表现甚至超越了GPT-4o等超大模型，证明了优化系统设计可突破模型规模限制。

2025年10月24日

746000

AI产业动态

Browser-Use 0.9.0深度解析：Code Use如何革新网页自动化与数据爬取

近日，Browser-Use团队发布了0.9.0版本，这一更新标志着浏览器自动化工具进入了一个全新的发展阶段。本次升级的核心亮点是引入了Code Use功能，专门针对数据爬取场景进行了优化设计。这一创新不仅提升了自动化效率，更从根本上改变了AI与网页交互的方式。传统网页自动化工具通常依赖于模拟人类操作——通过视觉识别定位元素，然后模拟鼠标点击、键盘输入等动…

2025年10月24日

317000

AI产业动态

GPT-5被比作o3.1？OpenAI首次深度解析“思考型AI”：强化学习与预训练双轨并行，才是实现AGI的关键路径

OpenAI研究副总裁Jerry Tworek首次详解GPT-5，称其本质是o3模型的升级版（o3.1）。他指出，强化学习与预训练结合是AGI发展的核心路径，未来将打造更自主、思考时间更长的推理模型。Jerry还认可DeepSeek的GRPO算法推动美国RL研究，并透露OpenAI内部高度自主、信息透明，员工甚至自费使用ChatGPT。

2025年10月23日

488000