开源模型
-
2025人工智能年度盘点:开源竞速、Agent崛起与产业融合的共生纪元
2025年,人工智能领域迎来了前所未有的技术爆发与产业融合。这一年,开源与闭源模型的双线竞速、AI Agent的规模化应用、世界模型的商业化落地以及具身智能的全面渗透,共同勾勒出一幅“共生无界”的智能未来图景。 **开源与闭源的边界消融** 2025年初,DeepSeek-R1的横空出世为全年技术叙事定下基调。这款模型不仅在参数规模上实现突破,更在推理效率、…
-
AI模型周报:阶跃星辰GUI Agent破纪录,Mistral 3系列开源引领多模态浪潮
12月1日 【开源】阶跃星辰开源GELab-Zero阶跃星辰开源了GELab-Zero,首次将GUI Agent模型与完整的配套基础设施同步开放,支持一键部署。其4B参数的GUI Agent模型在手机端、电脑端等多个GUI基准测试中全面刷新了同尺寸模型的性能纪录,取得了SOTA成绩。此外,阶跃还开源了基于真实业务场景的自建评测标准AndroidDaily,旨…
-
2025年AI大分流:100万亿Token数据揭示开源崛起、推理为王与亚洲时刻
100万亿Token实证:2025年AI大分流全景图 2025年,人工智能领域迎来一个结构性转折点。OpenRouter与a16z联合发布了一份基于真实算力消耗的深度研究报告,通过分析过去一年处理的超过100万亿个Token的元数据,揭示了当前AI发展的核心趋势与反直觉洞察。这份报告摒弃了传统的学术基准或宣称的用户数,从全球300多个模型、60多个提供方的实…
-
2025年11月AI大模型爆发月报:从美团LongCat到Meta SAM 3,开源与闭源模型全面升级
11月3日 【开源】 美团发布 LongCat-Flash-Omni-FP8,这是一个拥有560亿参数(激活27B)的开源全模态模型,擅长实时音视频交互。该模型采用高性能捷径连接的混合专家(MoE)架构,结合高效的多模态感知与语音重建模块,并运用课程启发式渐进训练策略,在保持强大单模态能力的同时,实现了全面的多模态能力。 11月7日 【开源】 Moonsho…
-
DeepSeek-Math-V2震撼开源:685B巨无霸模型登顶数学推理巅峰,IMO金牌水平+Putnam近乎满分
刚刚,DeepSeek 开源了最新的数学推理模型 DeepSeek-Math-V2。 这不仅仅是一次普通的模型迭代,根据在国际数学奥林匹克和普特南数学竞赛上的表现来看,这可能是开源模型在数学推理领域的一个里程碑时刻。 数学推理新王登基了。 如果说上一代 DeepSeek-Math 让我们看到了开源模型在数学领域的潜力,那么这一次 V2 版本交出了一份令人咋舌…
-
AI大模型周报:阿里语音识别升级、谷歌Gemini 3系列亮相、Meta开源SAM 3与3D重建套件
11月17日 【闭源|语音识别】阿里发布录音文件识别新模型阿里发布 qwen3-asr-flash-filetrans 及其快照版 qwen3-asr-flash-filetrans-2025-11-17。该模型专为音频文件的异步转写设计,支持最长12小时的录音文件。 11月18日 【闭源】谷歌推出 Gemini 3 Pro 预览版谷歌发布首款 Gemini…
-
AI大模型周报:字节跳动、百度、OpenAI密集更新,闭源与开源模型齐头并进
11月11日 【闭源】 字节跳动发布 doubao-seed-code,这是一款专为实际开发场景打造的AI编程模型。该模型强化了Bug修复能力和前端开发能力,并支持输入透明Cache能力,以有效降低使用成本。 【开源】 百度发布 ERNIE-4.5-VL-28B-A3B-Thinking。该模型在ERNIE-4.5-VL-28B-A3B基础上训练而成,是一个…
-
Hulu-Med:开源统一医学视觉语言大模型,破解医疗AI碎片化与透明度困局
在医疗人工智能领域,长期以来存在着两大核心挑战:任务与模态的碎片化,以及技术实现的不透明性。传统医学AI模型通常针对特定任务(如影像诊断、病理分析或手术指导)和单一模态(如2D图像、3D体积或文本)进行优化,形成了众多性能卓越但彼此孤立的“专科助手”。这种碎片化架构不仅导致临床应用中需要拼凑复杂系统来处理多模态数据,增加了维护成本,更限制了AI从跨模态关联中…
-
全球AI格局重构:中国开源模型填补技术真空,以极致效率重塑产业生态
在全球人工智能发展的关键节点,2024年见证了行业格局的深刻变革。两大传统技术灯塔——开源领域的Meta Llama系列与闭源领域的OpenAI——同时遭遇严峻挑战,暴露出西方AI发展模式在可持续性与可靠性方面的结构性缺陷。这一技术真空的浮现,恰为中国AI力量的崛起提供了历史性机遇,以DeepSeek、MiniMax为代表的国产模型正通过技术创新与商业模式的…
-
美团LongCat-Flash-Omni:全模态实时交互开源模型的架构突破与产业影响
在AI模型竞争日趋白热化的当下,美团最新开源的LongCat-Flash-Omni模型以“全模态实时交互”为核心卖点,不仅刷新了开源多模态模型的性能基准,更在架构设计层面展现了独特的技术路径。这款总参数560B、激活参数仅27B的MoE架构模型,成功实现了多模态能力与推理效率的平衡,标志着开源大模型在实用化道路上迈出了关键一步。 从性能表现来看,LongCa…