开源模型 - 鲸林向海

英伟达重磅开源Nemotron 3 Super：1200亿参数专为Agent打造，性能直逼Claude Opus 4.6

全球市值领先的英伟达，正式进军OpenClaw领域。其最新发布的开源模型Nemotron 3 Super，专为大规模AI智能体打造。该模型拥有1200亿参数，采用120亿激活参数，支持100万token的上下文长度。据称，其推理速度提升高达3倍，吞吐量提升达5倍。 Nemotron 3 Super采用了创新的Mamba-MoE混合架构，旨在解决多智能体协同…

2026年3月12日

590000

大模型评测

3B小模型逆袭万亿巨头：Nanbeige4.1-3B如何以“小而全”颠覆大模型军备竞赛？

近年来，大模型领域的竞争日趋白热化，无论是开源还是闭源阵营，都陷入了对 Scaling Law、算力与参数量的极致追求，其规模膨胀的速度已近乎“军备竞赛”。过去，拥有约15亿参数的GPT-2在如今看来已属“小模型”。而GPT-4的参数规模据业内估计已达万亿级别，GPT-5等后续模型的体量更是难以估量。开源模型同样在向超大参数迈进，超过6000亿参数的模型已…

2026年3月9日

791000

开源项目

30B参数开源模型UniScientist：实现自主科研闭环，将开放式问题转化为可验证单元测试

30B参数开源模型UniScientist：实现自主科研闭环，将开放式问题转化为可验证单元测试（1/2）当前许多大语言模型能够生成看似专业的论文，但其“科研能力”往往停留在表面——它们擅长模仿格式、排列逻辑和引用文献，却难以进行严谨、可验证的科学推理。模型常陷入“叙事推理”的陷阱，结论缺乏稳固的证据支撑，可复现性弱。近期，UniPat AI团队发布了一个…

2026年3月9日

309000

开源项目

UniScientist：30B参数开源模型实现科研闭环，匹敌百亿级闭源模型

多数大模型能够生成“看起来像”学术研究的文本，但极少能真正执行研究过程——即提出假设、收集证据、执行可复现的推导，并通过迭代验证形成可靠结论。近期，发布了BabyVision评测基准（该基准已被多个重要模型采纳）的UniPat AI，在其最新博客《UniScientist: Advancing Universal Scientific Research I…

2026年3月9日

431000

开源项目

字节携手北大开源Helios视频模型：14B参数实现19.5FPS，登顶Hugging Face！

春节期间，Seedance 2.0 的爆火将视频生成技术再次推向风口。紧随其后，字节跳动联合北京大学、安努智能及 Canva 共同开源了具备实时生成能力的视频模型系列——Helios。该系列包含 Helios-Base、Helios-Mid 与 Helios-Distilled 三个版本，全面支持文本到视频（T2V）、图像到视频（I2V）、视频到视频（V2V…

2026年3月7日

586000

AI产业动态

阿里Qwen3.5小模型震撼发布：0.8B参数即可处理视频，边缘AI时代正式开启！

阿里通义千问发布了Qwen3.5系列的四款小参数规模模型，分别为0.8B、2B、4B和9B。该系列的核心创新在于引入了Gated DeltaNet混合注意力机制，此项技术借鉴自其397B参数的大模型。该架构采用三层线性注意力层对应一层全注意力层的设计。线性层负责常规计算，内存占用保持恒定；全注意力层仅在需要精确计算时激活。这种3:1的配比使得模型在维持高质…

2026年3月3日

629000

AI大模型2月重磅更新盘点：阿里、阶跃星辰、智谱AI等巨头竞相发布，编程、视频、文档处理全面突破

2月1日【开源】阿里通义千问发布 Qwen3-Coder-Next 阿里发布了编程智能体模型 Qwen3-Coder-Next。该模型采用总参数为 800 亿的混合专家架构，每次推理仅激活 30 亿参数。在 SWE-Bench Verified 测试中，其问题解决率超过 70%，在保证高性能的同时有效控制了算力成本，适合对算力敏感的本地化开发场景。技术博…

AI产业动态 2026年3月2日

833000

大模型评测

阿里Qwen3.5-27B深度评测：理科思维突出，文档处理与逻辑推理是亮点，艺术创作待提升

阿里近期推出了Qwen3.5-27B模型，作为Qwen3.5系列中的中型主力版本，它定位为一款兼顾高性价比与密集推理需求的开源模型。其实际性能表现如何？以下是本次评测的核心结论。核心结论：三大亮点： OCR与文档理解能力出色：在纯文本提取、复杂表格结构还原及合并单元格识别等任务中表现精准，效果优于部分更大参数的模型。空间逻辑与数学推理能力强：在立体…

2026年3月1日

1.2K000

大模型评测

阿里Qwen3.5-27B实测：270亿参数密集模型杀入前十，成本骤降59%！

阿里在推出Qwen3.5系列的首款模型Qwen3.5-Plus后，于春节后发布了中型模型系列。Qwen3.5-27B是该系列中的密集模型，其全部270亿参数在每次推理时均被激活，未采用MoE机制。该模型延续了Qwen3.5的混合注意力架构，以3:1的比例交替使用Gated DeltaNet线性注意力层和标准全局注意力层，支持最高262K至1M的上下文窗口，并…

2026年2月27日

2.0K000

AI产业动态

阶跃星辰杀入AI季后赛，Step 3.5 Flash凭速度与智商跻身“新六小虎”第一梯队

国产大模型“季后赛”激战正酣春节刚过，国产大模型领域的竞争已进入白热化阶段。一方面，行业巨头投入巨大资源争夺市场：字节豆包、阿里千问、腾讯元宝等通过总计超40亿元的红包活动，吸引了海量用户参与。其成效显著：除夕当晚，豆包的AI互动量达19亿次，千问用户通过“一句话下单”功能完成了近2亿次操作。据报道，相关团队的员工在春节期间也持续工作，密切关注着竞争…

2026年2月26日

486000