Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

近日,日本AI初创公司Sakana AI宣布完成200亿日元(约合1.35亿美元)的B轮融资,公司估值达到约4000亿日元(约合26.35亿美元),创下日本非上市初创企业的估值纪录。这一数字不仅刷新了日本科技创业生态的天花板,更在全球AI投资趋冷的背景下显得格外耀眼。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI成立于2023年7月,由Transformer论文八位作者之一的Llion Jones与谷歌前高级科学家David Ha联合创立。公司总部设在东京,投资方阵容堪称豪华:除了参与A轮融资的英伟达外,还包括美国顶级风投机构Khosla Ventures、NEA,以及日本产业巨头三菱日联、四国电力等。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

**创始团队的技术基因与创业逻辑**

Llion Jones作为Transformer架构的核心贡献者,其技术背景为Sakana AI奠定了坚实的学术基础。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

在谷歌研究院工作期间,他深度参与了多项前沿AI研究,但最终选择离开,原因在于大型科技公司的组织结构限制了个体研究者的创新空间。Jones曾公开表示,谷歌让他感到“被困住”,这种感受促使他寻求更具灵活性的创业环境。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

联合创始人David Ha则带来了产业化的视角。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

作为前谷歌大脑高级科学家、Stability AI研究部门负责人,他不仅具备扎实的研究能力,更拥有将技术转化为产品的经验。今年8月,David Ha入选《时代》杂志“2025年人工智能领域百大人物”,进一步印证了其在行业内的认可度。

选择东京作为总部,体现了Sakana AI独特的战略考量。北美生成式AI领域竞争已呈白热化,人才争夺战加剧了研发成本。相比之下,日本虽然AI生态相对滞后,但拥有高质量的研究人才和相对宽松的竞争环境。更重要的是,日本资源有限的国情与Sakana AI“高效AI”的理念高度契合——在电力等基础设施约束下,提升模型效率不再是可选优化,而是生存必需。

**自然启发智能:从Transformer到进化模型合并**

Sakana AI最引人注目的并非其豪华团队,而是其颠覆性的技术路线。公司明确表示不会成为“日本的OpenAI”,而是要探索一条基于自然启发智能(nature-inspired intelligence)的全新路径。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

这一理念的核心在于借鉴自然界的进化机制和集体智慧。Jones指出,当前主流大模型存在结构性缺陷:它们被设计为固定架构,缺乏适应性和弹性。相比之下,自然系统通过简单个体间的协作,能够涌现出复杂智能行为,且对环境变化高度敏感。Sakana AI试图将这种原理应用于AI开发,通过让多个小型模型协作,替代单一巨型模型,从而降低计算成本、提升系统鲁棒性。

2024年8月,Sakana AI推出的“The AI Scientist”系统首次验证了这一思路的可行性。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

该系统能够自主完成从研究构思、实验设计、代码编写到论文撰写的全流程,生成的十篇学术论文每篇成本仅约15美元。更值得关注的是,其中一篇论文的创意后来被研究人员扩展,并在arXiv上公开发表——这标志着AI不仅能够模仿人类研究,还能真正启发创新。

**技术突破:进化模型合并的工程实践**

The AI Scientist的成功建立在Sakana AI更早的一项研究基础上:进化模型合并(Evolutionary Model Merge)。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

该方法受自然选择启发,通过组合Huggingface上的现有模型,无需梯度训练即可生成性能优异的新模型。例如,他们开发的70亿参数日语数学大模型,在基准测试中超越了700亿参数的Llama-2等更大模型,而计算资源消耗大幅降低。

这一突破的意义在于,它挑战了“更大即更好”的大模型发展范式。传统训练方法需要海量数据和算力,而进化模型合并通过智能组合现有能力,实现了效率的阶跃式提升。对于日本这样资源受限的市场,这种技术路径具有天然的适配性。

**估值逻辑与行业启示**

Sakana AI的高估值反映了投资者对差异化技术路线的认可。在全球大模型军备竞赛中,绝大多数公司仍在Transformer架构上做增量改进,而Sakana AI选择了根本性创新。其自然启发智能的研究方向,不仅有望解决计算效率问题,还可能开辟出更安全、更可控的AI系统设计方法。

从产业角度看,Sakana AI的崛起标志着AI创新中心的多极化。硅谷不再是唯一的技术策源地,东京凭借其独特的资源条件和人才储备,正在孕育出具有全球竞争力的AI公司。这对于整个亚洲AI生态的发展具有示范意义。

未来,Sakana AI面临的关键挑战在于如何将研究突破转化为可持续的商业产品。The AI Scientist展示了其在科研自动化领域的潜力,但要实现规模化应用,仍需解决领域适应性、结果可靠性等工程问题。不过,凭借其强大的技术基因和清晰的战略定位,Sakana AI有望成为下一代AI架构的重要参与者。

— 图片补充 —

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/6698

(0)
上一篇 2025年11月19日 下午1:58
下一篇 2025年11月19日 下午2:36

相关推荐

  • Emu3.5:原生多模态世界模型的范式革命与第三种Scaling路径

    2025年,人工智能领域正经历一场从语言智能向物理世界智能的深刻范式转移。”世界模型”这一概念已从学术构想演变为科技巨头竞逐的核心战场,其目标在于构建能够理解、预测并生成动态物理环境的AI系统。谷歌的Genie 3凭借一句话生成720p实时模拟世界的能力,被业界喻为”游戏引擎2.0″;李飞飞团队推出的RTFM模…

    2025年11月3日
    18100
  • 华为发布扩散语言模型Agent:部分场景效率飙升8倍,开启AI智能体新范式

    大模型通往现实世界的“最后三公里”:Agent范式迎来效率革命 当前,衡量AI智能体(Agent)能力的标准已发生深刻变化。核心不再仅仅是“答对问题”,而是看其能否在面对多轮推理、工具调用及复杂协作时,以最短的路径和最少的交互成本,稳定地完成任务。 在此背景下,一个根本性问题凸显出来:当Agent的框架、工具、数据和训练方式均保持一致时,仅改变其底层语言模型…

    2026年2月10日
    12700
  • AI重塑跨境电商:1688“遨虾”如何用智能体重构B2B供应链三环节

    在AI技术从概念验证迈向产业落地的关键阶段,B2B领域正成为价值创造的前沿阵地。作为中国最大的B2B供应链平台,阿里巴巴旗下1688近期推出的跨境电商AI智能体“遨虾”(alphashop.cn),标志着AI正从辅助工具升级为核心生产力引擎。本文将从技术架构、产业影响和商业逻辑三个维度,深入分析这一变革如何重构跨境电商的选品、采购、上架全流程。 **一、技术…

    2025年12月7日
    43700
  • OpenAI人才地震再升级!核心VP主动降级跳槽Anthropic,只为回归一线RL研究

    OpenAI人才地震再升级!核心VP主动降级跳槽Anthropic,只为回归一线RL研究 前OpenAI研究副总裁马克斯·施瓦泽(Max Schwarzer)近日宣布离职,并已加入竞争对手Anthropic。这位主导了o1、o3及GPT-5系列模型后期训练的核心人物,其离职理由并非被高薪挖角,而是“渴望回归一线独立贡献者(IC)的研究工作”。 施瓦泽在Ope…

    2026年3月5日
    17100
  • 英伟达2025挖人战略:从巨头挖高管,用华人团队重塑增长曲线

    henry 发自 凹非寺 量子位 | 公众号 QbitAI 已经是全球市值第一了,还怎么继续往上走? 英伟达给出的答案很简单:挖人,挖更多的人。 过去的2025年,黄仁勋一边扩编管理层,一边掏钱收团队——从挖角市场、政策、人力资源高管,到收购初创公司“打包”引入技术负责人,一套典型的“黄氏挖人+黄氏收购”正在成型。 不止芯片,用挖人重塑“第二增长曲线” 20…

    2026年1月18日
    28900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注