Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

近日,日本AI初创公司Sakana AI宣布完成200亿日元(约合1.35亿美元)的B轮融资,公司估值达到约4000亿日元(约合26.35亿美元),创下日本非上市初创企业的估值纪录。这一数字不仅刷新了日本科技创业生态的天花板,更在全球AI投资趋冷的背景下显得格外耀眼。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI成立于2023年7月,由Transformer论文八位作者之一的Llion Jones与谷歌前高级科学家David Ha联合创立。公司总部设在东京,投资方阵容堪称豪华:除了参与A轮融资的英伟达外,还包括美国顶级风投机构Khosla Ventures、NEA,以及日本产业巨头三菱日联、四国电力等。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

**创始团队的技术基因与创业逻辑**

Llion Jones作为Transformer架构的核心贡献者,其技术背景为Sakana AI奠定了坚实的学术基础。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

在谷歌研究院工作期间,他深度参与了多项前沿AI研究,但最终选择离开,原因在于大型科技公司的组织结构限制了个体研究者的创新空间。Jones曾公开表示,谷歌让他感到“被困住”,这种感受促使他寻求更具灵活性的创业环境。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

联合创始人David Ha则带来了产业化的视角。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

作为前谷歌大脑高级科学家、Stability AI研究部门负责人,他不仅具备扎实的研究能力,更拥有将技术转化为产品的经验。今年8月,David Ha入选《时代》杂志“2025年人工智能领域百大人物”,进一步印证了其在行业内的认可度。

选择东京作为总部,体现了Sakana AI独特的战略考量。北美生成式AI领域竞争已呈白热化,人才争夺战加剧了研发成本。相比之下,日本虽然AI生态相对滞后,但拥有高质量的研究人才和相对宽松的竞争环境。更重要的是,日本资源有限的国情与Sakana AI“高效AI”的理念高度契合——在电力等基础设施约束下,提升模型效率不再是可选优化,而是生存必需。

**自然启发智能:从Transformer到进化模型合并**

Sakana AI最引人注目的并非其豪华团队,而是其颠覆性的技术路线。公司明确表示不会成为“日本的OpenAI”,而是要探索一条基于自然启发智能(nature-inspired intelligence)的全新路径。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

这一理念的核心在于借鉴自然界的进化机制和集体智慧。Jones指出,当前主流大模型存在结构性缺陷:它们被设计为固定架构,缺乏适应性和弹性。相比之下,自然系统通过简单个体间的协作,能够涌现出复杂智能行为,且对环境变化高度敏感。Sakana AI试图将这种原理应用于AI开发,通过让多个小型模型协作,替代单一巨型模型,从而降低计算成本、提升系统鲁棒性。

2024年8月,Sakana AI推出的“The AI Scientist”系统首次验证了这一思路的可行性。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

该系统能够自主完成从研究构思、实验设计、代码编写到论文撰写的全流程,生成的十篇学术论文每篇成本仅约15美元。更值得关注的是,其中一篇论文的创意后来被研究人员扩展,并在arXiv上公开发表——这标志着AI不仅能够模仿人类研究,还能真正启发创新。

**技术突破:进化模型合并的工程实践**

The AI Scientist的成功建立在Sakana AI更早的一项研究基础上:进化模型合并(Evolutionary Model Merge)。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

该方法受自然选择启发,通过组合Huggingface上的现有模型,无需梯度训练即可生成性能优异的新模型。例如,他们开发的70亿参数日语数学大模型,在基准测试中超越了700亿参数的Llama-2等更大模型,而计算资源消耗大幅降低。

这一突破的意义在于,它挑战了“更大即更好”的大模型发展范式。传统训练方法需要海量数据和算力,而进化模型合并通过智能组合现有能力,实现了效率的阶跃式提升。对于日本这样资源受限的市场,这种技术路径具有天然的适配性。

**估值逻辑与行业启示**

Sakana AI的高估值反映了投资者对差异化技术路线的认可。在全球大模型军备竞赛中,绝大多数公司仍在Transformer架构上做增量改进,而Sakana AI选择了根本性创新。其自然启发智能的研究方向,不仅有望解决计算效率问题,还可能开辟出更安全、更可控的AI系统设计方法。

从产业角度看,Sakana AI的崛起标志着AI创新中心的多极化。硅谷不再是唯一的技术策源地,东京凭借其独特的资源条件和人才储备,正在孕育出具有全球竞争力的AI公司。这对于整个亚洲AI生态的发展具有示范意义。

未来,Sakana AI面临的关键挑战在于如何将研究突破转化为可持续的商业产品。The AI Scientist展示了其在科研自动化领域的潜力,但要实现规模化应用,仍需解决领域适应性、结果可靠性等工程问题。不过,凭借其强大的技术基因和清晰的战略定位,Sakana AI有望成为下一代AI架构的重要参与者。

— 图片补充 —

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/6698

(0)
上一篇 2025年11月19日 下午1:58
下一篇 2025年11月19日 下午2:36

相关推荐

  • MemGovern框架:让AI从GitHub历史经验中学习,Bug修复率提升至69.8%

    MemGovern框架:让AI从GitHub历史经验中学习,Bug修复率提升至69.8% 当前,大语言模型驱动的代码智能体在自动化软件工程领域带来了变革,但它们普遍面临“封闭世界”的认知局限:现有的智能体往往试图从零开始修复Bug,或者仅依赖仓库内的局部上下文,而忽略了GitHub等平台上积累的浩瀚历史人类经验。 事实上,人类工程师在解决复杂问题时,往往会搜…

    2026年1月16日
    42600
  • 贝索斯百亿押注实体AI:从文本智能到物理世界的范式革命

    在硅谷的创新版图上,一场从虚拟到实体的AI范式迁移正在悄然发生。亚马逊创始人杰夫·贝索斯以62亿美元启动资金创立的「Project Prometheus」,不仅标志着这位科技巨擘职业生涯的再次启航,更可能彻底改写人工智能与实体产业融合的权力格局。这一战略转向,超越了当前以ChatGPT为代表的大语言模型热潮,将AI的战场从文本处理延伸至物理世界的复杂任务执行…

    2025年11月18日
    31100
  • AutoGLM开源:大模型从Chat到Act的范式突破,开启手机智能体新纪元

    近日,智谱AI全面开源了AutoGLM项目,这一基于视觉语言模型的手机智能助理框架,标志着大模型技术从“对话”到“行动”的范式转变迈出了关键一步。用户仅需用自然语言描述任务,AI便能理解意图、识别手机屏幕内容并自动执行操作,真正实现了让手机“自己动起来”的愿景。这一突破不仅为AI应用落地开辟了新路径,更在具身智能与智能体领域引发了广泛关注。 从技术架构来看,…

    2025年12月12日
    48900
  • 亚马逊云科技放大招:AI助手Amazon Quick打通生态,OpenAI模型首次接入Bedrock

    云计算巨头放大招:AI助手Amazon Quick打通生态,OpenAI模型首登Bedrock 云计算领域的领跑者,亚马逊云科技,刚刚端出了一道重磅“硬菜”。 这道菜的名字叫做 Amazon Quick。 它就像一位“常驻”在你电脑里的智能管家,能够直接连接你的本地文件、日历、邮件和各类应用程序,全程无需手动上传任何文件(但需要获得授权)。 然而,最核心的一…

    2026年4月29日
    28200
  • 千P级智算中心建设方案:AI大模型时代的算力基石

    一、算力中心建设方案 (一) 建设规模 AI大模型时代已经来临,人工智能技术的创新与变革催生出几何级增长的算力需求。据OpenAI数据显示,算力需求每3至4个月便需翻倍。大模型虽增强了AI技术的通用性,助力行业AI普惠化,但其参数量已攀升至数千亿级别,训练数据集规模亦高达TB级别。通常,完成单个大模型的训练即需投入超过200 PFlops的智能算力资源。综合…

    2026年1月29日
    76300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注