Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

近日,日本AI初创公司Sakana AI宣布完成200亿日元(约合1.35亿美元)的B轮融资,公司估值达到约4000亿日元(约合26.35亿美元),创下日本非上市初创企业的估值纪录。这一数字不仅刷新了日本科技创业生态的天花板,更在全球AI投资趋冷的背景下显得格外耀眼。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI成立于2023年7月,由Transformer论文八位作者之一的Llion Jones与谷歌前高级科学家David Ha联合创立。公司总部设在东京,投资方阵容堪称豪华:除了参与A轮融资的英伟达外,还包括美国顶级风投机构Khosla Ventures、NEA,以及日本产业巨头三菱日联、四国电力等。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

**创始团队的技术基因与创业逻辑**

Llion Jones作为Transformer架构的核心贡献者,其技术背景为Sakana AI奠定了坚实的学术基础。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

在谷歌研究院工作期间,他深度参与了多项前沿AI研究,但最终选择离开,原因在于大型科技公司的组织结构限制了个体研究者的创新空间。Jones曾公开表示,谷歌让他感到“被困住”,这种感受促使他寻求更具灵活性的创业环境。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

联合创始人David Ha则带来了产业化的视角。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

作为前谷歌大脑高级科学家、Stability AI研究部门负责人,他不仅具备扎实的研究能力,更拥有将技术转化为产品的经验。今年8月,David Ha入选《时代》杂志“2025年人工智能领域百大人物”,进一步印证了其在行业内的认可度。

选择东京作为总部,体现了Sakana AI独特的战略考量。北美生成式AI领域竞争已呈白热化,人才争夺战加剧了研发成本。相比之下,日本虽然AI生态相对滞后,但拥有高质量的研究人才和相对宽松的竞争环境。更重要的是,日本资源有限的国情与Sakana AI“高效AI”的理念高度契合——在电力等基础设施约束下,提升模型效率不再是可选优化,而是生存必需。

**自然启发智能:从Transformer到进化模型合并**

Sakana AI最引人注目的并非其豪华团队,而是其颠覆性的技术路线。公司明确表示不会成为“日本的OpenAI”,而是要探索一条基于自然启发智能(nature-inspired intelligence)的全新路径。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

这一理念的核心在于借鉴自然界的进化机制和集体智慧。Jones指出,当前主流大模型存在结构性缺陷:它们被设计为固定架构,缺乏适应性和弹性。相比之下,自然系统通过简单个体间的协作,能够涌现出复杂智能行为,且对环境变化高度敏感。Sakana AI试图将这种原理应用于AI开发,通过让多个小型模型协作,替代单一巨型模型,从而降低计算成本、提升系统鲁棒性。

2024年8月,Sakana AI推出的“The AI Scientist”系统首次验证了这一思路的可行性。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

该系统能够自主完成从研究构思、实验设计、代码编写到论文撰写的全流程,生成的十篇学术论文每篇成本仅约15美元。更值得关注的是,其中一篇论文的创意后来被研究人员扩展,并在arXiv上公开发表——这标志着AI不仅能够模仿人类研究,还能真正启发创新。

**技术突破:进化模型合并的工程实践**

The AI Scientist的成功建立在Sakana AI更早的一项研究基础上:进化模型合并(Evolutionary Model Merge)。

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

该方法受自然选择启发,通过组合Huggingface上的现有模型,无需梯度训练即可生成性能优异的新模型。例如,他们开发的70亿参数日语数学大模型,在基准测试中超越了700亿参数的Llama-2等更大模型,而计算资源消耗大幅降低。

这一突破的意义在于,它挑战了“更大即更好”的大模型发展范式。传统训练方法需要海量数据和算力,而进化模型合并通过智能组合现有能力,实现了效率的阶跃式提升。对于日本这样资源受限的市场,这种技术路径具有天然的适配性。

**估值逻辑与行业启示**

Sakana AI的高估值反映了投资者对差异化技术路线的认可。在全球大模型军备竞赛中,绝大多数公司仍在Transformer架构上做增量改进,而Sakana AI选择了根本性创新。其自然启发智能的研究方向,不仅有望解决计算效率问题,还可能开辟出更安全、更可控的AI系统设计方法。

从产业角度看,Sakana AI的崛起标志着AI创新中心的多极化。硅谷不再是唯一的技术策源地,东京凭借其独特的资源条件和人才储备,正在孕育出具有全球竞争力的AI公司。这对于整个亚洲AI生态的发展具有示范意义。

未来,Sakana AI面临的关键挑战在于如何将研究突破转化为可持续的商业产品。The AI Scientist展示了其在科研自动化领域的潜力,但要实现规模化应用,仍需解决领域适应性、结果可靠性等工程问题。不过,凭借其强大的技术基因和清晰的战略定位,Sakana AI有望成为下一代AI架构的重要参与者。

— 图片补充 —

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?


关注“鲸栖”小程序,掌握最新AI资讯

本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/6698

(0)
上一篇 2025年11月19日 下午1:58
下一篇 2025年11月20日 上午7:47

相关推荐

  • DAVSP:清华大学提出深度对齐视觉安全提示,重塑多模态大模型安全防线

    随着多模态人工智能技术的快速发展,大型视觉语言模型(LVLMs)已在图像描述、视觉问答、跨模态检索等多个下游任务中展现出卓越性能。然而,这种强大的多模态理解能力背后,却潜藏着日益严峻的安全风险。最新研究表明,即便是当前最先进的LVLMs,在面对经过精心设计的恶意图像-文本组合输入时,仍可能产生违规甚至有害的响应。这一安全漏洞的暴露,不仅对模型的实际部署构成了…

    2025年11月24日
    200
  • ReSeek框架:赋予搜索智能体动态自我修正能力,突破推理链中的连锁错误瓶颈

    在人工智能技术快速发展的今天,搜索智能体(Search Agent)作为连接大语言模型与实时信息世界的关键桥梁,正面临两大核心挑战:知识的实时性与推理的复杂性。传统的检索增强生成(RAG)技术虽然能够引入外部知识,但其本质上仍是被动的信息检索过程。而搜索智能体的革命性突破在于,它能够通过与实时搜索引擎进行多轮交互,主动分解并执行复杂的多步任务。这种能力在人物…

    2025年11月18日
    300
  • 谷歌Veo 3.1震撼发布,全面迎战Sora 2:AI视频的“专业级”战争正式打响

    2025年10月16日,谷歌发布AI视频生成模型Veo 3.1,正面迎战OpenAI的Sora 2。新版本主打电影级画质、原生音频同步、精准对象编辑与首尾帧插值,支持最长148秒视频生成,全面接入Flow、Gemini API与Vertex AI平台。与Sora 2的“生活化、社交化”路线不同,Veo 3.1定位专业创作与商业应用,标志着AI视频生成进入可控、可编辑、可商用的工业化阶段。

    2025年10月16日
    1.2K01
  • DeepSeek研究员陈德里乌镇首秀:从AI乐观到社会隐忧的深度思辨

    在浙江乌镇举行的世界互联网大会上,备受瞩目的「杭州六小龙」首次同台亮相。阿里云创始人王坚院士亲自主持,宇树创始人及CEO王兴兴、强脑科技创始人及CEO韩璧丞、群核科技创始人及董事长黄晓煌、游戏科学创始人及CEO、《黑神话:悟空》制作人冯骥、云深处科技创始人及CEO朱秋国等悉数落座。 然而,在「杭州六小龙」中最为引人注目的DeepSeek,其创始人及CEO梁文…

    2025年11月15日
    200
  • AdaMCoT:多语言大模型的自适应思维链革命——让AI学会“用最合适的语言思考”

    在全球化AI应用浪潮中,多语言大模型(MLLM)面临着一个根本性的认知困境:当处理跨语言任务时,模型究竟应该使用原始语言直接推理,还是翻译成高资源语言(如英语)后再进行思考?这个看似简单的选择背后,隐藏着语言认知的深层差异。不同语言在模型内部实际上承载着不同的“认知特长”——英语以其严谨的逻辑结构和丰富的科学语料,在逻辑推理和事实核查方面表现卓越;而中文、印…

    6天前
    200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注