突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

脉冲神经网络(SNN)长期以来被视为实现超低功耗智能计算的希望,但其性能往往落后于传统人工神经网络(ANN)。传统观点认为,SNN中二进制脉冲激活导致的信息损失是性能差距的主要原因。然而,香港科技大学(广州)等单位在NeurIPS 2025发表的研究提出了颠覆性见解:SNN性能不佳的根源并非二进制激活本身,而在于脉冲神经元固有的频率偏置问题。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

研究团队通过深入的理论分析和实验验证发现,脉冲神经元本质上是一个低通滤波器,会抑制高频成分并倾向于传播低频信息。这种频域上的不平衡导致SNN在处理图像等复杂数据时难以捕捉关键的细节和纹理,从而限制了其表征能力。团队通过傅里叶频谱分析直观展示了这一现象:在“输入→激活→加权”的信息流中,与传统ReLU等激活函数会扩展信号频率带宽不同,脉冲神经元会导致高频成分快速消散,进而造成特征模糊。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

为了验证这一发现,研究者在脉冲Transformer中进行了对照实验,分别采用平均池化(低通)和最大池化(高通)作为token混合器。在CIFAR-100数据集上的结果显示,使用Avg-Pool的性能为76.73%,而替换为Max-Pool后性能跃升至79.12%,提升了2.39%。这一结果与ANN Transformer的研究结论形成鲜明对比——在非脉冲Transformer中,倾向于捕捉全局模式的Avg-Pool通常是更优选择,但在脉冲Transformer中,能够保留局部细节的Max-Pool反而表现更佳。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

从理论层面,研究团队通过分析脉冲神经元充电过程的传递函数,证明了其本质上是一个一阶无限脉冲响应低通滤波器。尽管单个脉冲在频谱上看似“全通”,但其波形产生的高频成分是虚假的,无法在网络中有效传播。当这一过程在网络中逐层串联时,低频偏好会被急剧放大,这正是网络深层特征退化的根源。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

基于这一核心洞察,研究者提出了名为Max-Former的新型脉冲Transformer架构。该架构通过两个轻量级的“频率增强镜片”来补偿SNN天生的低频偏好:一是在Patch Embedding中增加额外的Max-Pool操作,在信息输入源头就主动注入高频信号;二是用深度卷积(DWC)替代早期阶段的自注意力机制。自注意力机制虽然强大,但计算复杂且倾向于平滑特征,而深度卷积能有效保留局部高频细节,同时计算复杂度远低于自注意力。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

值得注意的是,Max-Pool和DWC相对于序列长度仅需线性复杂度,且参数效率更高,这与具有二次计算复杂度的自注意力形成鲜明对比。在性能验证方面,Max-Former在多项基准测试中表现卓越:在ImageNet上,Max-Former-10-768(4时间步)取得了82.39%的Top-1准确率,以更少的参数量(63.99M vs 66.34M)大幅超越Spikformer达7.58%。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

在其他小规模数据集以及神经形态数据集上,Max-Former也均达到SOTA性能。更重要的是,在实现性能突破的同时,能量消耗降低了超过30%,真正实现了性能与能效的兼得。Grad-CAM可视化进一步表明,Max-Former中的频率增强算子有效矫正了SNN的“散光”现象,使其能够更清晰地捕捉图像关键区域。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

为了证明高频信息对SNN的重要性并非Transformer架构特有,研究者将这一洞察延伸到经典的卷积架构中,提出了Max-ResNet。结果显示,仅通过添加少量Max-Pooling操作,Max-ResNet-18就在CIFAR-10上达到97.17%,在CIFAR-100上达到83.06%,相比基线模型准确率分别大幅提升了2.25%和6.65%,创造了卷积类SNN的新SOTA纪录。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升

这项研究为理解SNN的性能瓶颈提供了全新的视角,表明SNN的优化路径不应是简单地模仿ANN的成功设计,而应针对其独特的计算特性进行专门优化。通过解决频率偏置问题,Max-Former不仅提升了SNN的性能上限,还保持了其低功耗优势,为边缘计算、物联网设备等资源受限场景的智能应用开辟了新可能。

突破SNN性能瓶颈:Max-Former揭示频率偏置是核心问题,以高频增强实现精度与能效双提升


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/6203

(0)
上一篇 2025年11月26日 下午1:38
下一篇 2025年11月26日 下午2:37

相关推荐

  • 小模型突破计算瓶颈:WorldModel-Qwen实现推理中WASM代码执行

    最近,开发者 bigattichouse 分享了一个有趣的实验:让 Qwen-0.6B 这样的小模型在推理过程中生成并执行 WASM 代码,从而获得确定性的计算结果。 这个项目的灵感借鉴了人类思维。在关于 AGI 与 LLM 智能的讨论中,“世界模型”的概念变得越来越重要。就像人类接球时大脑会建立物理模型一样,AI 模型也需要某种形式的世界建模能力。但对于 …

    AI产业动态 2026年1月17日
    38600
  • 从ATEC2025看具身智能的户外困境:感知局限与决策瓶颈如何制约机器人真正自主

    在第五届ATEC科技精英赛——全球首个全自主、全真实户外场景的机器人竞技场上,一个残酷的现实被反复验证:当人形机器人离开实验室的温室环境,面对真实的户外世界时,其通用能力遭遇了前所未有的挑战。香港中文大学山间小道上,一只人形机器人试图完成500米定向越野,却在跨越三十度小桥、走过石路、迈过台阶后,于九十度弯道处重心失衡仰面倒下。 同样的困境出现在岭南体育场的…

    2025年12月9日
    37000
  • 谷歌Nano Banana Pro引爆AI图像生成革命:从硅谷CEO合影到时空坐标推理的全面解析

    在人工智能技术飞速发展的今天,图像生成领域迎来了一次里程碑式的突破。谷歌最新发布的Nano Banana Pro(基于Gemini 3 Pro图像模型)不仅刷新了行业认知,更以惊人的真实感和理解能力重新定义了AI图像生成的边界。本文将从技术架构、应用场景、行业影响三个维度,深入剖析这一划时代产品的核心价值。 技术架构层面,Nano Banana Pro的成功…

    2025年11月23日
    30100
  • 阿里达摩院RynnBrain:让机器人长出物理直觉,破解柔性物体操作难题

    2026年,众多机器人登上春晚舞台,它们能为大家表演包饺子吗?这或许是许多人好奇的问题。 但根据近期的彩排报道,这种可能性并不大。机器人更可能被设计为托着托盘呈上饺子。 业内人士深知,如果不依赖预设编程或遥控操作,让机器人自主包饺子远比移动、导航复杂得多。这涉及到“饺子皮”这类堪称机器人“图灵测试”的柔性物体操作,没有一个足够聪明的“大脑”是难以完成的。这也…

    2026年2月10日
    52300
  • Apple Silicon神经引擎潜力爆发:M4 Pro ANE实现3.8 TFLOPS,能效超GPU 80%

    关键词:Apple Silicon、专用硬件加速器(DSA)、ANE、NUC、HPC、性能评估 当我们在谈论苹果自研芯片 M1、M2、M3 乃至最新的 M4 时,我们在谈论什么?绝大多数人的第一反应是其惊人的能效比、无风扇的轻薄本体验,或是那颗用于剪辑 ProRes 视频的强大媒体引擎。 但在这些光鲜的表面之下,苹果芯片中其实一直藏着一个极为低调却又潜力巨大…

    2026年2月14日
    75500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注