深度神经网络

  • 通用子空间革命:1100+模型揭示深度神经网络收敛至共享低维空间的秘密

    关键词:通用子空间、深度神经网络、低秩子空间、模型可复用性、权重空间分析 在大模型时代,一个核心矛盾始终困扰着研究者:我们训练的模型规模持续增长(从百亿到万亿参数),但每次为适配新任务都需要从头微调或训练全新模型。这不仅消耗海量算力,还导致严重的参数冗余。例如,排除任务特定的输入/输出层后,存储500个Vision Transformer(ViT)模型约需8…

    2026年1月3日
    6800