模型融合

AI产业动态

模型融合新范式：SoCE方法如何通过类别专家加权实现大语言模型性能突破

在大语言模型（LLM）快速发展的今天，模型训练对算力和时间的依赖已成为制约技术迭代的关键瓶颈。传统的训练方法需要庞大的计算资源和精细的流程设计，而模型融合（Model Souping）作为一种轻量化的替代方案，通过权重平均融合多个同架构模型，在降低成本的同时实现能力互补。然而，传统的均匀平均方法往往忽视了不同任务类别间的性能差异，导致融合效果受限。近期，Me…

2025年11月21日
198000