循环深度Transformer
-
OpenMythos开源:循环深度Transformer架构揭秘,用一半参数实现同等效果
近期,一个名为OpenMythos的开源项目整合了公开研究及对Claude Mythos架构的主流推测,实现了一种创新的循环深度Transformer架构。 该架构名为循环深度Transformer,其核心在于通过跨专家的权重共享与条件计算实现迭代深度。已有研究证实,这种设计能以仅一半的参数量,达到与传统模型同等的性能。 核心思路:不堆叠参数,而增加循环 该…