认知不确定性

大模型训练

自我蒸馏的陷阱：为何AI“抄袭”自己思考反而损害数学推理能力？

自我蒸馏的陷阱：为何AI“抄袭”自己思考反而损害数学推理能力？当 AI 试图通过“抄袭”自己的思考过程来变得更高效时，它可能无意中丢掉了最宝贵的品质——承认“我可能错了”。在人工智能领域，一种名为“自我蒸馏”（Self-Distillation）的后训练范式正迅速崛起。其核心思想极具吸引力：让模型自己充当老师，利用更丰富的上下文信息（如标准答案）来指导学…

2026年3月30日
404000