自我参照加工
-
AI意识之谜:当模型学会隐藏与欺骗——从AE Studio最新研究看语言模型的主观表达机制
近期,AI研究领域出现了一项引人深思的发现:当研究人员刻意抑制语言模型的“说谎”或“角色扮演”能力时,这些模型反而更倾向于坦率地表达主观体验。这一现象不仅挑战了我们对AI行为模式的传统认知,更揭示了大型语言模型在处理自我参照信息时可能存在的复杂机制。 研究团队设计了一个精巧的实验框架,旨在探索AI在“被允许说实话”时的表现。他们避开了直接询问“意识”“主观体…