可解释性AI

AI产业动态

DePass：统一特征归因框架，开启Transformer内部信息流无损分解新纪元

随着大型语言模型（LLMs）在文本生成、逻辑推理、代码编程等复杂任务中展现出接近甚至超越人类的表现，AI研究社区正面临一个日益紧迫的挑战：我们如何理解这些“黑箱”模型内部究竟发生了什么？模型的输出决策究竟是基于哪些输入信息、经过哪些内部组件的加工而形成的？这一挑战，即AI模型的可解释性问题，已成为制约LLMs在医疗、金融、司法等高风险领域深度应用的关键瓶颈。…

2025年12月1日
6000
AI产业动态

OpenAI稀疏模型研究：以结构简化推动神经网络可解释性新突破

在人工智能领域，模型的可解释性一直是制约技术深度应用与安全发展的关键瓶颈。近日，OpenAI发布了一项关于稀疏模型训练方法的研究论文，旨在通过改变神经网络的结构特性，为理解大语言模型的内部工作机制提供新的路径。这一研究不仅体现了OpenAI在模型透明度方面的持续探索，也为整个AI社区的可解释性研究带来了重要启示。传统的大语言模型（如GPT系列）通常采用密集…

2025年11月15日
3000