深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？

随着深度伪造技术的不断进步，演艺行业的明星们已成为换脸技术的最大受害者。近日，多起演员被换脸、克隆，甚至用于虚假宣传的事件频频曝光，引发了社会的广泛关注。

例如，网友发现 AI 短剧《重生后，我成了娘亲的守护神》第 14 集开头疑似使用了演员杨紫的脸。某短剧平台则在未经许可的情况下，使用 AI 换脸技术伪造了易烊千玺的肖像与声音。

深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
网友称AI短剧《重生后，我成了娘亲的守护神》第14集开头疑似使用了演员杨紫的脸。

深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
某短剧平台多部AI短剧在未经许可的情况下使用AI换脸技术，伪造星易烊千玺的肖像及声音。

深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
演员王劲松也曾就AI虚假代言发声。

不仅演员们纷纷发声，官方也开始出手。中国广播电视社会组织联合会演员委员会于 4 月 2 日发布严正声明，强烈谴责 AI 换脸、素材滥用及违规训练 AI 模型等行为，发出行业警告：严守法律底线，捍卫视听真实。

| 深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
—|—

随着各类图像和视频生成模型的飞速迭代，人眼已经难以分辨真实与伪造的界限。换脸技术，只是这一技术滥用的冰山一角。

更为严重的是，深度伪造技术滥用的风险急剧上升——从库里采访的 AI 杜撰事件，到 AI 生成的假水果图骗取退款，这些乱象正在严重挑战社会信任和内容平台的生态。

| 深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
—|—

在这个技术乱象丛生的时代，如何让 AI 具备“火眼金睛”成了当务之急。

最近，计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛（Robust AI-Generated Image Detection in the Wild Challenge）结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到 0.9723，成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。这场挑战赛吸引了全球 500 多支队伍的参与。

深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？

与此同时，蚂蚁团队还发布了业内最全面的 AIGC 图像视频检测资源仓库。这个仓库整合了最新的热点事件、前沿论文、基准数据集及实用工具，为全球研究人员提供了一个技术参考的宝贵资源。团队将持续更新，确保资源的时效性与前沿性，以应对 AI 生成内容带来的挑战。

深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
开源仓库 ：Awesome-AIGC-Image-Video-Detection

现实挑战：AIGC 鉴真面临的双重鸿沟

虽然现有的 AI 鉴真技术在标准高质量基准测试中表现不俗，但面对复杂多变的真实开放场景时，检测模型的准确率往往会出现断崖式下降。这一现象使得业内急需解决两个核心技术难题。

一个是跨域泛化能力不足。 不同生成架构和闭源商业平台的生成机制差异巨大，伪影特征也随之变化。传统检测模型常常对单一训练数据过拟合，一旦遇到新的生成体系，便容易失效，难以识别新型伪造内容。

另一个是真实世界的降质干扰。图像在互联网传播过程中，不可避免地经历压缩、模糊、加噪等降质处理，这些退化现象往往会掩盖微弱的生成痕迹，极大增加了鉴伪的难度。

正是基于这些痛点，本次 CVPR 挑战赛特别聚焦于如何在「未知生成架构」与「复杂退化干扰」双重考验下，依然保持模型的高准确率和高鲁棒性。

解决方案：基于 DINOv3 的鲁棒检测框架

为了应对上述挑战，蚂蚁安全团队提出了一种基于 DINOv3 视觉基础模型 的鲁棒集成检测框架。这一框架充分发挥了 DINOv3 在高频细节上的强大表征能力，并结合数据构建、模型架构和优化策略的创新，成功实现了从实验室基准到复杂真实场景的有效迁移。

深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？

分层级数据构建：百万级多源训练语料
高质量且多维的数据集是打破过拟合的基石。团队依托深厚的数据积累，构建了包含数百万样本的复杂训练语料库，层次化覆盖四类数据来源：开源学术基准、主流开源生成模型定向合成、商业闭源 API 高保真样本，以及比赛官方数据，确保对当前主流生成生态的全面覆盖。

双流特征融合的集成架构：充分挖掘表征潜力
为充分挖掘 DINOv3 在复杂高频细节上的表征潜力，团队设计了双流并行架构。架构将多组不同配置的 DINOv3 主干网络划分为两个独立的网络组，每组内部通过多尺度特征融合机制聚合局部空间特征与全局语义信息，最终由 MLP 模块输出分支预测结果。在决策层面，两个网络组独立执行特征提取与预测，最终通过加权平均完成后融合。这种设计既避免早期特征级联的信息淹没问题，又通过不同配置网络的互补效应，提取出更加全局、立体的图像表征。

难度感知的鲁棒数据增强：模拟真实传播链路的阶梯式退化
真实世界的图像在互联网传播中会经历压缩、模糊、加噪、截取等多级退化，掩盖原有的微弱生成痕迹。为缩小实验室数据与真实场景的分布差异，团队构建了阶梯式的鲁棒数据增强链路：
* 多类型退化的系统模拟：涵盖模糊、噪声、压缩伪影、色彩偏移及几何畸变等多种退化类型，通过分层强度配置，实现从单一扰动到复杂复合扰动的递进式模拟，深度还原互联网传播链路中的多级退化特征。
* 高保真感知增强机制：引入神经网络压缩模型模拟先进编码失真，同时补充社交平台传播压缩、二次翻拍及截屏等非对称退化样本，填补算法模拟与真实边缘场景的分布差异。

模型优化：构建平滑鲁棒的参数空间
* Focal Loss：针对退化样本检测难易度不均的问题，动态抑制易分类样本权重，强制模型聚焦被严重降质掩盖的困难样本。
* 随机权重平均（SWA）：在训练收敛后期对参数空间内多个权重轨迹平滑平均，引导模型收敛至更平坦的极小值区域，降低过拟合风险。
* TTA 机制：推理阶段联合原始图像及其水平翻转版本进行结果平均，有效提升推理稳定性。

通过这一系列技术创新，蚂蚁团队不仅解决了当前 AIGC 检测技术在面对多变场景时的诸多挑战，还为未来更高效、更精准的深度伪造检测奠定了基础，进一步推动了 AI 鉴真技术的发展。

产研并进：打破黑盒瓶颈，拓宽 AIGC 鉴真技术边界

蚂蚁安全团队在 AI 鉴真技术的理论与方法上不断创新，近期在 CVPR、ICLR 等国际顶级会议上发布了多项高水平研究成果。这些突破不仅为 AI 鉴真领域带来了新的技术思路，也为破解现有技术瓶颈奠定了基础。

团队的目标是打破传统鉴真模型的黑盒局限，未来的AI鉴真技术将不仅仅是简单的二分类任务，而是具备强大的泛化能力，并能像人类专家一样进行推理。

Veritas 框架 便是这一努力的具体体现。通过结合多模态大语言模型和模式感知推理机制，团队突破了传统大模型纯文本思维链的限制，使得模型在面对未知生成器时，能展现出更强的适应性和推理能力。

Veritas 框架
在跨域、跨操控类型的检测场景中，Veritas 框架超越了现有 SOTA 方法的性能，并且能够输出透明且令人信服的推理过程，展示了人工智能在应对深度伪造问题时的巨大潜力。该研究成果被 ICLR 2026 录用为口头报告，进一步证明了其在学术界的影响力。

| 深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？
—|—

Locate-Then-Examine 范式
与此同时，团队还提出了另一项创新——Locate-Then-Examine。这一两阶段检测新范式通过「先定位可疑区域，再进行细节审查」的方法，极大提升了检测精度，并有效解决了当前模型普遍存在的幻觉问题。这一技术的推出，使得 AI 鉴真在实际应用中更加准确和可靠，标志着 AIGC 检测技术迈向了新的高度。

| 深度伪造泛滥：演艺圈成重灾区，蚂蚁集团AI安全技术如何练就“火眼金睛”？