隐私保护
-
联邦学习安全防线告急?港大TPAMI新作揭秘梯度反转攻击三大门派与防御指南
本文第一作者郭鹏鑫,香港大学博士生,研究方向是联邦学习、大模型微调等。本文共同第一作者王润熙,香港大学硕士生,研究方向是联邦学习、隐私保护等。本文通讯作者屈靓琼,香港大学助理教授,研究方向包含 AI for Healthcare、AI for Science、联邦学习等。 联邦学习(Federated Learning, FL)旨在保护数据隐私,但梯度反转攻…
-
从“我不是机器人”到隐私监控:reCAPTCHA的演化与AI训练数据伦理困境
近日,一段关于“猫屎团”验证码的调侃视频在社交媒体上引发热议。视频中,用户需要将灰色的“猫屎团”拖入垃圾桶,并勾选“我不是猫”才能通过验证。这一看似荒诞的场景,实际上折射出图形验证码(CAPTCHA)技术演化的深层逻辑——从单纯的人机识别工具,演变为大规模数据收集机制,最终引发隐私监控的伦理争议。 验证码技术的起源可追溯至2000年代初,其全称“全自动区分计…
-
DistilledPRAG:不暴露明文文档的隐私保护RAG新范式
你是否考虑过RAG流水线中的文档隐私风险?本文介绍一种新方法,旨在解决此问题。 为何“标准RAG → 云端搜索”存在隐私缺陷 标准RAG将明文文档直接输入提示词。对于企业合同、医疗记录或个人笔记等敏感数据,这种做法在设计上就暴露了信息,不可行。 参数化RAG尝试将知识“烘焙”进LoRA权重,但在实践中面临两大挑战: 运维负担与时延:每份文档都需要生成合成问答…