关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3543人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊萨克遭范德芬剪刀脚,伤病分析师:前者很大可能伤缺8-10周

懂球帝 浏览 3806

北向资金三季度持仓曝光:宁德市值第一,京东方A获增持股数最多

澎湃新闻 浏览 4567

伊姐周六热推:电视剧《寻雪迷踪》;电视剧《秋雪漫过的冬天》......

伊周潮流 浏览 3491

搭载VLA大模型 魏牌全新蓝山智能进阶版年内上市

网易汽车 浏览 4001

台媒:面对解放军军演 台当局黔驴技穷、原形毕露

参考消息 浏览 19185

汤唯最刻骨铭心的那段情,我每年都想重温

Yuki女人故事 浏览 4611

美欲推动加沙停火计划第二阶段 专家:既想占好处又不愿担责

环球网资讯 浏览 4600

男子吃饭像兔子去治疗 蒙眼做手术听到医生一句话懵了

1818黄金眼 浏览 33248

剑指关键矿产,美牵头多国签署《硅和平宣言》

环球网资讯 浏览 3706

月销破7万台!汽车圈外行朱江明,成新势力大赢家

象视汽车 浏览 4201

沉浸式感受"正义使命-2025"演习现场

环球网资讯 浏览 3645

千亿巨头奖励员工21枚黄金键帽 空格键重35克价值近4万

每日经济新闻 浏览 10292

上海U20男足进全运8强,徐根宝:出线是第一位,成绩是硬道理

懂球帝 浏览 4453

最高续航达610km 江铃羿驰05S上市售9.79万元

网易汽车 浏览 4555

男乒横扫韩国打出最佳状态!林诗栋提升两点,梁靖崑找回熟悉感觉

篮球资讯达人 浏览 1303

利空突袭!凌晨,全线大跌!

券商中国 浏览 3839

特朗普:南非对白人搞"屠杀" G20峰会美国不去了

澎湃新闻 浏览 10228

刚刚,锂电闯出一只独角兽,横扫订单170亿!

飞鲸投研 浏览 4738

马卡:皇马将在国家德比展出巨型TIFO,彰显俱乐部的历史

懂球帝 浏览 4552

拉波尔塔:23年巴萨为梅西准备一份5年合同,但他选择迈阿密

懂球帝 浏览 2788

解锁刘浩存的「红运」密码 | 高清镜头后的底气

时尚COSMO 浏览 1462
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1