关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3539人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从样品到产品,重庆高校科研“宝贝”何以出圈?

上游新闻 浏览 4220

利昂-贝利替补出场20分钟后被换下,赛季未过半已经受伤三次

懂球帝 浏览 3817

挪威王室不太平:王储妃深陷爱泼斯坦丑闻 其子涉强奸

澎湃新闻 浏览 103729

菲戈和伊尔迪兹获2025地中海卓越奖,颁奖典礼于10月20日进行

懂球帝 浏览 4598

3-0!日本U23横扫亚洲:打爆阿联酋 2连胜8-0出线 队内8名大学生

风过乡 浏览 3556

门多萨:为马竞效力是儿时梦想,身边队友小时候在电视上看过

懂球帝 浏览 3266

去海外卷,并不是件坏事

虎嗅APP 浏览 4023

达姆施塔特工业大学发布SCICOQA数据集

科技行者 浏览 3386

香港三天两夜,满载而归(附攻略)

黎贝卡的异想世界 浏览 2565

刘强东“10年1元年薪”之约到期,律师解构高净值人群如何妥善处理财产

红星资本局 浏览 5140

雷军“悔棋”背后,存储市场的涨价潮也是窗口期

北京商报 浏览 4365

时尚芭莎删除那艺娜物料,网友称其被“退货”

韩小娱 浏览 4063

宋慧乔的短发太好看了!今年想换发型一定不要错过这篇

LinkFashion 浏览 2893

美政府"关门"将结束 民主党8人倒戈加入共和党人行列

红星新闻 浏览 35238

媒体:美国解除对白制裁 系大国格局中精心策划的变动

上观新闻 浏览 17213

华为商城Mate 60/Pro系列配件一折促销,9.9元买官方保护壳

IT之家 浏览 4313

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 4486

消息称SK海力士与英伟达达成HBM4供应协议,价格较上代上涨50%

IT之家 浏览 4323

五一探店乐道L90和L80:L80热度明显更高

驾仕派 浏览 1372

外观内饰优化 新款现代Staria将于明年上市

车质网 浏览 3135

广东晋级决赛杜锋谈辽粤大战:广东后场接过接力棒,传承篮球使命

篮球资讯达人 浏览 4470
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1