关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3538人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

抢在苹果之前,三星推出三折叠手机

华尔街见闻官方 浏览 4124

消失在官方记录中的定制传奇:法拉利FX

老爷车 浏览 4401

有种的冲这儿打!

电影最TOP 浏览 4576

范戴克:我们不想在主场取得平局,有势头后就应该全力以赴

懂球帝 浏览 4481

内维尔:现在每次看切尔西比赛,都感觉他们输定了

懂球帝 浏览 1696

反转!曝何超莲婚礼是亲妈出钱,窦骁不愿签婚前协议,所以没领证

萌神木木 浏览 4443

联合国秘书长:美国对委军事行动未尊重国际法规则

澎湃新闻 浏览 3604

大家赚疯没?A股15连阳,打破尘封33年记录

说财猫 浏览 2911

港媒:香港武打明星梁小龙离世,享年77岁

界面新闻 浏览 3479

德云社董事长王惠凌晨发文,郭汾阳长大,触景生情

动物奇奇怪怪 浏览 4561

博主:据了解长春亚泰旧将王栋执教中乙长春喜都

懂球帝 浏览 3621

特朗普:泽连斯基阻挠俄乌达成和平协议

环球网资讯 浏览 3573

欧洲8国集体反击特朗普 英国首相:将与美国政府交涉

极目新闻 浏览 7669

今年最流行的衣服竟然是它?高级又气质!

LinkFashion 浏览 1769

男子花3万请网红带货:下599单仅成交4单收入700元

环球网资讯 浏览 14430

有没有发现,女骑手越来越多了?

智谷趋势 浏览 5323

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 3773

吉利缤越L Battle版上市 售价9.78万元

车质网 浏览 3510

无缘提前2轮保级!武汉三镇54天不胜,6年首负新鹏城,4纪录告破

奥拜尔 浏览 4553

国安2-4海牛历史首次主场输给对手,此前12战10胜2平仅失3球

懂球帝 浏览 4595

倍耐力官方:下赛季取消C6;所有车队将在12月9日测试新胎

懂球帝 浏览 4111
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1