关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家4239人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗民众:伊朗不会屈服于美国霸权

极目新闻 浏览 3313

美教授说大实话:特朗普对委动手背后 石油优先于民主

澎湃新闻 浏览 10968

收藏这篇就够了!本地人私藏的广州逛吃指南

黎贝卡的异想世界 浏览 4237

抖音:卖茅台低于市场行情价将被处罚

第一财经资讯 浏览 4328

阿里主动加码外卖大战,谁能笑到最后?

陆玖商业评论 浏览 3534

谷歌翻译加入文本翻译AI模型,有快速与进阶模式可选

IT之家 浏览 4506

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 4394

营收大增1332.52%,牛散出手增持!下周6股解禁比例超50%

数据宝 浏览 4631

HMD Pulse 2 Pro手机跑分曝光:紫光展锐T7250芯片、4GB内存

IT之家 浏览 3984

九年情怀喂了狗!《楚乔传2》口碑崩盘

肆季娱乐 浏览 1992

《侍神令》亏了6.1亿,沉寂4年,陈坤新片又来了,票房仅3.7万

靠谱电影君 浏览 4427

杭州,居然是一个巨大的真人寻宝游戏!

时尚COSMO 浏览 5054

IBM最新量子算法,运行速度提升约10倍,带动AMD市值暴涨近2000亿

DeepTech深科技 浏览 4424

跨年晚会主持人状态曝光!靳梦佳被质疑整容

萌神木木 浏览 3732

沃勒尔:德国队首发门将仍存在变数,特狮必须稳定上场才行

懂球帝 浏览 3844

朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

萌神木木 浏览 4328

芯天下弃A转港,2025年前三季度业绩扭亏,毛利率回升至18%|港E声

时代周报 浏览 3589

与美主持人激烈辨论后被闭麦 万斯怒了

环球网资讯 浏览 8617

7天票房2.3亿,差评满天飞的“大烂片”被捧上日冠,中国观众咋了

娱乐圈笔娱君 浏览 3581

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 3771

美股三大指数集体高开 理想汽车涨超5%

证券时报 浏览 3541
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1