关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4604人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

陈乔恩老公首公开真实家境

小先生笔记 浏览 4392

43天内两度被约谈引关注,携程的奔跑与隐忧

天下财道社 浏览 4550

舒淇哽咽表白冯德伦:谢谢你娶一个不常在家的女人

Yuki女人故事 浏览 6626

斯科尔斯回应利马:有人踢了一场好球,真替你感到高兴

懂球帝 浏览 3432

美军是怎么抓走马杜罗的

澎湃新闻 浏览 3578

NBA战报:马刺133-104大胜步行者取NBA5连胜,文班亚马17+12+1

懂球帝 浏览 4521

李禹熹公开和荣梓杉聊天记录!​开房都不舍花钱,还拿私密照威胁

萌神木木 浏览 4647

波利塔诺:我们应铭记输给埃因霍温,提醒自己要一直全力以赴

懂球帝 浏览 4260

加沙"狗线":巴勒斯坦人越线即遭射杀 尸体被狗啃食

澎湃新闻 浏览 67798

高市政府迟迟不道歉还发出战争威胁 中方8个字宣告结局

时时有聊 浏览 9851

习惯一身黑的穿搭?其实换一种穿衣思路更高级,养眼又有活力

静儿时尚达人 浏览 1309

警方通报小米成都车祸: 驾驶员涉嫌酒后驾驶

网易汽车 浏览 4658

7名中国游客溺亡于贝加尔湖 31岁幸存者被救细节披露

界面新闻 浏览 28120

娜然跟霍启山回香港!逛街消费幸福肥明显

动物奇奇怪怪 浏览 2930

森林狼询价莫兰特但控卫位置还有高人 哈登辅佐华子?

仰卧撑FTUer 浏览 4113

连奕名为老婆过46岁生日 杨若兮素颜照惹争议

小徐讲八卦 浏览 3795

抖音:近一年优质内容播放时长为普通内容的17倍

封面新闻 浏览 5192

小个子女生冬天怎么穿衣?上宽下紧、体现曲线,显高显瘦舒适

静儿时尚达人 浏览 3816

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家 浏览 4771

涉嫌支持台军心战大队 5家企业主营业务被曝光

日月谭天 浏览 8580

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 5029
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1