关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4605人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国算力进入拐点:“用多了就有生态,用少了生态就跑了”

第一财经资讯 浏览 5220

暗指北控?琼斯吐槽:这比赛也太难看了,这些球员都是谁找的

懂球帝 浏览 3448

香港著名女星,为照顾儿子淡出娱乐圈

秋枫凋零 浏览 3495

詹卢卡-曼奇尼已为罗马打进21球,为队史进球第二多的后卫

懂球帝 浏览 1354

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 4156

中国天眼再升级!FAST将建成巨型综合孔径阵列

环球网资讯 浏览 3476

别管怎么质疑《寻秦记》,只要古天乐、林峯在,再烂我都会买单

最爱酷影视 浏览 3922

磁浮底盘/全铝车身 凯迪拉克新CT6上市28.99万起

网易汽车 浏览 4528

美媒称马杜罗请求普京提供导弹等援助 佩斯科夫回应

环球时报国际 浏览 10224

孔蒂:小麦已成长为全面的球员;对在切尔西的两年有美好回忆

懂球帝 浏览 3410

西安街头邂逅赵露思,美到让人不敢认

手工制作阿歼 浏览 5290

中海成都谋变?曝开发公司连亏2年,桐梓林28亩项目寻合作

密探财经 浏览 2786

泰国达叻府5县实施宵禁

新京报 浏览 3828

让智驾能看懂真实世界 英伟达发布开源Alpamayo平台

网易汽车 浏览 3636

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 4267

贝壳2025:成交3万亿,赚了30亿

定焦One 浏览 2592

“9系”旗舰+1 上汽大众的战略反攻

网易汽车 浏览 3512

全身爱马仕的马筱梅生完孩子却穿三百块套装

小邵说剧 浏览 1342

李湘王岳伦合体露面被偶遇,离婚后仍相处融洽,两人身材很富态

扒虾侃娱 浏览 4396

曾获专班支持的“座上宾”,如今被追要1.4亿元投资款!光伏龙头50亿元项目推进不利,收地方政府“听证通知书”

每日经济新闻 浏览 3640

Melody和林依晨,怎么不会老啊?

时尚COSMO 浏览 3441
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1