关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4599人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

OpenAI营收增长放缓,美股AI股集体跳水

第一财经资讯 浏览 1426

今晚空降!傅东育又一力作来袭

娱乐圈笔娱君 浏览 3357

致敬 S14 第五冠队服,雷蛇推出巨甲虫 V2 Faker 款游戏鼠标垫

IT之家 浏览 4673

上汽销量反超比亚迪,真实“含金量”如何

经济观察报 浏览 4639

Nature|尺寸与光电转换效率创世界纪录,上海科学家团队携手龙头企业突破大尺寸钙钛矿光伏模组产业化关键技术

上观新闻 浏览 4627

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 3935

伊朗最高领袖顾问:特朗普理应担心有更多美国人伤亡

环球网资讯 浏览 40801

媒体:高市早苗疯言台湾问题 中方对她没什么好客气的

新民晚报 浏览 8381

冲着唐嫣去看《爱情没有神话》,却被演反派的冯绍峰吸引了

温柔娱公子 浏览 4643

"特朗普级"战列舰造价公布:高达220亿美元

极目新闻 浏览 3442

知名投资人肖庆平假期遇车祸去世 其投资总额近1亿元

每日经济新闻 浏览 4763

打破29个月冠军荒!梅总终于赢了!

网球之家 浏览 4645

内塔尼亚胡向特朗普赠送金色鸽子雕塑

国际在线 浏览 4534

周深:新年巡演审批通过,创下三大历史记录

陈意小可爱 浏览 3393

淘宝闪购立下 Flag 争第一,美团也不让步

雷峰网 浏览 3519

发现4种春季很衬肤色的办法,照着穿

Yuki女人故事 浏览 2733

男子租车遇划痕被车主索赔900元 报警后赔偿立减400元

大风新闻 浏览 36863

千人冒雪送“棋圣”,韩国“围棋皇帝”曹薰铉专程道别:盼未来与聂老天堂对弈

国是直通车 浏览 3422

最高8.8分!盘点2025年评分最高的10部电影

林木体育解说 浏览 3571

"与辉同行"带货83元3只"皖西麻黄鸡"被打假 客服回应

澎湃新闻 浏览 7763

俄外交部:扎波罗热核电站归属俄罗斯不容置疑

上观新闻 浏览 5280
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1