关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者4306人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

TVB颁奖礼太节省!3个明星坐一台车,话筒都不够分,场面好简陋

萌神木木 浏览 3227

碧姬·芭铎,“穿衣自由”概念的祖师奶

时尚COSMO 浏览 2850

康师傅换帅!创始人之子接棒CEO,去年薪酬937万元

中国基金报 浏览 3868

E句话|“我只眼神给出去”?黑白颠周媛账号被封

仙女事件簿 浏览 3299

飞天茅台批价首次跌破1700元,机构称“白酒需求仍在磨底阶段”

YOUNG财经 浏览 4403

从39%到15%,瑞士对美关税协议达成

环球网资讯 浏览 4368

专家:高市早苗收敛了一贯对华强硬的鹰派色彩

北京日报客户端 浏览 15274

北约和俄罗斯空中对峙升级 推高爆发军事冲突风险

澎湃新闻 浏览 5075

伊总统:在确保伊朗不再遭受攻击前谈结束战争毫无意义

上观新闻 浏览 2505

电车销量涨不动?油车打响“销量保卫战”

少数派报告Report 浏览 3734

韩媒预热安洗莹VS陈雨菲:4强唯1战绩优于女帝之人 第9冠最大阻碍

颜小白的篮球梦 浏览 4474

被娱乐圈催熟的林妙可王诗龄!

八星人 浏览 3510

马卡:塞尔塔公布本赛季5名队长人选及顺位 阿斯帕斯仍是第一队长

直播吧 浏览 5323

乐子还得喜友来,这个喜综团建给人笑麻了!

吐槽电影院 浏览 2815

癌症晚期男子驾车撞死婆孙2人后病亡 法院判赔超200万

台州交通广播 浏览 3438

谭松韵扛剧能力被质疑 赵丽颖成女主?

楚楚号 浏览 3696

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 4230

患癌母亲"碰瓷"货车司机 儿子怒斥母亲后赔司机3000元

北青深一度 浏览 9945

年轻人迷上在线下交换自制周边

钛媒体APP 浏览 4533

"花坛白骨案"告破:女老板遭谋杀 凶手"换脸"逃亡28年

封面新闻 浏览 14235

一边收监管“黄牌”,一边夺A股成交额冠军!北方稀土股价新高背后,关联交易存隐忧

时代周报 浏览 4703
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1