关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者4310人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

武汉理工毕业生称因当保安遭学校约谈 本人否认蹭流量

封面新闻 浏览 7853

美媒:泽连斯基未拒绝领土问题 要求提供更多细节

环球时报国际 浏览 9497

Shams:因球场打架,阿尔瓦拉多被禁赛2场&马威被禁赛1场

懂球帝 浏览 3784

她被推上C位,这次谁也没料到

Yuki女人故事 浏览 4014

“耳环风波”半年后 18岁黄杨钿甜首次发文

现代快报 浏览 8736

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 4089

什么信号?利好,又要来了?!

米筐投资 浏览 2950

小黑靴不流行了?今年冬天最火的靴子竟然是它

LinkFashion 浏览 3715

长安银行“踩油门”

北京商报 浏览 3469

中年女人想穿得时髦,少穿羽绒服+紧身裤,换成这些好看保暖

静儿时尚达人 浏览 4132

广汽昊铂GT全新Lite版上市 售价15.38万元起

网易汽车 浏览 4444

绕开监管突破24%限制 分期商城变相放贷息费高达60%

南方都市报 浏览 3891

辱骂西蒙尼的球迷:我没说种族歧视的话,也没提马岛战争

懂球帝 浏览 5200

闭店风波后,实探“上上谦”仅存门店:薛之谦曾入股,周末用餐高峰仍需排队

时代周报 浏览 4296

亏了1800万,分红1.3个亿!网红牙膏,凭啥上市?

蓝鲸新闻 浏览 1881

走失女童被找到后父亲首度发声:感谢1.2万个恩人

极目新闻 浏览 10511

618酒业脱离低价内卷,发力保真服务:美团歪马送酒推“一瓶一码,全程保真”

澎湃新闻 浏览 107

48家发债主体中报延期 审计梗阻、系统改革、经营挑战

21世纪经济报道 浏览 5172

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

界面新闻 浏览 34100

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 7927

苹果计划为 iPad Pro 引入 iPhone 17 Pro 的均热板散热

威锋网 浏览 4388
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1