关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro3366人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨振宁逝世享年103岁 清华大学沉痛悼念

北京青年报 浏览 4584

王家卫:“搞金靖”?

马庆云的影音娱 浏览 4386

"柴怼怼"被逮捕:因"打假"走红后售假 有人消费近10万

澎湃新闻 浏览 9161

媒体:被美国逼着“朝中国开枪” 韩国玩得起吗

澎湃新闻 浏览 4624

俄罗斯终于发现 福建舰服役后做中国的朋友很有面子

现代小青青慕慕 浏览 8874

入秋第一条裤子就买它!时髦显瘦,巨好看!

Yuki女人故事 浏览 5076

小米汽车 10 月交付量超过 40000 台

IT之家 浏览 4255

双节假日即将拉开序幕:酒店民宿预订率均超去年,第一批拼假游客已抵达酒店

澎湃新闻 浏览 4980

马杜罗社交平台发布照片 配文称"被绑架已11天"

红星新闻 浏览 9119

仅仅是 AI,并不能让硬件更「智慧」,更重要的其实是这个

极客公园 浏览 4519

实拍体验本田Super-ONE PROTOTYPE:能量产的极致超级K-Car

驾仕派 浏览 4314

终于有一部国产剧,不靠「爽感」博眼球了

独立鱼 浏览 3443

夏天可以准备一件橘色、黄色单品,好搭不挑身材,利用率很高

静儿时尚达人 浏览 567

真心话大冒险开启,谁是你的双11购物车ONEPICK?

时尚COSMO 浏览 3722

歼-35"0001编号"战机亮相 喷涂英文缩写或量产出口

央视新闻客户端 浏览 95340

曾随海港4次夺冠!33岁名将告别中超 不舍离开将屈尊B队+征战中乙

我爱英超 浏览 3196

刚说完战争很快结束 特朗普改口

参考消息 浏览 2645

"最强大脑"齐聚临港 上海正搭建未来科学共同体

看看新闻Knews 浏览 4501

中国公民需谨慎前往日本 四大原因披露

环球网资讯 浏览 43749

郑丽文第二波人事公布:张荣恭、萧旭岑任国民党副主席

海峡导报社 浏览 9902

失业13个月 35岁巴神官宣登陆西亚2级联赛 已换13队+10年转会10次

我爱英超 浏览 3440
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1