关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro3371人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

初秋衣服不必准备太多,这几件单品提前买好,简单百搭不挑人

静儿时尚达人 浏览 6642

维拉已放弃买断桑乔!曼联若解约多特或引进,只会免费签约不给钱

罗米的曼联博客 浏览 4373

追觅汽车三款SUV车型外观亮相:星际T08、T08L和D09

IT之家 浏览 3247

N7单月交付破万,东风日产成功“续命”

汽扯扒谈 浏览 5316

全新前脸/三种座椅布局可选 第三代豪越L内外饰曝光

网易汽车 浏览 4466

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 4157

小德:我的25个大满贯冠军和C罗的1000个进球也许能一起实现

懂球帝 浏览 3760

联合国秘书长呼吁抓住机遇 结束加沙冲突

国际在线 浏览 4577

用这几件单品,轻松get秋日氛围!

黎贝卡的异想世界 浏览 4591

AI重构双11|成交暴涨25倍,智能眼镜从极客玩具到大众爆款

红星新闻 浏览 4393

前妻许婧晒外籍丈夫后,陈赫终于高调秀恩爱

阿废冷眼观察所 浏览 4405

跌落神坛!“逼疯”黄奕,“整了”周迅的他,因王家卫再次被牵连

温柔娱公子 浏览 3485

累瘫?三战全打满40分钟 从40+9到11+5失误 黑龙江女战神也顶不住

颜小白的篮球梦 浏览 4539

宝马圣诞视频暗藏新车剪影

大象新闻 浏览 3683

泰柬两国密集表态说法大相径庭 泰国称不会停止行动

环球网资讯 浏览 9749

爆冷!莫布利29+8骑士崩盘输猛龙 巴特尔三分6中6引3人20+

醉卧浮生 浏览 4397

99年女生读博时退学去开公司修家电:好评近100%

大象新闻 浏览 24059

泽连斯基:会谈富有成效 但美乌在领土问题上立场不同

国际在线 浏览 19120

李羲承退出ENHYPEN,组合未来将以六人形式活动

精彩背后的故事 浏览 2720

两集飙上9分,今年又一神剧出现了

独立鱼 浏览 3580

26款奇瑞冰淇淋/小蚂蚁上市 报废双补价3.4万元起

网易汽车 浏览 3541
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1