[LG]《Thoughtbubbles:anUnsupervisedMet

爱生活爱珂珂 2025-10-03 06:58:57

[LG]《Thoughtbubbles: an Unsupervised Method for Parallel Thinking in Latent Space》H Liu, S Murty, C D. Manning, R Csordás [Stanford University] (2025)

Thoughtbubbles：无需额外监督，变革性实现Transformer隐空间中的并行自适应思考

• 创新架构：Thoughtbubbles引入“forking”机制，动态复制或删减残差流，形成隐空间中针对复杂Token的“思考泡泡”，实现推理时的并行计算。

• 无需额外信号：该模型仅凭语言建模损失，在预训练阶段即学会自适应分配计算资源，无需人工设计的思考链或暂停令牌。

• 计算资源自适应：模型根据Token不确定性（如后验熵）智能调整计算量，重点“加思考”，而对极端不确定区域反而节约资源，提升效率和效果。

• 性能领先：在OpenWebText和peS2o数据集上，Thoughtbubbles在困惑度和零样本任务（如LAMBADA、HellaSwag）中均超越参数与计算量匹配的传统Transformer及复制填充Token基线，甚至小规模模型优于大规模基线。

• 位置编码创新：采用部分旋转的RoPE编码，确保多叉残差流间位置关系合理，有效支持多分支计算。

• 训练与推理统一：预训练即具备动态并行计算能力，推理时通过调整预算可灵活控制计算强度，支持高效自适应推断。

• 代码开源：提供PyTorch实现，便利社区复现和扩展。

心得：

1. 预训练阶段即学习动态计算分配突破了传统必须后期插入思考链的限制，实现训练与推理模式的无缝衔接。

2. 隐空间中并行复制残差流的思路，打破了Transformer固定计算预算的瓶颈，使复杂问题的“多线程”思考成为可能。

3. 模型自动聚焦于中等不确定性区域投入更多计算，反映了对计算资源利用的深刻理解与优化，启示未来模型设计需更智能调度算力。

了解详情🔗arxiv.org/abs/2510.00219

Transformer自适应计算并行推理语言模型机器学习自然语言处理

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

《AI Agents from First Principles》AI智能代理从

2

《Redis 101 : From a Beginners POV》Redis远

3

傅里叶级数和笛卡尔坐标系有什么共同点？其实它们几乎是同一个概念的两种表现形式。核

4

[人人能懂] 从并行思考、结构化学习到认知解密想知道AI如何像开“诸葛亮会”一样

5

[LG]《Per-example gradients: a new fronti

6

[CL]《Verbalized Sampling: How to Mitigat

7

[LG]《Why Can't Transformers Learn Multip

8

[LG]《Thoughtbubbles: an Unsupervised Met

9

早！[太阳] 早安

10

《“The G in GPU is for Graphics damnit!”:

热门分类

科技TOP

1

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

2

追觅汽车首款车型官图发布这次会是PPT造车吗？此前追觅就官宣要造车，并且工厂

3

还没下单iphone17Pro的劝你先等等~因为iPhone18Pro已完

4

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

5

黄仁勋脸都打肿了！路透社16号的最新报道：英伟达为东方大国生产的RTX600

6

这波新机屏幕都有惊喜，你们有福了。

7

我家三台空调都是小米的，当时买的时候都没有犹豫，用了两三年没出问题，体验很好，小

8

好家伙，大早上的突然宣布了！2025雷军年度演讲定在9月25日晚7点，所以小

9

荣耀500系列曝光，全面对标苹果！荣耀500系列在工艺上完全对标苹果，中端机

10

荣耀Magic8标准版曝光，看着像是采用了4颗摄像头，然后是圆形的摄像头deco

科技最新文章

1

荣耀500系列长这样？外媒爆料荣耀500系列外观，和iPhone17

2

目前跑分最高的不是华为，也不是苹果，更不是小米，而是它！真机已经到手！顺手跑

3

不听劝入手了荣耀Magic7，整个人都愣住了！大家听我的选手机千万不要光听人说，

4

刚看了下10月的新机发布安排，真的是太密集了。10月13日vivoX300

5

荣耀500系列配置前瞻，含荣耀500与荣耀500Pro。屏幕上，前者6.5英寸

6

又一次定价失误的话，友商可不给你任何机会。华为M80要是再飘可就不好说了，产

7

余承东今天是双喜临门，不仅获得晋升，出任IRB主任，鸿蒙系统5终端装机量

8

5年过去了，华为旗舰首发依然没有涨价。5年过去了，从mate40到现在的Ma

9

关于华为Mate80系列大家更期待什么？1、麒麟90302、HarmonyO

10

估计余承东后槽牙都要咬碎了他想破脑袋也没想到自己堂堂的高考理科状元，竟然被人