天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

小红书Hi Lab新突破:强化学习让AI思考更精简高效!

2025-06-20来源:天脉网编辑:瑞雪

近期,小红书技术团队在人工智能领域取得了新突破。据悉,该团队通过引入Test-Time Scaling技术,显著增强了其深度思考模型的推理能力。然而,这一进步也伴随着一个显著问题:模型在思考过程中产生了大量冗余和无效的思考。

为了克服这一挑战,小红书Hi Lab团队创新性地提出了“Think When You Need”的强化学习训练策略。这一策略能够在不影响模型最终效果的前提下,实现动态的链式思考(Chain of Thought)能力,从而大幅缩短了模型的平均思考长度。实验证明,这一方法不仅在推理任务中表现出色,在非推理任务中也同样具有广泛的应用潜力。

Hi Lab团队还发现了一个令人惊讶的现象:在相同任务下,参数量更大、更为智能的模型所需的思考长度反而更短。这一发现与当前深度思考模型的一般表现形成了鲜明对比,但却与人类认知过程高度一致。这一发现不仅为人工智能领域带来了新的思考,也为未来的模型优化提供了新的方向。

海信视像ESG评级保持B+稳定态势 在A股家庭耐用消费品行业21家中排第六
从海信视像历年获得的伦交所ESG评级情况来看,2023年12月16日海信视像ESG评级为C+,2024年12月21日评级为B-,2025年12月27日评级为B+,2026年6月27日评级为B+,整体呈现逐步…

2026-06-29

豆包大模型2.1跨越生产级质变点,AI赋能产业开启效率革命新篇章
豆包大模型2.1不仅拥有最聪明的“大脑”,还长出了智能体的“手臂”,用户最大的感触就是——AI替我干活终于可靠了。 AI蓝媒汇体验了豆包大模型2.1的Agent能力,向其提出要求:“帮我制作一份《桃花源记》…

2026-06-29

360发布“图龙锋”“仪天阵” 助力政企单位掌握AI时代安全主动权
面对AI自动化攻击带来的新挑战,360现场披露漏洞挖掘智能体“图龙锋”和网络安全自动化防御系统“仪天阵”,以智能体蜂群路线帮助政企单位掌握安全主动权。 大会现场,360正式展示漏洞挖掘智能体“图龙锋”,它是3…

2026-06-29