您的位置:首页 >科技 > 内容

向视觉版O1进发,阶跃张祥雨团队推出慢感知,实现感知层面推理时间的动态调整

2025-01-25 23:25:18来源:网易  用户:于翠娅

内容总结

阶跃星辰&北航团队针对当前多模领域O1-like模型对视觉感知关注不足的问题,提出了“慢感知”概念。他们指出,精细/深度感知是未来视觉推理的重要基础,并认为通过任务拆解实现感知层面的推理时间动态调整(inference time scaling)是一个可行的思路。一个典型的例子是要求模型按照螺旋线的顺序报出每个字母,这需要深度感知而非简单的文本推理。

慢感知分为感知分解和感知流动两个阶段。感知分解将几何图形分解为基本形状单元,避免多峰优化问题;感知流动则模拟人使用尺子配合眼动的描线过程,通过多次眼跳到达下一个决策点,实现长程依赖的感知决策。实验结果显示,感知尺越短,模型性能越好,验证了慢感知建模方案的有效性。该团队也在积极将慢感知迁移到更通用的任务上,期待未来有更多落地场景。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

猜你喜欢

最新文章