扯扯具身智能
Last updated on Dec 22, 2024 pm
智能概论结课论文而来的一些感慨
具身智能大火背后,如何看待传统自动化控制和深度学习transformer等框架的泛化结合,至少在这几个月的自我理解里面,我个人的观点在于两者在目前还是不可分割的,在未来的机器人的发展中,拥有计算机和自动化背景的学生,至少在具身智能这样的一个名词没有彻底被资本抛弃的情况下,是会存在稀缺性
的。当下来看,传统控制或者更细的==机器人运动规划==,具身智能的灵巧性需要他来提供,精度和准确性都比完全的深度学习模型要好,由于机器人训练的数据集的极度缺乏,在目前来说是很难实现数据的闭环,所以端到端在目前看来因为数据的缺乏而看来遥不可及,很喜欢许华哲老师分享时的一句话
搞具身智能没有数据就是在扯淡
当然,这是指基于深度强化学习下的模型训练。现在的情况就在于基本上是在数据开环情况下的工作,在某些任务中实现闭环提高泛化性。模仿学习+强化学习就是开闭的多层次配合。具身智能要求机器人与真实世界的交互,在这种交互的过程中实现对于真实世界的理解,感知和行动的闭环。所以传统控制(机器人学
等)在这个时期就起到了一定的作用,一步一步的提高模型训练的鲁棒性之前,可以起到过度和辅助训练,但可能最终的结局是退出通用机器人的研究,原因就在于泛化性差。大模型会是解决泛化问题的答案吗?至少在多模态的工作以及与现实物理交互的工作成熟之前,都很难给出定论。通用机器人的研究现在还存在这相当多的问题,但不可否定其对人类社会发展的意义,只能说作为研究者要任重而道远。
之前听了一些许华哲老师(许华哲Harry - 小红书)关于特征点提取的一些工作,感觉在数据稀缺的情况下是一种极佳的泛化方式DenseMatcher,李飞飞最近的空间智能的研究也让我浮想联翩,大模型对三维世界的理解可能可以因此飞速进展,这对具身智能的研究无疑是强心剂。我常常用博远兄(Boyuan Chen Homepage)的一篇随笔激励自己,努力在这条道路上走下去。
下面是我很喜欢的一个博主why not tv 做的关于机器人的研究,同样也很振奋人心(我做出了铁甲钢拳里的机器人!)