相信两天前大家的朋友圈都被波士顿动力处理了 机器人刷屏:
估计这一幕会让很多读者想起终结者主导的恐惧:
科幻电影《终结者》
然而,作为一个苦苦挣扎的机器人我可以负责任的告诉你:完全不用担心!
不同于一般的技术,机器人它涵盖的技术领域更广,波士顿动力只在控制方面有很大成就。目前的机器人领域还有很多技术问题,我们暂时还无法创作出科幻电影里的那种。通用机器人。
接下来,我将从机器人研究几个方面来解释为什么我们不需要担心。机器人取代人类的事情发生了。
一、硬件,机构:
得益于机械前辈几百年的积累,目前在硬件设计方面,实用机器人已经很不错了。以下是一些著名的真理。机器人:
(左)波士顿动力公司的阿特拉斯,(中)日本研究所的HPR-4C,(右)日本东京大学的健四郎。
无论是外观,自由配置,驾驶模式,实用机器人他们都取得了非常好的成绩。
然而,在能源方面,我们还有很长的路要走。当前的运动机器人基本上需要携带巨大的电池,续航能力也不好。以这款手柄为例,它的电池约为3.7KW/h,充满电能跑约24km,所以只能寄希望于新一代电池技术在这方面的发明。
这一次,波士顿动力公司的Handle携带了一个巨大的电池。
第二,感知:
这包括两个部分:传感器和信号处理。
传感器:机器人需要能够感知周围的环境和自身的状态,所以需要安装不同的传感器。为了比较,我们来看看人体的几个主要传感器:听觉传感器(耳朵);视觉传感器(眼睛);扭矩传感器;皮肤触觉传感器(可以感觉到别人在摸自己)等。
首先是听觉传感器,现在看来没什么特别的。机器人可以配普通麦克风。
其次,视觉传感器,现在。机器人我们的视觉传感器应该比人的眼睛更先进:高精度相机、红外相机、深度相机、激光雷达等等。没办法。算法不够。让我们收集传感器。
之后是扭矩传感器,主要用于检测关节扭矩。有了精确的关节力矩,就有可能部署一些控制算法和估计环境状态。当然,这种传感器现在已经有了,但是价格昂贵。
最后,唯一和人类有较大差距的地方就是皮肤触觉传感器:基本上还有很多路要走。不信你看下图。
信号处理算法:当然这里的信号处理是广义的信号处理,包括普通滤波、傅立叶变换等。,以及物体识别、语音识别等人工智能算法。这个题目太大太实际了。机器人这方面的研究离实用还很远,我就简单列举几个:
物体识别/语音识别:当然,随着近年来深度学习的发展,我们在物体识别和语音处理方面的造诣已经非常厉害了,但是在实际操作中,机器人部署在上的算法也相对简单(实用)机器人不仅要识别对象,还要定位对象)。
语义理解:以前的语音识别是指根据声音识别单词,这里是理解识别的文本内容。我们现在研究的最高水平可以参考微软萧冰聊天。机器人,基本上还是傻逼。PS:什么都不要告诉我。机器人“娇娇”,那是遥控器后面的一个人。
环境理解/地图创建:简而言之,是的机器人能够模拟环境,包括地图创建。目前的机器人在这方面,还是比较薄弱的。即使有激光传感器等附加设备(人只需要两只眼睛),地图创建也只能在一些特定条件下完成,基于地图的环境理解也只能算是刚刚开始,比如下面的语义地图。
真正的通用机器人我们不仅要能“看见”环境,还要能“理解”环境。
当然,我认为随着深度学习技术在地图创作等领域的应用(考虑到深度学习对环境的理解能力),估计十年内可能会有这方面的实用技术。
第三,策划:
规划基于任务和机器人当前状态,计算完成此任务的方法。包括但不限于:
任务规划(将一个大任务分成几个小的子任务)
运动规划(机械臂或脚)机器人每个关节的运动轨迹)
路径规划(实际上类似于运动规划,但倾向于移动。机器人规划正式路径)
波士顿动力的研究重点一直在控制上,但在规划等领域并无建树(至少从他们发布的视频来看,没有这方面的研究)。
任务规划:例如,我们希望机器人那就送一瓶雪碧吧机器人这个大任务会分成几个子任务(移动到冰箱前面——打开冰箱——找到雪碧——拿出雪碧——关上冰箱——给人送去),当然也可以有更复杂的任务。目前一般用MDP或POMDP模型来描述问题,然后用各种编程算法来求解。总的来说,目前的任务规划强烈依赖于任务描述方法(人工分配),没有可靠的方法来处理大规模、不完全观测等复杂问题。
体育策划:比如,机器人你面前有一杯水,让机器人手在杯子前面移动,不要碰到桌子等障碍物。这就是运动规划,根据目标状态点生成一系列关节运动状态。是的,现在甚至让机器人面前拿起杯子的问题还没有完全解决。简而言之,我们一般使用基于随机采样的算法进行运动规划。随机抽样意味着每次规划的结果可能不同,更不可能保证规划的路径是最优的。因为这一块是我自己做的,所以我很了解这个坑。我个人觉得,要解决运动规划的问题,需要一个方法论的创新,抛弃现在的方法(因为人们肯定不会这样规划)。
路径规划:其实是运动规划的问题,但是因为路径规划一般在地面其实问题的维度低,一些奇怪的规划方法(Dijkstra,A*等。)可以采用。因为问题毕竟简单,这一块的发展也比较好,比如扫地。机器人已经可以在室内环境下跑来跑去了。
小米在扫地机器人我们已经能够使用二维地图进行路径规划。
当然,这一块需要解决的问题可能是:①动态环境;②拥挤的环境;③复杂地形;(4)地图不完整的环境等。但估计在未来15年左右就能彻底解决,所以到那个时候,无人驾驶汽车应该可以到处跑了。
第四,控制:
控制是执行规划结果的过程,从底层的电机控制到上层。机器人全身控制就属于这一类。
机械手控制:下图是Sami Haddadin大概十年前做的机械手碰撞检测的demo,基本上很厉害。而且,因为机械臂控制属于机器人自我动力学,所以目前这个领域可以说已经完全被攻克了。
机械手操作:机械手抓取操作的问题没有那么简单,因为涉及到实际物理环境的建模(摩擦力、形状等。).因为模型不准确,所以很难完全基于模型来解决这个问题。目前,实际应用基本上采用并联手爪的方式。只有大量的研究机构灵巧手抓取的研究。
脚型机器人控制:这就更难了,因为机械臂和机械手都至少有一个相对固定的底座。脚型机器人的基数会随着接触而变化。所以,我一直认为我可以做脚部姿势。机器人控制的人都是很厉害的人。
波士顿动力的各种脚型机器人
加上这个把手 机器人,可以说波士顿动力公司,通过自己的努力,将人类的脚。机器人控制水平提高了一个层次。
第四,学习:
这是另一大块内容。因为可以应用到其他领域(控制、规划、感知等。),有时候也不能单独归为一类。
机器学习可以分为有监督学习、无监督学习和强化学习。目前深度学习主要用于监督学习。此外,强化学习也逐渐以深度Q学习的形式出现;但是无监督学习是机器学习的最高挑战。
我们人类可以举一反三(超级监督学习能力);熟能生巧(超强的强化学习能力);发明新事物的能力(超级无监督学习能力)。
当然,机器学习还是有很多坑的。因为正是不断的学习使我们能够面对不断变化的环境。这一带可挖的东西太多。
动词 (verb的缩写)互动:
这就是了。机器人与人交往的问题。包括识别人,与人沟通,与人交流。协作。从这个角度来看,我们目前的机器人它仍然不令人满意:
识别人:虽然人体识别在机器视觉方面已经取得了很多成果,但是在人机交互的过程中,机器人我们不仅要认识到人的存在,还要能够判断人的行动和意图,并做出相应的反馈。
与人交流:在这方面,我们现在正在聊天。机器人虽然做得不错,但离通过图灵测试还很远,任何一个普通人都很容易判断出对面是一个。机器人。
与人交往协作:这个我就不说了,我们的真实机器人只能是这样的:
六、容错:
这意味着机器人软硬件故障后,仍能自适应完成部分工作。
人类就更不用说了,“身残志坚”的例子太多了:
四川90后“无臂男孩”夹着一支笔答题,勇敢争取高考,追逐自己的大学梦。
我们的/我们的机器人最强的只能是这样:
这是2014年发表在《自然》杂志上的结果,但很简单。机构在核心部件损坏完好的情况下,可以继续完成简单的任务。
摘要
综上所述,如果你想做一个可以替代人类的东西。通用机器人我们还有非常非常长的路要走。
当然,如果你想在十年内做成这个。机器人也不是没有可能。比如突然来了一群陌生人,说:“我看你的骨头很神奇。你应该向我学习。”机器人好吧!』
科幻电影《降临》