从技术角度来看,服务机器人多场景属性决定了其多样化的交互方式和智能服务。机器人涉及语音、语义分析、情感分析、动作捕捉等多维度交互。我们认为,要达到人机一体化的程度,需要突破三个核心技术模块,即环境感知模块、人机交互与识别模块、运动控制模块。
传感模块:多传感器融合是未来趋势,低成本SLAM+ lidar是核心。
服务机器人要实现智能交互体验,首先要有环境感知能力。在传感方法中,多传感器融合是大势所趋,包括视觉识别、结构光、毫米波雷达、超声波、激光雷达等。考虑到家庭和公共场所的应用场景,未来低成本的lidar +SLAM方案是一个不错的选择。随着商业化的加速,激光雷达也有望走向低成本。
交互模块:语音识别已经到了商业化的门槛,语义理解还在提升。
随着计算能力的提高,自动语音识别(ASR)的识别能力越来越强。目前很多企业的语音识别错误率已经达到实用门槛。在语义理解方面,词法和句法基本解决,语义目前只是浅层处理,自然语言处理仍有难度,未来有望用深度学习算法打破。除了语音交互,图像识别算法的突破也将对语音语义交互领域形成补充。
运输控制模块:步态与非步态,不是替代而是共生。
运动控制模块增强了服务。机器人当前家庭服务的移动和运动属性机器人大多基于电机控制。从产品属性来说,有以万向轮为代表的步态行走和非步态行走。我们认为它们各有利弊,有场景差异,没有替代关系,可以共存。舵机是交通控制领域的核心部件吧价格敏感,目前国内企业已经突破服务。机器人特殊的转向器技术。
其他模块:AI智能芯片通用与专用并行,操作系统领域的国产系统正在孕育。
芯片是是的,是的机器人大脑,包括通用芯片和专用芯片,用于机器人一般来说,通用芯片和专用芯片各有千秋,未来各司其职,涉及深度神经网络。通用芯片中的GPU和FPGA在解决复杂运算方面优于传统CPU。操作系统方面,目前以ROS和Android为主,TuringOS、iBotOS等国产系统也在不断突破和孕育中。