机器感知(Machine Perception),是指机器以人造感官系统与外部世界联系,并对外部世界的运动状态及其变化方式进行感知的一种状态。当外部世界的状态和变化形式产生刺激时,机器能敏感且保真地做出反应,以尽可能真实地反映事物的实际面貌。这一过程涉及复杂程序组成的大规模信息处理系统,信息通常由多种传感器采集,并通过程序处理以得到超越基础感官的结果。[1][4]机器感知具有在敏感域、敏感度和分辨力等方面极大地改善人类感知能力的优点。[4]
机器感知的发展伴随着机器人制造的发展,1920年,“机器”一词首次出现在科幻书中,20世纪40年代后期,最早的遥控式机械手被研究出来,之后,为了使机器能够理解视觉数据,研究人员开始开拓性地开发反映人类感知过程的算法和模型。[5][6]20世纪50年代,机器视觉被首次提出,[7]初期主要关注基本任务,如物体识别与空间理解,为其他机器感知技术的发展奠定了基础。[6]1957年,康奈尔航空实验室的弗兰克·罗森布拉特(Frank Rosenblatt)创建了Mark I感知器。但是Mark I无法识别多种视觉模式( 例如面部),此后一段时间,神经网络研究受挫并陷入停滞。[8]20世纪80年代,汉斯·莫拉维克(Hans Moravec)通过下棋和智力测试间接描述出“机器感知”这一概念,[9]该概念结合了神经科学、计算机科学和工程学的洞见,随着时间推移,理论和技术的创新相结合,推动了机器感知的发展。[6] 机器感知和信息处理通常需要专门的硬件和软件。这是一个多步骤的过程,从接收原始数据开始,再到将数据转换或翻译为接近人类(及动物)感知的详细聚焦及全面扫描的过程。[10]其研究的是如何用机器或计算机模拟、延伸和扩展人的感知或认知能力,涵盖机器视觉、机器听觉、机器触觉以及机器嗅觉和味觉等方面,[1][3]主要应用于对象识别、面部识别和语音识别等领域。[11]但是,机器感知也面临着与人类的感知能力相差甚远、无法进行复杂模式的识别、无法结合多种感官的感觉等多方面的挑战。[12] 概述
定义