财新账号:
会飞的检查者

会飞的检查者

2012年08月09日 11:15 本文来源于 财新网 订阅《新世纪》《中国改革》|注册财新网
   在新泽西普林斯顿的西门子研究实验室的上空,一个奇怪的飞行器嗡嗡地飞着。

  机器学习是众多研究领域中难度最大的一种。研究人员在该领域中遇到的最棘手的问题之一就是视觉。为促进该技术进一步发展,西门子的科学家正在开发同时具备学习能力并可以独立诠释可见世界的视频系统。

  在新泽西普林斯顿的西门子研究实验室的上空,一个奇怪的飞行器嗡嗡地飞着。它的主体是一个正方形线框,小小的引擎顶端有四个直升飞机的旋翼。这个飞行器叫四轴飞行器。它使用激光来扫描窗户、墙壁、机器,飞行器上的光学传感器和录像机可以显示建筑物的每个细节。它在空中按照预定路线迂回运动,准备好开始工作并注意躲避可能遇到的障碍物。通过对它收集的数据进行处理,就可得到周围环境的清晰的三维模型。

  四轴飞行器项目也被称为“飞行检查”(Fly & Inspect),是西门子美国研究院的计算机科学家Yakup Genc和波士顿麻省理工学院机器人研究专家Nicholas Roy合作开发的成果。该项目旨在设计一种可自动获取数据并建立复杂环境的数字化模型的系统,如垃圾处理站、加工厂和工厂车间。利用这种三维数字模型,可以评估这些地方是否需要维护,还可模拟大规模整修。Genc和Roy希望飞行检查技术能够帮助人们高效而可靠地完成这些工作。四轴飞行器还能够检查那些难以接近的地方,比如风电场和风机塔杆的磨损和损坏迹象,因为它接受训练后能够识别裂痕等特征。“在这一应用中,该设备还需要操作员来对其进行远程控制,但我们希望不久以后它能利用光学传感器实现全自动化操作,”Genc说。

  开发出一种能够处理周围环境图像信息的系统,这是机器学习领域的一大挑战。2011年2月,IBM超级计算机“沃森”在《危险边缘》人机对战节目中打败了人类最佳选手。但即便是沃森,也只是一个可以对数据库和网络搜索信息进行评估的精密系统。在现实世界中,计算机还仍然比较笨拙。即使是小孩子都可以毫不费劲地区别树木和室外天线,但这对计算机却是一个挑战。但在各大高校和公司研究机构的努力下,机器视觉正逐步走向商业化应用。

  西门子在新泽西的普林斯顿、奥地利的格拉茨和德国的慕尼黑的研究机构正在开发相关系统,以搜索工厂、建筑物、道路和基础设施等复杂对象的卫星图像。他们正在开发的其他系统可以分析集装箱和可疑物包裹的X射线图像,读取道路标志,监视人群和队伍,检查人类难以接近的地点并绘制其地图——就像四轴飞行器所做的一样。所有这些应用的共同点就是学习能力,和小孩子学习辨别物体的能力基本一致。在“监督学习”过程中,科学家将成千上百个物体的图像输入计算机中。接下来,相关算法归纳某类物体的共同特征。例如,街上的行人一般是直立行走,有胳膊和腿,脑袋基本是椭圆形的。而一张桌子则有一张水平的桌面,上面可以放东西,下面有桌腿支撑。计算机程序创建出这类对象的数字化模型。这为特定图像数据的语义搜索创造了条件,还能让驾驶辅助系统自动检测交通标志。

  识别差异。不过,研究人员往往希望视觉系统能够执行更为复杂的任务,比如,数出某个地铁车站有多少人。但是,如果一个人的身体被挡住了,视觉系统只能检测到他或她的头部,而无法检测到他或她的躯体。在这种情况下,系统仍然需要能够判断出它看见了一个人。因为它知道人或物会被挡住,也能挡住其他人或物,然后推断出被挡住部分的形状,判断出整体。

  普林斯顿的计算机科学家Vinay Shet说:“未来,计算机可能识别出存档视频资料中更为复杂的图像,尤其是在司法取证系统中。”例如,可以在机场等大型建筑物中利用多个摄像头跟踪某一个人。Shet将这种视觉图像搜索比作寻找“视觉语法”。“正如语言中的句子一样,图像和视频资料也有结构,可以被理解为视觉语法,”他说。把各种特征归结为视觉数据就能做到这一点。接下来结合各种特征数据,去评估判断从不同的摄像头看到的是不是同一个人。

  同样的视觉语法技术还能被用于货物和行李的安检过程,这正是西门子基础设施和物流集团感兴趣的领域。视觉模式识别可以帮助识别诸如炸弹的结构,包括引爆线、炸药和电话引爆装置等。迄今为止,在世界各地的机场中,这项工作仍然是由人完成的。

  现在,可以驱动视觉搜索的自动检测算法的功能仍不够完美。纽约哥伦比亚大学脑电图(EEG)专家Paul Sajda带领的一组科研人员,正在开发一种新技术,它可以将人类的精确性和机器的快速性结合起来。该项目由美国国防部提供资金,西门子美国研究院的机器视觉科学家也参与其中,旨在快速扫描大型卫星图像,从而检测出重要的对象,比如工厂、建筑物、道路、直升机着陆点等。

  在一个系统中,研究人员将机器视觉和电子增强人类视觉结合在一起,从而大大加快了整个影像分析过程的速度。首先,由西门子开发的机器视觉软件屏蔽掉不可能有目标物出现的地区,例如没有明显特征的同质性区域,像沙漠、密林或大草原等。然后,图像中剩下的可能有目标物的部分被分割成小块或“碎片”,然后交给图像分析人员,后者戴有多电极脑电图传感器,传感器又连在信号分析计算机上。这些碎片接连不断地快速闪过(每秒钟五至十个)——速度太快了,以至于分析人员根本无法进行有意识的分析或做出反应。但如果某一地区出现目标物,就会发出脑电波,这一信号会被EEG系统检测到。最后,分析人员检查有EEG检测碎片的地区,最终决定需要检查哪个目标物。“这种合二为一的方法将分析速度提高了三倍,” 西门子美国研究院的研究人员Claus Bahlmann指出。

  无人驾驶的叉车。智能化图像分析对于工业环境中的运动控制也是不可或缺的。例子之一就是西门子在德国慕尼黑和斯图加特的研究机构针对叉车等商用车开发的“自动导航系统”。由工人引导叉车去学习认路。叉车认路的标志都在场地的上方,而这种标志一般不会发生变化。这样它就可以自动调节,并来回不断地重复走同样的路线。

  “系统在某种程度上还可以识别物体。它可以识别出要执行的任务所涉及到的重要物体,比如仓库中的托盘和箱子,”Gisbert Lawitzky说。他是西门子在慕尼黑的研究机构的机器人专家。戴姆勒正在使用自动导航车辆,尤其是用它们将货盘运到装车斜坡台,然后再运回来。“取决于具体的任务,这些车辆以后还可以识别其他物体,还会识别出自己所处的位置,” Lawitzky指出。这种系统的潜在应用包括安防机器人、博物馆机器人导游、百货商场机器人理货员等。

  会看地图的机器人。普林斯顿的研究员Maneesh Singh还在研发一种移动机器人。他买了一个机器人,它看上去就像是一个带轮子的高压锅,然后给它装了一套微软“Kinect”摄像系统。这种系统可以识别并读懂使用者的胳膊和手的动作。

  这个摄像机最初是为Xbox 360游戏机开发的,里面安装了一个三维传感器。利用这个传感器,机器人不仅能够检测和自动绕开障碍物,而且还能生成周围环境的实时模型,这样它就能决定过一会自己应该停在哪里。

  “这种移动设备还会和人类一样看大楼入口处的平面图,理解并使用地图自动导航去大楼的任何地方。同时,它还能对去过的地方形成视觉记忆,”Singh说。

  但是Singh对他的机器人还有更高的期望。在不远的将来,他希望机器人通过机器学习不仅能够识别人类和人类的行动,还能够通过自然互动和人类交流并向人类学习。他说:“很快我们就可以教机器人学习,就像教孩子那样,比如,指着某个物体并和它们说话。”

  和Genc的飞行检查技术一样,Singh的学习型机器人也正在处于研发阶段。在西门子研发部,这类创意一般会经过一段时间的测试,然后和相关的业务部一道,就它们是否适合在市场上进行推广做出决定。这就为西门子的工程师提供了自由,他们还可以继续尝试新鲜的东西。其中的一个尝试就是能够大大推进机器自主学习的“Outlier”。

  能够发现异常的系统。大多数自适应图像识别算法都是在经历了训练阶段以后,才作为一个系统进行部署。然而,“Outlier”是一种在职学习型的智能监控系统。迄今为止,它还没有迈出实验室的大门。它捕捉到视频数据后,就会对视野内被认为是正常的东西形成统计模型。但是如果出现了一个异常的东西——比如街上打滑的车辆——它就会将它视为异常物,并报告给管理者。它会从反馈信息中学习,决定这一情况是否被定性为异常,并随后调整相应的报告。

  Josef Birchbauer是西门子在格拉茨的研究员,他说:“Outlier堪称一种模式转变。”它的特色就是能够不断地适应新环境。正如Birchbauer所强调的,“在这个复杂的世界中,几乎不可能预测每一步发展,”所以实时学习的能力就显得十分必要——不管发生在机场还是在时代广场中心。“这种方法很有可能不会独立使用,”Birchbauer提醒说,“未来,视频安防系统在实际投入使用之前,将会经过数以千计的样本图像的训练,但是它在实际工作过程中也会实时学习。”

  

评论
编者按

  在所有行业领域,实现创新是企业保持竞争力的活水源泉,它不仅是创新思维的具体表现,更是满足客户需求的具体手法。在知识爆炸时代如何掌握企业之核心技术与通路,发挥创意巧思透过不断的产品创新,来掌握顾客需求建构企业经营的利基。这值得我们思考。
  160多年来,西门子几乎成了科技创新的代名词,在它创新的纪念碑上镌刻着像电报机、发电机、电力机车和高纯硅这样划时代的发明,西门子展示最先进的创新解决方案和理念。
  

西门子聚焦
全面、绿色交通解决方案
生活处于永不停歇的运动当中,生活需要交通。只有高效、绿色、综合的交通解决方案,才能在全球大趋势下应对来自交通领域日益严峻的挑战。
未来之窗
研究与创新在西门子
博客
马宇
创新型国家离我们还有多远?
中国经济政策研究人员

放眼全球,如今似乎真是一个创新的时代--最起码是标榜创新的时代。

饶毅
中国科技体制改革与海归
北京大学教授、北京生命科学研究所资深研究员。

现代大国的强盛需要坚实的科学基础。