光学字符识别系统已经彻底改变了全球邮件处理的方式。但是该技术在其他领域也有很大的潜力,其应用范围不断扩大,目前包括交通和安全系统、弱视者阅读辅助装置,等等。
邮递员和药剂师有一点相同之处:这两种人都有“解码”的能力,可以辨别出哪怕是写得最糟糕的字。但是,随着新的学习技术的惊人进展,现在开发出的机器可以自动识别出各式各样的手写体。
帮助实现这一切的技术就是光学字符识别,或者OCR。西门子产品经理Peter Schindler自豪地说:“就地址识别而言,我们是全球市场领袖。”这里提到的这种能力不是识别印刷体的能力,因为任何一种扫描仪都可以做到这一点,真正值得骄傲的是识别手写体的能力。Schindler预计,全球有将近一半的邮件分拣设备都在使用西门子的OCR技术。这些识别系统的全球市场销售额现在大概是10亿美元,西门子负责生产此设备的是其旗下的交通集团,占有35%的市场份额。
西门子的OCR开发人员正在逐步提高该项技术的准确度。Matthias Schulte-Austum是位于德国康斯坦茨的西门子交通集团负责图像预处理和目标识别的团队的技术经理,他说:“我们最新推出的产品系列ARTread,可以识别90%至95%的手写地址。”但是系统要做的远远不止识别杂乱的手写地址。它还要自动识别信封上所有的相关信息——比如地址的修改、寄信人在信封边上写下的注释,甚至邮票的金额。邮政自动化系统还需要准确地认出寄信人的指示——例如,如果某个地址查无此人,是否要将信件退回寄信人。
总体目标就是最大限度提升自动化水平。Schulte-Austum解释说:“我们希望自动提取和特定项目相关的所有信息,从而尽可能减少手工劳动。”
这类系统有着巨大的发展潜力,尤其是在俄罗斯、印度、中国和阿拉伯国家。西门子康斯坦茨创新中心的专家Ingolf Rauh指出:“我们开发出的算法可以阅读每一种文字,不管是斯拉夫语文字、汉字还是阿拉伯文字。其实最近我们还在一场阿拉伯语手写体阅读竞赛中获奖。”这场竞赛的内容包括准确无误地识别突尼斯众多小镇的名字。
光学字符识别的原理始终基于相同的法则,那就是用实践证明最为有效的方法去训练系统,在学习过程中,让它们比较不同来源的数以千计的手写数字和字母,并进行准确的归类。
Rauh解释说:“我们很快就认识到,这种技术的潜在应用领域很广。正因为如此,我们决定探索OCR技术的各种应用可能性,包括涉及全新市场的应用。”
道路扫描。道路通行费定价系统中的车辆牌照识别,正是这样一个新市场。例如,西门子的Sicore系统使用安装了图像处理软件的摄像头,可以快速识别出街上、高速路上疾驰而过的车辆的车牌号,这种系统就在英国得到了应用。在英国,像伦敦这样的城市已经实施了征收交通拥堵费的措施。摄像头自动显示经过拥堵地段的车牌号,并与中央数据库中记录的数据比对核实,确保这些车辆的司机已经在收费系统进行登记。
还有一种应用是使用摄像头自动记录限速路段的车牌号。和雷达不同的是,这种摄像头可测量车辆在一个较长的路段的平均速度。这样,系统就能够判断司机在隧道里是否车速过快。Stephan von der Nüll在西门子交通集团负责研发新技术和新产品,他说:“利用我们的摄像技术,我们和英国的西门子ITS合作开发出一种名叫Safezone的系统,它是第一套可用于在城区进行车速监控的系统。”Safezone很快即将面世。
隧道安全。在德国联邦教育与研究部开展的一个项目的框架内,相关部门正在评估Safezone系统的扩展应用,其目标是自动识别卡车上的危险品标识(参阅《未来之窗》2010年春季刊第78页)。标识是橙色的,包含两个数字。第一个数字标识危险品的类别,第二个表示危险品本身。
“如果能够自动识别这些标识,那么隧道和桥梁的安全性将得以提高,”von der Nüll说。举例来说,根据项目计划,如果一辆运载氢气的卡车和一辆运载氧气的车辆离得太近的话,系统将自动关闭隧道。载运危险品的卡车在驶入隧道前,系统还能够很快确认这里是否刚刚发生了事故。
将来,经过改进的OCR技术有可能在各处得以应用。它可以自动识别食品的保质期和药品,就像识别汽车和电子行业中印在电路板上的生产批号和序列号一样。弱视人群也可从中受益,因为OCR系统能够为他们读信、读书,甚至读出超市里的食品标签。
在所有行业领域,实现创新是企业保持竞争力的活水源泉,它不仅是创新思维的具体表现,更是满足客户需求的具体手法。在知识爆炸时代如何掌握企业之核心技术与通路,发挥创意巧思透过不断的产品创新,来掌握顾客需求建构企业经营的利基。这值得我们思考。
160多年来,西门子几乎成了科技创新的代名词,在它创新的纪念碑上镌刻着像电报机、发电机、电力机车和高纯硅这样划时代的发明,西门子展示最先进的创新解决方案和理念。
放眼全球,如今似乎真是一个创新的时代--最起码是标榜创新的时代。
现代大国的强盛需要坚实的科学基础。