专访顾小凤:专家眼中的国内手写识别成长轨迹
扫描二维码
随时随地手机看文章
7月27日上午专稿(蒋均牧)采访到顾小凤教授并非易事,离休之后他除了担任北京捷通华声语音技术有限公司(下称“捷通华声”)手写识别技术方面的顾问外,更多时间花在为学术刊物审稿上,此外还抽空喂养着几只流浪猫。
现年76岁的顾小凤是国内最早从事手写识别技术研究、最为高端的专家之一。不仅见证了国内手写识别技术从无到有、上世纪90年代“万码奔腾、千笔如林”的输入时代、手写技术的后PC(个人台式机)时代,也为推动整个进程做出了卓越贡献。
凭借“上海老乡”的理由,C114终于在捷通华声的牵线搭桥下采访到了这位学术奠基者。长年生活在北京的他操着一口标准的普通话,记忆力也相当好。
“手写识别技术最初在国内并没有引起多大重视、专门研究的人也不多,就连我当时也并没有想到能够发展到今天这个地步。”顾小凤在采访中坦言。
从OCR到联机手写:国内手写识别先驱之一
顾小凤,北京大学教授,1934年生于上海,1964年北京大学毕业后留校任教直至离休。
在手写识别领域,他凭借《计算机——激光汉字编辑排版系统》项目跻身国家科技进步一等奖获得者,同时亦是中国专利CN87104719.5“用计算机及图形输入板制作高分辨率汉字字形的方法”的第一发明人。
手写识别技术上世纪80年代初在中国正式起步,然而最初这一技术并不被看好,因为手写板作为PC机的外设可有可无,从事该领域的机构寥寥无几。
“北京大学涉足手写输入的契机主要来自日本松下电器公司的一次邀请。当时他们有一款文字处理机产品但只针对日本用户,主动与我们联系希望能够加以汉字识别方面的改造。北大计算机研究所出了3个人去日本待了3个月,与松下的技术员一起工作。我们也由此对手写识别技术产生了兴趣。”顾小凤回忆道。
手写识别技术主要分为手写OCR和联机手写两大类,后者在国内的发展历史更短。
1985年,北京大学介入手写OCR的研究,课题组由顾小凤主持。1990年7月成果通过机电部主持的鉴定,居国内领先地位。1992年5月完成了该系统的商品化工作。
1990年开始,顾小凤和他的课题组又马不停蹄地开始了联机手写字符识别技术的研究。在他的记忆中,除后来创建汉王科技的刘迎建1980年前后已有相关的产品外,大陆仅有北京大学、巨人集团和哈尔滨工业大学3家机构进行联机手写技术的开发。
到他1998年离休时,课题组已经拿出了数个版本的成果,并形成产品由北大方正经销,但遗憾的是北大方正对该产品并不看好。
顾小凤对此解释称:“国内手写识别技术起步相对冷清的局面,我也经常思考和与同行交流,结论是可能因键盘输入发展太快,上世纪80、90年代时输入法层出不穷。”
而后PC时代的到来,打破了这一冷清局面。笔记本电脑、掌上电脑、手机的出现,大大拓宽了联机手写的应用范围,最终造就了今天的辉煌。
与最新电子产品挂钩——联机手写应用前景广阔
目前联机手写技术在众多电子产品,包括最新潮流的Android手机和iPad平板电脑上都已经成为标配功能。顾小凤明确指出,之所以联机手写能够在“万码奔腾”的输入时代开创出自己的格局,与其应用特点有关。
“与其他输入法相比,联机手写有两大截然不同点——第一它能够配合小型的移动通信设备,键盘输入在这些设备上实现起来很困难。”他娓娓道来。
“第二有专家呼吁电脑用得熟后,很多人写字写不好了,而且错别字一大堆,这跟我们平时手写训练匮乏有关,而联机手写恰恰能够将现今的计算机技术与传统的手写方法结合在一起,保证了写字的习惯。这两个特点是其他任何输入法都无法取代的。”
除此之外,联机手写不仅仅是一种输入法,更有其他领域的用途。
“一个是可以用于汉语教学,作为教学工具。还有一个就是鉴别身份的工具,比如联机手写的笔迹验证可用于银行支票。”
谈及未来联机手写的进一步发展方向,顾小凤指出,在应用领域将扩展到新的电子产品上,就如今天扩展到掌上电脑和手机上一样:“推动该技术走向商用最重要的因素还是电子产品的发展,有新的产品出来后一定要抓紧时间看能不能用上,能够用上就一定要迅速进入。”而在文字方面,也将从目前国内主流的汉字扩展到少数名族文字。
携手捷通:“张连毅对知识和人才的尊重感动了我”
2001年,顾小凤被张连毅的捷通华文请出山,以其十多年的手写识别技术研究应用经验,指导研发团队开发出国内外领先的汉字手写技术与产品。
张连毅在业界也堪称奇人,出身清华大学的他做过学生会主席也担任过企业高管,出过国也在MBA学业未完就回国创业。然而当回顾与捷通华文结缘时,顾小凤笑称曾以为遇到了骗子。
事情是这样的,在2000年的某天顾小凤接到了张连毅的电话,自称是其学生,但顾小凤印象中却没有教过他,经询问方得知张连毅毕业于清华大学,曾经在手写识别的交流活动中请教过自己问题。随后他又致电几位学术界的朋友,确认了张连毅的情况。
然而当时联机手写市场已呈井喷之势,请顾小凤出山的并非捷通华文一家,张连毅隔三岔五就给顾小凤打电话、登门拜访,最终战胜了其他对手。今时今日,张连毅仍对此颇为得意,而在顾小凤看来,张连毅对知识和人才那种骨子里的尊重是他决定出山的根本原因。
此后,顾小凤的得意弟子李健也在导师的极力促成下,最终从英特尔中国研究院来到捷通华文担任技术负责人(捷通华声与捷通华文业务合并后,任捷通华声总工程师)。在两位技术专家带领下,捷通结束了购买其他厂商技术做产品的时代,走上自主创新之路。
“作为一家中小型的民营企业,从捷通华文到今天的捷通华声,在国内并没有得到强有力的支持,本身处于不利的地位,在这种情况下这家企业斗志顽强、不屈不挠,不仅坚持下来而且有了很大成就。除了张总本身对专家的重视外,这一点让我特别有感触。”顾小凤总结称。
在他看来,目前捷通华声的核心竞争力在于除了手写识别技术外,还拥有语音合成、语音识别技术等多项智能人机交互(HCI)技术——这些技术相结合,在解决一些难点问题的同时,也大大丰富了产品线。比如相比以往的手机终端,Android手机屏幕变大而且是全触屏、电子书阅读器和平板电脑屏幕更大,要求行识别、多字识别,这种情况下从充分满足用户体验角度来看,应用到后台语言的模型、语义分析包括语法纠错,单一做手写识别的企业是无法做到的。[!--empirenews.page--]
在采访中,顾小凤数次谦逊地表示,在手写技术识别方面自己其实出力不多,做的是与当时其他人一样的事情:“如果非要说贡献,应该是和其他人一起‘你追我赶’地推动了在这一技术领域的竞争,从而促进了技术的进步。如果说市场上仅有一家企业只用一种技术,那么技术本身也不会发展到今天的水平。”
北京大学教授、我国手写识别技术先驱顾小凤接受C114专访