漫谈WinCE的手写识别技术(一)

时间：2014-06-09 13:20:29

关键字： WinCE 识别技术 RESULTS RGB

手机看文章

扫描二维码
随时随地手机看文章

[导读] //========================================================================//TITLE:// 漫谈WinCE的手写识别技术(一)//AUTHOR:// norains//DATE:// Wednesday 24-Janua

//========================================================================

//TITLE:

// 漫谈WinCE的手写识别技术(一)

//AUTHOR:

// norains

//DATE:

// Wednesday 24-January -2007

//Environment:

// EVC4.0 + Standard SDK

//========================================================================

WinCE从4.0开始,集成了手写识别输入法,可以识别繁体中文,日文和韩文.因此如果在WinCE下采用相应的API函数重写上述三种语言的手写识别输入似乎显得多此一举.但多余并不代表没有了解的价值,今天,就让我们抽丝剥茧来探究WinCE下的手写识别吧!

大体上来说,调用WinCE自带的识别引擎进行文字识别需要经过如下十个步骤:

1.调用HwxConfig ()函数初始化识别引擎.在每个应用程序中,该初始化只需要调用一次.

2.调用HwxCreate()创建识别引擎句柄.

函数原型为:HRC HwxCreate(HRC hrc).该函数有个形参hrc,保存的是已存在的识别引擎句柄.如果传入该形参,则可以根据已存在的引擎的设置来创建新的识别引擎.当然通常情况下我们仅仅是创建一个新的引擎,所以该函数更多情况下是不使用形参:

3.调用HwxSetGuide()函数来设置识别框的范围.

设置该识别框范围的重要性不言而喻,因为如果设置不恰当,则直接导致识别出错甚至无法识别.

该函数传入的形参是一个HWXGUIDE结构,该结构包含了识别框的一切信息:

typedef struct tagHWXGUIDE {

UINT cHorzBox;

UINT cVertBox;

INT xOrigin;

INT yOrigin;

UINT cxBox;

UINT cyBox;

UINT cxOffset;

UINT cyOffset;

UINT cxWriting;

UINT cyWriting;

UINT cyMid;

UINT cyBase;

UINT nDir;

} HWXGUIDE, *PHWXGUIDE;

如果用文字来描述各个形参的含义,我实在没这个能力让语言读起来不觉得乏味,所以最简单最直接最直观的方法,我还是用图片来标识出各个参数的含义,至少应该不会让脑袋觉得发晕:

xOriginy,Origin分别定义了识别框的起始坐标,而cxBox,cyBox则分别定义了识别框的长度和宽度.需要注意的是,这四个参数是以屏幕坐标为基准,如果我们获得的是应用程序窗口的坐标,在赋值之前,我们需要调用MapWindowPoints()进行转换.当然,相同的道理也同样运用于该结构的其它形参.

nDir定义了书写的顺序,我们一般使用HWX_HORIZONTAL,表明书写方式是水平书写.当然,如果有特殊要求,我们还可以设置HWX_BIDIRECTIONAL或HWX_VERTICAL.

4.调用HwxALCValid()和HwxALCPriority()定义识别的标准.

HwxALCValid()用来定义识别字符的范围,HwxALCPriority()则是定义返回字符的优先级.

根据帮助文档,可以识别的字符文字为:简体中文,繁体中文,日文,韩文和英文.但在实际使用中,却是无法正确识别简体中文,这不能不说是一个遗憾.在平时应用中,我们一般只需识别一种文字,此时我们可以只是简单地设置HwxALCValid()即可:

HwxALCValid(hrc,ALC_KANJI_ALL); //识别汉字

5.调用HwxSetContext()设置前文,提高文字识别率.如果没有前文,可以不调用该函数.

6.调用HwxInput()加入文字笔画.如果文字是多笔画,则应多次调用该函数.

函数原型是:

BOOL HwxInput(

HRC hrc,

POINT* lppnt,

UINT upoints,

DWORD timestamp

);

lppnt是输入的笔画坐标,upoints是坐标的个数,和HWXGUIDE的参数一样,这里的坐标也是屏幕坐标系.timestamp是时间,一般情况下,我们可以设置为0.

需要注意的是,如果是多笔画的文字,最好不要一次性将所有笔画点阵通过HwxInput()输入,否则最后的识别结果将会大相径庭.因为识别引擎是一笔一划进行输入识别的,如果多笔画文字一次性输入,引擎可能将所有笔画当成一个笔画,从而导致识别结果异常不准确.

7.调用HwxEndInput()告知引擎笔画输入结束,即将要进行识别部分.

8.调用HwxProcess()让引擎进行识别处理.

9.调用HwxResultsAvailable()获取识别的字符数.

根据文档,HwxResultsAvailable()返回识别的字符数.然而在WinCE4.2中,调用hwxcht.dll的话,任何时候都是返回为0值,即使之后的函数能返回识别字符也依然如此.文档中描述,该函数如果返回的是-1,则代表调用失败,其它值代表可供使用的字符数.也许是WinCE4.2下识别引擎不完善的缘故,该函数根本没有发挥文档所描述的作用.

10.调用HwxGetResults()获取结果.

INT32 HwxGetResults(

HRC hrc,

UINT cAlt,

UINT iFirst,

UINT cBoxRes,[!--empirenews.page--]

HWXRESULTS* rgBoxResults

);

初看起来,该函数形参似乎特别复杂,但实际上并非如此.

根据文档,cAlt是期望的轮流返回的字符,iFirst是想要返回字符的索引,cBoxRes是返回的字符个数.但实际上,cAlt起主导作用,比如说cBoxRes设置为1,而cAlt设置为10,则返回的字符个数依然为10.所以我在平常使用中,一般是将iFirst设为0,cBoxRes设为1,而cAlt设为所需返回的字符个数.

rgBoxResults指向储存字符的缓冲区.不过,返回结果比较有意思,除了第一个rgBoxResults以外的所有结构的indxBox成员都储存了返回字符.

比如返回五个字符‘与子于飞干‘,则rgBoxResults的数组列数值为:

rgBoxResults[0].indxBox : 0

rgBoxResults[0].rgChar[0] : ‘与‘

rgBoxResults[1].indxBox : ‘子‘

rgBoxResults[1].rgChar[0] : ‘于‘

rgBoxResults[2].indxBox : ‘飞‘

rgBoxResults[2].rgChar[0] : ‘干‘

11.调用 HwxDestroy()销毁引擎,本次识别过程结束.如果需要继续识别文字,从步骤2重新开始.