当前位置:首页 > 芯闻号 > 充电吧
[导读]要知道模式识别讲什么内容。主要解决什么问题,我们如何进入这个领域,总要知道一些基本的概念,一些基本的、现有的方法。概念性的东西,参考希腊的那本《Pattern Recognition》,我看的是第四版

要知道模式识别讲什么内容。主要解决什么问题,我们如何进入这个领域,总要知道一些基本的概念,一些基本的、现有的方法。


概念性的东西,参考希腊的那本《Pattern Recognition》,我看的是第四版的影印版,有时候也会看看Duda的模式分类,这本书有电子版原版,原版影印版在国内已经绝版了。有时候也会参考wikipedia,这个网站确实不错!


1、模式识别

 英文是 Pattern recognition。 有时候业内的人常把它简单写成PR,他是一门科学,将多个对象分到不同的类别的学科。wikipedia解释说,PR是机器学习的一个学科,而机器学习又是人工智能的一个分支。不想把问题描述的这么全面,我们只在模式识别里面看问题。

 Pattern recognition is a scientific discipline whose goal is the classification of objects into a number of categories or classes. 

 根据不同的应用背景,这里的object可以是很多东西,比如图像啊什么的,我们不关心这个object到底是啥,为了表明我们真的不关心,干脆不叫他object了,叫一个更加高级的名字,就叫pattern,中文翻译为模式。这样模式识别就是把模式分到不同的类里了,这就不难理解Duda为啥把他的书叫模式分类了。 


2、features, feature vectors, classifiers

就是特征,特征向量,还有分类器。每个需要我们分类的模式,可能有很多特征,那么特征就可以认为是模式的函数,一般这个函数是实值的,至少我没有遇到过复数的特征,如果是复数,我们可以看成两个特征。因为每个模式可能有多个特征,所以我们把这些特征弄成一个向量,因为在代数里面,向量都是用列向量来描述的,这里我们也会用列向量来描述,以便我们好使用代数里面的结论。 这个向量我们一般称之为特征向量,就是feature vector了。至于分类器,其本质也是函数,接受特征向量,给出类别的函数,为了方便计算机处理,我们一般用数字来表示类别。这样分类器也是一个实值函数了。

为了能慢慢进入这个领域,我想多多在进入之前思考一下是有必要的。

模式识别里面,常常把 特征看成是随机变量,大约可以有两个理由说明这一点,首先同一个类之中的模式存在差异,随机取一个模式,他的某个特征可能是随机的,比如随机在一堆鱼里面取一条鱼,他的长度特征在取之前可以认为是随机的。 另外,我们在度量模式的特征的时候,由于仪器,设备等原因,可能会引入随机误差,也就是说我们很难提供100%的精确控制,来获得精确的特征值。

为研究方便,总是给出数学记号的,L个特征x_i , i = 1,...,L,组成特征向量 X = [x_1, ...., x_L]^T

misclassification,如果分类器把输入的模式分错了,我们就说发生了‘错分’,就是misclassification发生了。特别注意,每个模式都有一个特征向量,所以我们分类的时候,就是通过特征向量来分类的,把特征向量输入到分类器(就是那个分类函数)里,然后会得到一个类别返回值,类别呢如果错了,就说发生了错分。

在讨论分类器的时候,会讨论这些问题的。现在我们就使劲把这些概念先装到脑子里,让这些概念添加到我们的条件反射里,深入骨髓!这个东西就会是自己的了,我们就进入这个领域了。

3、那些需要解决的任务

 * 如何产生我们需要的特征?这个根据不同的应用,方法也各有不同,计算机视觉中,我们要找图像的特征。文本分类就搞搞文本特征。具体有哪些,还需要很多时间来研究。这个过程叫 feature generation stage, 特征产生阶段。

 * 我们需要产生多少特征? 多少个特征是最好的?一般我们处理这种问题的时候,采用先找尽量多的特征,然后再根据某些规则使用这些特征中的某一些特征。这个阶段叫 feature selection stage,特征选择阶段。

 * 特征有了,怎么设计分类器?如何找一个规则,在这个规则下造一个最好的分类器?哪些规则好? 有了规则,有了模型,分类器怎么求解?这都是需要我们努力解决的问题啊。 幸运的是,我们现在解决了很多问题了,所以,学习PR还是有很大意义的。这个阶段叫,classifier design 分类器设计阶段。

 * 最后,如何来评价分类效果? 不评价下,总是不完美的吧。说自己好,需要有标准才行。会有一些可以比的项啊,比如分类错误率,classification error rate。这个阶段叫system evaluation stage 系统评估阶段。


这个是传统吧,人 ,本身很向往自由的,看了这个,就发现,自己被框住了,特别不情愿啊,总想着,是不是有其它途径解决分类的问题啊,我不用特征向量行不行呢?直接用原始数据呢? 原始数据不又变成特征了么。有些时候自己不情愿也没办法呀,想站在巨人的肩膀上成就一番事业,总是要继承一下巨人的成就嘛,至少可以批判性的继承呀。哈哈。


4、supervised, unsupervised, semi-supervised learning

有监督的,无监督的,半监督的学习。 首先,学习是啥呢?是这样的,我们在知道了某些特征向量属于哪些类了,比如给了n个特征向量,其中n1个是0类,其余的为1类,根据这个信息(这个信息,我们一般称为priori 信息,就是先验信息啊),人为设计一个方法,这个方法会指导计算机产生一个分类器,产生分类器的过程就是学习过程。这个定义还是抽象到机器学习领域中给出的一个一般化的概念。 前面这种学习是在知道先验信息的条件下给出的,为了与“不知道先验特征信息”的学习做区别,我们称有先验特征信息的学习叫有监督的学习,后者是无监督的学习,无监督学习也叫聚类(clustering)。那个寻找分类器的过程叫做训练training。

半监督学习,条件是,我们知道一些特征向量所属的类,还有一部分模式,我们不知道他们属于哪些类。因为知道点先验信息,所以有监督的含义,又因为我们还有不知道,所以我们有不监督的含义,我们的目的是根据已知的部分信息,在进行聚类。这就是半监督的学习了。



参考资料

 Koutroumbas, Konstantinos; Theodoridis, Sergios (2008). Pattern Recognition (4th ed.). Boston: Academic Press

en.wikipedia.org

Duda.....

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭