当前位置:首页 > 芯闻号 > 充电吧
[导读]层次聚类算法不同于其它算法,主要体现在它不是只生成一个分类结果,而是产生一系列原模式集合的分类结果,每个分类结果满足一些限制。1、概念X = {x_i, i = 1,...,N}; 是N个l维特征向量

层次聚类算法不同于其它算法,主要体现在它不是只生成一个分类结果,而是产生一系列原模式集合的分类结果,每个分类结果满足一些限制。


1、概念

X = {x_i, i = 1,...,N}; 是N个l维特征向量组成的集合,我们就是要对这个集合中的特征向量分类。

Clustering : R = {C_j, j = 1,...,m}。是某个聚类结果,就叫他类簇吧,我想这样叫,也许别人已经定义了类簇,但是我还是想这样叫他。

如果类簇(clustering)R_1 包含 k个类(cluster),类簇R_2 包含r个类,且r < k, 如果R_1中的每一个类都是R_2中的某个类的子集,那么我就说类簇R_1 嵌入到了 R_2中。 

注意,R_1中至少有两个类是R_2的中某个类的真子集,我没有深入思考这一点,但是这好像是显然的。


比如 R_1 = {{x_1, x_3}, {x_4}, {x_2,x_5}}, R_2 = {{x_1, x_3,x_4}, {x_2.x_5}} ,那么R_1嵌入了R_2中。


层次聚类的目标就是将X分成多个嵌套的类簇(a hierarchy of nested clusterings),这类算法大约包含N步,每一步都是利用上一步产生的类簇结果,生成一个新的类簇,这两个类簇存在一个嵌套关系。根据这种嵌套关系,一般层次聚类有两个方向, 一种方法是从每个特征向量为一类,N个类,聚成一个类,另一种是从一个类,一步步处理到N个类。

前者叫 agglomerative层次算法,后者叫 divisive层次算法。


2、 Agglomerative算法

设g(C_i, C_j)为 C_i 和 C_j两个类之间的近邻测度(proximity measurement), t 表示 当前层次的序号。 下面叙述的是 GAS(Generalized Agglomerative scheme)

下面的算法, g 表示的不相似度测度。


Initialization:
  Choose R_0 = {C_i = {x_i}, i = 1,...,N} as the initial clustering. 
  t = 0.
Repeat :
  t = t + 1;
  Among all possible pairs of clusters (C_r, C_s) in R_{t-1} find the one (C_i,C_j), such that    g(C_i, C_j) = min g(C_r,C_s);
  define C_q = C_i U C_j and produce a new clustering R_t = (R_{t-1} - {C_i, C_j}) U {C_q}
Until all vectors lie in a single cluster.



3、matlab中的agglomerative 算法


给定 模式的特征向量集

Object 1: 1, 2
Object 2: 2.5, 4.5
Object 3: 2, 2
Object 4: 4, 1.5
Object 5: 4, 2.5

即 

X = [1, 2; 2.5, 4.5; 2, 2; 4, 1.5; 4, 2.5];


下面的三个命令可以看到层次图:


Y = pdist(X); 
Z = linkage(Y);
dendrogram(Z)



结果如下:






本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭