述马氏距离欧式距离Tanimoto测度的相同点和不同点.docx
《述马氏距离欧式距离Tanimoto测度的相同点和不同点.docx》由会员分享,可在线阅读,更多相关《述马氏距离欧式距离Tanimoto测度的相同点和不同点.docx(3页珍藏版)》请在优知文库上搜索。
1、第三章作业姓名:苏刚学号:1515063004学院:数学与计算机学院一、述马氏距离、欧式距离、Taniinoto测度的相同点和不同点。1 .欧式距离(EUCIideandistance)n山川(X.V)=.Eg-Ih)2相当于高维空间内向量说表示的点到点之间的距离。由于特征向量的各分量的量纲不一致,通常需要先对各分量进行标准化,使其与单位无关,比如对身高(cm)和体重(kg)两个单位不同的指标使用欧式距离可能使结果失效。优点:简单,应用广泛(如果也算一个优点的话)缺点:没有考虑分量之间的相关性,体现单一特征的多个分量会干扰结果。2 .马氏距离(Mahalanobisdistance)C=E(X
2、-X平均)(丫-丫平均)为该类输入向量X的协方差矩阵.(T为转置符号,E取平均时是样本因此为nT)适用场合:度量两个服从同一分布并且其协方差矩阵为C的随机变量X与Y的差异程度。度量X与某一类的均值向量的差异程度,判别样本的归属。此时,Y为类均值向量。优点:独立于分量量纲,排除了样本之间的相关性影响。缺点:不同的特征不能差别对待,可能夸大弱特征。3 .Tanimoto系数(又称广义JaCCard系数)d=1(邛|+3也+C(a1*+a22+.al)+,/(bj2+b22+.+bn2)-(a1b1+a2b2+.+anbn)通常应用于X为布尔向量,即各分量只取。或1的时候。此时,表示的是X,Y的公共
3、特征的占X,Y所占有的特征的比例。马氏距离的计算是建立在总体样本的基础上的,这一点可以从上述协方差矩阵的解释中可以得出,也就是说,如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同;在计算马氏距离过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,用欧式距离来代替马氏距离,也可以理解为,如果样本数小于样本的维数,这种情况下求其中两个样本的距离,采用欧式距离计算即可。满足了条件总体样本数大于样本的维数,但是协方差矩阵的逆矩阵仍然不存在,比如三个样本在其所处的二维空间平面内共线(如
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 述马氏 距离 欧式 Tanimoto 测度 相同点 不同点