《机器学习基础及应用》教案第12课聚类(二).docx
《《机器学习基础及应用》教案第12课聚类(二).docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第12课聚类(二).docx(12页珍藏版)》请在优知文库上搜索。
1、课题聚类(二)课时2课时(90min)教学目标知识技能目标:(1)掌握层次聚类算法的基本原理及凝聚层次聚类算法的SkIearn实现方法(2)掌握DBSCAN聚类算法的基本原理及其Sklearn实现方法(3)能够使用凝聚层次聚类算法和DBSCAN聚类算法训练模型(4)能够编写程序,寻找DBSCAN聚类模型参数的最优值素质目标:强化数据安全意识,提高信息技术应用能力帮助学生树立履行时代使命的责任担当,激起学生报效祖国的理想情怀教学重难点教学重点:层次聚类算法的基本原理及凝聚层次聚类算法的Sklearn实现方法;DBSCAN聚类算法的基本原理及其Sklearn实现方法教学睚点:使用凝聚层次聚类算法和
2、DBSCAN聚类算法训练模型;编写程序,寻找DBSCAN聚类模型参数的最优值教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,扫码观看“常见的聚类算法”视频,了解层次聚类算法和DBSCAN聚类算法的相关知识【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】提出以下问题:什么是层次聚类算法?【鞋】思考、传授新知【教师】通过学生的回答引入要讲的知识,介绍层次聚类算法、DBSCAN聚类算法的相关知
3、识9.3层次聚类算法9.3.1 层次聚类算法的基本原理1.层次聚类算法的原理分析层次聚类算法可分为“自底向上”的凝聚法和自顶向下”的分裂法。目前,常用的层次聚类算法是凝聚法.AGNES(AgglomerativeNESting)算法是一种常用的凝聚法。它的聚类原理是,对于给定的样本数据集,先将数据集中的每个样本看作是一个初始聚类簇,然后计算所有样本两两之间的距离,将距离最近的样本合并成一个簇;接下来重新计算簇与簇之间的距离,将距离最近的簇进行合并,该过程不断重复,直到达到预设的聚类簇数目,算法结束,得到最终的聚类结果。可见,AGNES算法的关键是如何计算簇与簇之间的距离。实际上,每个簇都可以看
4、作是一个样本集合,只须计算样本集合的某种距离即可。若给定聚类簇C和,则可通过下面的公式计算两个簇之间的距离。dm(G,G)=mindist(p,q)最小距离:ZCG4nax(G,Cj)=maxdist(p,g)最大距离:%(GC)=771r,dist(p,q)平均距离:,jip0qwq公式中的dist(Pq)表示样本P与样本q之间的距离.显然,最小距离由两个簇中距离最近的样本决定,最大距离由两个簇中距离最远的样本决定,平均距离由两个簇的所有样本共同决定。当聚类簇距离分别由4血、ma或4”计算时,AGNES算法相应地被称为单链接、全链接或均链接算法。2.层次聚类算法的流程使用层次聚类中AGNES
5、算法进行聚类的具体步骤如下。(1)将数据集中的每个样本看作是一个初始聚类簇。(2)计算所有样本两两之间的距离,将距离最近的样本合并为一个簇.(3)重新计算簇与簇之间的距离,将距离最近的簇进行合并。(4)重复步骤(3),直到达到预设的聚类簇数目。【教师】通过多媒体展示“5个样本数据点之间的距离”4个簇之间的距离“和”3个簇之间的距离”表格,并讲解相关知识【例9-2样本空间中有5个数据点A、B、C、D、E,它们之间的旦疆如表9-3所示。使用AGNES算法对这5个数据点进行聚类(簇与簇之间的距离采用最小距离法进行计算)并画出树形图。表935个样本数据点之间的距离样本点ABCDEAO6237B6O44
6、1C24O55D345O5E7155O【解】使用AGNES算法对5个样本孀点进行聚类的步骤如下。(1)将5个数据点分别看成一个簇,然后计算两两之间的距离。由表9-3可知,最小距离为1,即点B与点E之间的距离最小。因此,将点B和点E合并为一个簇B,EL(2)计算簇B,E与簇A、C、D这4个簇之间的距离。计算簇B,E与簇A之间的距离。由表9-3可知,点B与点A之间的距离为6,点E与点A之间的距离为7,则两个簇之间的距离为6;采用同样的方法计算其他簇之间的距离,计算结果如表94所示。表9-44个簇之间的距离簇B,EACD(B,EJO644A6O23C42O5D435O(3)在表9-4的4个簇中,两两
7、之间的最小距离为2,即簇A与簇C之间的距离最小。因此,将簇A和簇C合并为一个簇A,C(4)计算簇B,E、A,C与D这3个簇之间的距离,计算结果如表9-5所示.表9-53个簇之间的距离簇B,EA,CDB,E044A1C40310)430(5)在表9-5的3个簇中,两两之间的最小距离为3,即簇A,C和簇D之间的距离最小。因此,将簇A,C和簇D合并为一个簇(A,C,D,(6)计算簇(A,C,D与簇B,E之间的距离。经过计算得到两个簇之间的距离为4,将这两个簇合并得到簇A,B,C,D,E)。【教师】通过多媒体展示“树形图”图片(详见教材),并讲解相关知识(7)目前,所有样本已经分层次凝聚成为一个大簇。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习基础及应用 机器 学习 基础 应用 教案 12 课聚类