《机器学习基础及应用》教案第9课使用支持向量机实现图像识别.docx
《《机器学习基础及应用》教案第9课使用支持向量机实现图像识别.docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第9课使用支持向量机实现图像识别.docx(11页珍藏版)》请在优知文库上搜索。
1、课题使用支持向量机实现图像识别课时2课时(90min)教学目标知识技能目标:(1)掌握线性可分数据的支持向量机分类原理(2)掌握线性不可分数据的支持向量机分类原理(3)了解支持向量机的回归原理(4)掌握支持向量机的Sklearn实现方法(5)掌握支持向量机的参数调节方法(6)能够使用支持向量机训练模型(7)能够编写程序,寻找支持向量机参数的最优值素质目标:了解时代新科技,激发学习兴趣和创新思维,增强民族自信心帮助学生树立履行时代使命的责任担当,激起学生报效祖国的理想情怀教学重难点教学重点:线性可分数据的支持向量机分类原理,线性不可分数据的支持向量机分类原理,支持向量机的回归原理,支持向量机的S
2、klearn实现方法,支持向量机的参数调节方法教学难点:使用支持向量机训练模型;能够编写程序,寻找支持向量机参数的最优值教学方法案例分析法、问答法、讨论法、i井授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,提前了解使用支持向量机实现图像识别的相关知识【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】提出以下问题:线性可分雌的支持向量机分类原理,支持向量机对线性不可分数据进行分类的原理是什么?支持向量机常用的核函数有哪些?【学
3、生】思考、举手回答传授新知【教师】通过学生的回答引入要讲的知识,介绍支持向量机的基本原理、支持向量机的Sklearn实现等知识7.1 支持向量机的基本原理支持向量机(supportvectormachine,SVM)是一种应用非常广泛的机器学习模型,能够解决线性和非线性的分类与回归问题。从实际应用来看,支持向量机在各种实际问题中的表现都常优秀,其在人脸识别、文本和超文本分类、图像分割等领域都有着非常重要的地位。支持向量机非常适合解决复杂但数据集规模较小的分类问题.7.1.1 支持向量机的分类原理1.线性可分数据的支持向量机分类原理对于线性可分的数据,支持向量机对其进行分类的原理是,给定一个训练
4、数据集,基于这个数据集在样本空间中找到一个分类超平面,将不同类别的样本分开.在二维空间中,超平面表现为线的形式.【教师】通过多媒体展示“数据样本点与分类超平面”图片(详见教材),并迸彳方并解有两类不同的样本数据Dl和D2,Dl用小正方形表示,D2用实心圆表示,支持向量机的分类方法就是在这组样本中找到一个分类超平面作为决策边界,决策边界一侧的所有样本在分类中属于一个类别,另一侧的所有样本在分类中属于另一个类别。【教师】通过多媒体展示“数据样本点与多个分类超平面”图片(详见教材),并进彳方并解可见,支持向量机最重要的任务是从样本空间中找到一个合适的分类超平面。在图7-1的数据分布中,很容易就能在小
5、正方形和实心圆之间画出多个分类超平面。接下来通过计算寻找最合适的分类超平面。【教师】通过多媒体展示“支持向量与间隔”图片(详见教材),并进行讲解在分类任务中,样本数据点与决策边界(分类超平面)的距离越远,说明模型越好。然而在实际应用中,往往不需要计算所有样本数据点与决策边界的距离,而是计算离决策边界最近的样本数据点与决策边界的距离,如果这些样本数据点能分类正确,那么,其他样本数据点也能分类正确。在支持向量机中,通常把离分类超平面距离最近的样本数据点称为支持向量,而两个异类支持向量到分类超平面的距离之和称为分类超平面的间隔,通常记作L显然,离分类超平面距离最近的点到分类超平面的距离(间隔)d最大
6、时对应的分类超平面就是最优分类超平面。因此,寻找最优分类超平面的过程就转化成了求间隔d的最大值的过程。只要计算出d的最大值,就能找到对应的分类超平面,这个分类超平面就是最优的分类超平面。在样本空间中,通常使用方程WTX+6=来描述超平面。其中,=(叫吗,町)为超平面的参数向量,决定了超平面的方向;X=(X,42,/)为特征向量;b为位移项,决定了超平面与原点之间的距离。那么,间隔d的计算公式可表示为2二何其中为向量W的模长,模长表示向量在空间中的长度。求d的最大值,就是求Wl的最小值,为方便计算,通常把求解的最小值转化为求解以下公式的最小值。这个公式就是支持向量机分类模型的损失函数,求解该损失
7、函数的最小值,一般需要先用拉格朗日函数将其转化为对偶问题,然后再使用序列最小优化(sequentialminimaloptimization,SMO)算法求解该对偶优化问题。【高手点拨】支持向量机分类模型的损失函数之所以要加上平方,是因为模长是一个带根号的式子,取平方是为了消除根号,方便求导。【教师】组织学生讨论以下问题:请同学们查阅相关资料,讨论什么是拉格朗日函数,什么是SMO算法。【学生】聆听、思考、讨论、回答计【教师】总结学生的回答2 .硬间隔与软间隔对于给定的线性可分训练样本数据集,上述SVM模型要求对任何训练样本都不能做出错误分类,这种构造SVM模型的方法称为硬间隔。可见,硬间隔对训
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习基础及应用 机器 学习 基础 应用 教案 使用 支持 向量 实现 图像 识别
