《机器学习基础及应用》教案第10课构建集成学习模型.docx
《《机器学习基础及应用》教案第10课构建集成学习模型.docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第10课构建集成学习模型.docx(10页珍藏版)》请在优知文库上搜索。
1、课题构建集成学习模型课时2课时(90min)教学目标知识技能目标:(1)掌握集成学习的基本原理、结合策略与类型(2)掌握Bagging算法的基本原理及其Skleam实现方法(3)掌握随机森林算法的基本原理及其Skleam实现方法(4)掌握Boosting算法的基本原理及其Skleam实现方法(5)能够使用随机森林算法训练模型(6)能够编写程序,寻找随机森林模型参数的最优值素质目标:掌握集成学习新思路,提升使用科学方法解决实际问题的能力了解科技前沿新技术,拓展社会实践能力教学重难点教学重点:集成学习的基本原理、结合策略与类型;Bagging算法的基本原理及其Sklearn实现方法;随机森林算法的
2、基本原理及其Sklearn实现方法;Bsting算法的基本原理及其Skleam实现方法教学难点:使用随机森林算法训练模型;编写程序,寻找随机森林模型参数的最优值教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,提前了解集成学习模型的相关知识【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】提出以下问题:什么是集成学习?【甦】思考、传授新知【教师】通过学生的回答引入要讲的知识,介绍集成学习、B
3、agging与随机森林算法、Boosting算法等知识8.1 集成学习8.1.1 集成学习的基本原理1 .集成学习的原理分析*【教师】通过多媒体展示“集成学习的一般结构”图片(详见教材),并进行讲解集成学习(ensemblelearning)也称多分类器系统或基于委员会的学习,它是将多个基础学习器(也称个体学习器)通过结合策略进行结合,形成一个性能优良的集成学习器来完成学习任务的一种方法,如图所示.在集成学习中,个体学习器一般由一个现有的学习算法(如C4.5决策树算法)从训练数据中训练得到。在训练集成学习模型时,如果所有个体学习器都是同类模型(如集成学习模型中每个个体学习器都是决策树模型),则
4、由这些同类个体学习器相结合产生的集成学习模型称为同质集成模型,同质集成模型中的个体学习器亦称“基学习器,相应的学习算法称为基学习算法”;如果个体学习器不是同类模型(如集成学习模型中同时包含决策树分类模型和k近邻分类模型),则由这些不同类别的个体学习器相结合产生的集成学习模型称为异质集成模型,异质集成模型中的个体学习器常称为“组件学习器”。2.个体学习器对集成学习模型性能的影响集成学习是通过一定的结合策略将多个个体学习器进行结合得到的模型。模型的性能会受到个体学习器的预测准确率、多样性和数量等因素的影响。(1)个体学习器的预测准确率与多样性对集成学习模型性能的影响。【教师】通过多媒体展示“集成学
5、习模型性能提升”集成学习模型性能降低“和”集成学习模型性能不变”表格,并介绍相关知识例如,在二分类任务中,如果3个不同的个体学习器在3个测试样本中的预测准确率都是66.6%,则集成学习模型的预测准确率可能能够达到100%,即集成学习模型的性能有所提升,如表8-2所示(。率(一般个体学习器的预测准确率应大于60%),并且各个个体学习器之间要有差异(多样性)(2)个体学习器的数量对集成学习模型性能的影响。例如,在二分类任务中,假设个体学习器的预测误差率相互独立,则集成学习模型的预测误差率为 exp -T(1-其中,T表示个体学习器的数量,0表示个体学习器的预测误差率。【知识库】集成学习模型的预测误
6、差率公式是通过Hoeffding不等式计算得到的,Hoeffding不等蝙常用于组合数学与计算机科学,其不等式右侧的符号exp在高等数学中表示以自然常数e为底的指数函数,即8叫V可见,随着集成学习模型中个体学习器数目T的增大,集成学习模型的预测误差率将呈指数级下降,最终趋向于零。然而,这个结论是基于假设个体学习器的误差相互独立”得到的。在现实任务中,个体学习器是为解决同一问题而训练出来的,显然它们不可能相互独立。事实上,个体学习器的“准确性和多样性本身就存在冲突,一般准确性较高之后,要增加多样性就必须牺牲准确性.所以说,如何训练出好而不同”的个体学习器,是集成学习研究的核心内容。8.1.2集成
7、学习的结合策略常见的集成学习结合策略有3种,分别为平均法、投票法和学习法。1.平均法当模型的预测结果是数值型数据时,最常用的结合策略是平均法,即模型的预测结果是每个个体学习器预测结果的平均值,平均法包含简单平均法和力哝平均法两种。假设集成学习模型中包含T个个体学习器用,其中,个体学习器h对样本X的预测值表示为(外,则简单平均法的计算公式为1 IH(X)=不ZMX)lT力哝平均法的计算公式为=Z岫(X)r=lfWf=l其中,Wi表示个体学习器几的权重,通常要求叫且.加权平均法的权重一般是从训练集中学习得到的。现实任务中的训练样本通常不充分或存在噪声,这使得模型从训练集中学习得到的权重并不完全可靠
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习基础及应用 机器 学习 基础 应用 教案 10 构建 集成 模型