《机器学习基础及应用》教案第7课使用朴素贝叶斯算法训练分类器.docx
《《机器学习基础及应用》教案第7课使用朴素贝叶斯算法训练分类器.docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第7课使用朴素贝叶斯算法训练分类器.docx(9页珍藏版)》请在优知文库上搜索。
1、课题使用朴素贝叶斯算法训练分类器课时2课时(90min)教学目标知识技能目标:(1)掌握先验概率与后验概率的计算方法(2)理解朴素贝叶斯算法的原理与流程(3)了解朴素贝叶斯算法的常见问题及解决方法(4)掌握朴素贝叶斯算法的Skleam实现方法(5)能够使用朴素贝叶斯算法训练分类模型(6)能够编写程序,使用朴素贝叶斯模型进行分类预测素质目标:(1)养成分析问题、事前规划的良好习惯(2)了解中国新技术的发展动向,增强民族自信心和自豪感教学重难点教学重点:先验概率与后验概率的计算方法,朴素贝叶斯算法的原理与流程,朴素贝叶斯算法的SIdearn实现方法教学难点:使用朴素贝叶斯算法训练分类模型;能够编写
2、程序,使用朴素贝叶斯模型进行分类预测教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,提前了解朴素贝叶斯算法的相关知识【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】要求学生扫码观看“贝叶斯算法的历史背景”视频,提出以下问题:(1)关于贝叶斯算法,数学家贝叶斯最初提出的观点是什么?(2)贝叶斯算法的数学原理是怎样的?(3)贝叶斯算法的数学表达式是怎样的?【学生】思考、举手回答传授新知【教师
3、】通过学生的回答引入要讲的知识,介绍朴素贝叶斯算法的基本原理、朴素贝叶斯算法的Sklearn实现等知识5.1 朴素贝叶斯算法的基本原理【教师】提出以下问题,随机邀请学生进行回答朴素贝叶斯算法和贝叶斯算法有什么区别?*【学生】聆听、思考、回答【教师】总结学生的回答朴素贝叶斯算法的基础是贝叶斯算法。贝叶斯算法最初是一种研究不确定性的推理方法,不确定性常用贝叶斯概率表示。贝叶斯概率是一种主观概率,对它的估计取决于先验知识的正确和后验知识的丰富和准确。因此,贝叶斯概率常常会根据个人信息的不同而发生变化。例如,假设1班和2班即将进行一场拔河比赛,不同人对胜负的主观预测可能不同,但基本都会根据两班以前的比
4、赛战况进行预测,那么两班以前的h匕赛战况就是一种先验知识。如果两班以前的比赛胜负次数是9:1,那么贝叶斯概率就认为I班获胜的概率是02如果又获取到另一个先验知识,1班有两名主力因受伤不能参加,则贝叶斯概率可能认为I班获胜的概率是0.8。可见,虽然是一种主观概率,但贝叶斯概率按照相关先验知识对事件进行推理是一种合理的方法.5.1.1 先验概率和后验概率在一个空间中,事件A发生的概率用P(八)表示;在事件A发生的条件下,事件B发生的概率用P(BIA)表示。那么,P(八)就是先验概率(PriOrProbability),口目则称作事件B的后验概率(posteriorprobability)0后验概率
5、的计算公式为P(6A)J4B)P(八)例如,经典的抛硬币实验,当实验发生一定次数后,整个样本空间中出现正面(F)与反面(R)的瞬都趋近于0.5。如果一碘3枚硬币,那么,总共会出现FFF,FFR,FRF,FRR,RRR,RFF,RFR,RRF)8种情况,每种情况出现的概率为l8现在,用A描述同时抛出3枚硬币时第一枚硬币出现正面的事件,第一枚硬币出现正面的情况有4种,分别是FFF,FFR,FRF,FRR),因此,概率为P(八)=8;用B描述硬币出现反面的事件,抛出3枚硬币出现反面的情况共有7种,分别是FFR,FRF,FRR,RRR,RFFfRFR,RRF那么,事件A与事件B的交集为FFR,FRF,
6、FRR,共有3种情况,概率为P(AlB)=3/8因此,在事件A发生的条件下,事件B发生的概率,即事件B的后验概率为P(BIA) =P(A B) 3/8 3P(A)4/8由于 P(A f6) = P(8P(B)=皿也P(B)则有尸(8A)=P(AlB)P(B)因此有A)P(AIB)P(B)P(A)P(八)5.1.2 朴素贝叶斯算法的原理与流程1.朴素贝叶斯算法的原理在机器学习中,分类任务就是预测某个样本属于某个类别的过程,预测时需要从已有的数据集中找到相关规律,然后根据规律进行判定。朴素贝叶斯算法找规律的原理是根据数据集中的已有数据得到先验概率,然后求解待测样本属于每个类别的后验概率,哪个类别概
7、率高就将新样本判定为哪个类别。下面根据后验概率的公式,进一步进行推理。假设数据集中有I个特征和两个类别标签,特征用X表示,两个类别分别用c和G表示。则两个类别的先验瞬分别为P(G)和P(G),样本属于类别G和G的后验瞬分别为P(CJx) =P(XIC)P(G)P(C2x) =P()P(XlG)P(G)Pa)计算得到的结果中,哪个概率大,就将新样本划分为哪个类别。现在,将数据集进行扩展,如果数据集中有多个特征(用司,王,;表示各特征)和多个类别标签(用G表示某个类别).那么,样本属于某个类别的后验概率为Ds.、PCX1,v2,zIC)P(C)P(Gl%,%,E)=f、尸(X,X2,x)对于同一个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习基础及应用 机器 学习 基础 应用 教案 使用 朴素 贝叶斯 算法 训练 分类