2023人工智能机器算法概率模型学习.docx
《2023人工智能机器算法概率模型学习.docx》由会员分享,可在线阅读,更多相关《2023人工智能机器算法概率模型学习.docx(40页珍藏版)》请在优知文库上搜索。
1、人工智能机器算法概率模型学习目录1.1 统计学习31.2 完全数据学习8121最大似然参数学习:离散模型81.2.2 朴素贝叶斯模型111.2.3 生成模型和判别模型131.2.4 最大似然参数学习:连续模型131.2.5 贝叶斯参数学习151.2.6 贝叶斯线性回归19127贝叶斯网络结构学习221.2.8非参数模型密度估计24L3隐变量学习:EM算法271.3.1 无监督聚类:学习混合高斯281.3.2 学习带隐变量的贝叶斯网络参数值31133学习隐马尔可夫模型351.3.4 EM算法的一般形式361.3.5 学习带隐变量的贝叶斯网络结构37小结39在本文中,我们将学习视为一种从观测中进行
2、不确定的推理的形式,并设计模型来表示不确定的世界。我们在第12章中指出,现实环境中的不确定性是普遍存在的。智能体可以利用概率论和决策论的方法来处理不确定性,但它们首先必须从经验中学习到关于世界的概率理论。本文将通过学习任务表述为概率推断过程(20.1节)的方式解释它们如何做到这一点。我们将看到贝叶斯观点下的学习是非常强大的,它为噪声、过拟合和最优预测问题提供了通用的解决方案。本文还考虑这样一个事实:一个非全知全能的智能体永远不可能确定哪种描述世界的理论是正确的,但它仍然需要选择一种理论来进行决策。1.1统计学习本文的核心概念与第19章的一样,是数据和假设。在这里,数据可以看作证据描述相关领域的
3、一部分随机变量或所有随机变量的实例;假设是关于相关领域如何运作的一些概率理论,逻辑理论是其中的一个特例。考虑一个简单的例子。我们喜欢的某款惊喜糖果有两种口味:樱桃味(好吃)和酸橙味(难吃)。糖果的制造商有一种特殊的幽默感-它对两种口味的糖果采用同样的包装。这些糖果统一分装在同样包装的大糖果袋里进行售卖,因此我们无法从袋子的外观上辨别袋中的糖果口味,只知道它们有5种可能的组合方式:历:100%樱桃味h2:75%樱桃味+25%酸橙味h3:50%樱桃味+50%酸橙味h425%樱桃味+75%酸橙味/15:100%酸橙味给定一袋未拆袋的糖果,用随机变量”(以代表假设)表示糖果袋的类型,其可能的值为从阳至
4、5。当然,H不能被直接观测到。但随着袋中的糖果逐颗被打开与辨认,越来越多的数据也逐渐被揭示我们记为其中每个Q是一个随机变量,其可能的值为cherry(樱桃味)或Iime(酸橙味)。智能体要完成的基本任务是预测下一块糖果的口味。山尽管从表面上看这个情景很简单,但它还是引出了许多重要的问题。智能体确实需要推断出一个关于其所在“世界”的理论,尽管这个问题中的理论很简单。1.U有一定统计学基础的读者可以发现该情境是瓮与球(um-and-ball)情形的一个变种。我们发现相比瓮与球,糖果更容易令人理解与信服。贝叶斯学习(Bayesianlearning)是指基于给定的数据计算每个假设发生的概率,并在此基
5、础上进行预测。也就是说,这个预测是通过对所有假设按概率加权求和所得的,而不是仅仅使用了单个“最佳”假设。通过这种方法,学习就可以归约为概率推断。令。代表所有的数据,其观测值为九贝叶斯方法中的关键量是假设先验Psi)和在每个假设下数据的似然31儿)每个假设的概率可以通过贝叶斯法则得到P(hid)=aP(dIl)P()(20-1)现在,假定我们想要对一个未知量X做出预测,那么我们有P(Xm)=EP(Xm)PS (20-2)其中每一个假设都参与决定了X的分布。这个式子说明预测是通过对每个假设的预测进行加权平均得到的,其中根据式(20-1)可知,权重Pej与假设%的先验概率以及它与数据的拟合程度成正比
6、。从本质上说,假设本身是原始数据与预测之间的一个“中间人”。对于上述糖果示例,我们暂定假设力,.,佐的先验分布为01,020.4,0.2,0.1),正如制造商在广告中宣传的那样。那么在观测是独立同分布(见19.4节)的假定下,数据的似然可以按如下方式计算:Pmm)=尸也)/(20-3)举个例子来说,假定一个糖果袋是一个全为酸橙糖果的糖果袋(%),并且前10颗糖果均为酸橙味,因为在心糖果袋中只有一半的糖果为酸橙味,所以PI必)将为05。图20-Ia给出了5种假设的后验概率随着10颗酸橙味糖果逐颗被观测的变化过程。注意,每个概率是以它们的先验概率值作为出发点,因此/23是初始状态下可能性最大的选择
7、,在观测到1颗酸橙味糖果后也是如此。在打开2颗酸橙味糖果后,鱼是可能性最大的。打开3颗后,A5(可怕的全酸橙糖果袋)是可能性最大的。连续10次之后,我们认命了。图20-Ib表示我们对下一颗糖果为酸橙味的概率预测,它基于式(20-2)o正如我们所料,它单调递增,并渐近于1。121我们事先说明过糖果袋中的糖果数目非常多;否则,独立同分布的假设将不成立。严格来说更为正确(但是更不卫生)的做法是在分辨出糖果口味后重新包装糖果并放回袋中。观测d的数所圣窣匚u_ _ 一 9 8 7 SaaI 6 5 O.asws逑w 京 GI 工(a)(b.)图20l(a)根据式(20-1)得到的后验概率Pmj4,,4观
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 人工智能 机器 算法 概率 模型 学习
