2023人工智能机器算法样例学习.docx
《2023人工智能机器算法样例学习.docx》由会员分享,可在线阅读,更多相关《2023人工智能机器算法样例学习.docx(97页珍藏版)》请在优知文库上搜索。
1、人工智能机器算法样例学习目录1学习的形式51.1 监督学习81.2 决策树学习141.2.1 决策树的表达能力151.2.2 从样例中学习决策树151.2.3 选择测试属性191.2.4 泛化与过拟合22125拓展决策树的适用范围241.3 模型选择与模型优化261.3.1 模型选择28132从错误率到损失函数301.3.3 正则化33134超参数调整341.4 学习理论361.5 线性回归与分类421.5.1 单变量线性回归421.5.2 梯度下降441.53多变量线性回归471.1.4 带有硬阈值的线性分类器501.1.5 基于逻辑斯谛回归的线性分类器541.6 非参数模型581.6.1
2、最近邻模型581.6.3 局部敏感哈希62非参数回归631.6.5支持向量机651.6.6 核技巧701.7 集成学习721.7.1 自助聚合法731.7.2 随机森林法741.7.3 堆叠法761.7.4 自适应提升法761.7.5 梯度提升法811.7.6 在线学习821.8 开发机器学习系统851.8.1 问题形式化851.8.2 数据收集、评估和管理861.8.3 模型选择与训练911.8.4 信任、可解释性、可说明性931.8.5 操作、监控和维护95小结98我们用样例学习来描述智能体通过不断学习自己以往的经验从而改善自己的行为,并对未来进行预测的过程。如果一个智能体通过对世界进行观
3、测来提高它的性能,我们称其为智能体学习(learning)0学习可以是简单的,例如记录一个购物清单,也可以是复杂的,例如爱因斯坦推断关于宇宙的新理论。当智能体是一台计算机时,我们称之为机器学习(machinelearning):一台计算机观测到一些数据,基于这些数据构建一个模型(model),并将这个模型作为关于世界的一个假设(hypothesis)以及用于求解问题的软件的一部分。为什么我们希望一台机器进行学习?为什么不通过合适的方式编程然后让它运行呢?这里有两个主要的原因。其一,程序的设计者无法预见未来所有可能发生的情形。举例来说,一个被设计用来导航迷宫的机器人必须掌握每一个它可能遇到的新迷
4、宫的布局;一个用于预测股市价格的程序必须能适应各种股票涨跌的情形。其二,有时候设计者并不知道如何设计一个程序来求解目标问题。大多数人都能辨认自己家人的面孔,但是他们实现这一点利用的是潜意识,所以即使能力再强的程序员也不知道如何编写计算机程序来完成这项任务,除非他使用机器学习算法。学习的形式一个智能体程序的各个组件都可以通过机器学习进行改进。改进及用于改进的技巧取决于下面几个因素:哪些组件可以被改进;智能体有哪些先验知识,这将影响模型构建;有哪些数据,以及关于这些数据的反馈。第2章中描述了一些智能体的设计。这些智能体的组件包括:(1)从当前状态条件到动作的直接映射;(2)用于从感知序列推断世界相
5、关性质的方法;(3)关于世界演化方式的信息,以及关于智能体可以采取的可能动作所导致的结果的信息;(4)表示状态意向的效用信息;(5)表示动作意向的动作价值信息;(6)最希望达到的状态,即目标;(7)问题生成器、评判标准和使系统得以改进的学习元素。这些组件中的任何一个都可以被学习到。我们设想一个可以通过观测人类司机行为来学习自动驾驶的汽车智能体。每次司机刹车时,这个智能体可以学习到一个关于什么时候该踩刹车的条件动作规则(组件1)o通过观察大量包含公共汽车的照相机图像,它可以学习到如何辨认公共汽车(组件2)。通过尝试不同动作以及观测相应的结果(例如在潮湿的道路上艰难地刹车),它可以学习到动作相应的
6、结果(组件3)o接着,如果它收到在旅途中被剧烈颠簸吓坏了的乘客们的抱怨,它可以学习到关于其总体效用函数的一个有效组件(组件4)。机器学习技术已经成为软件工程的标准组成部分。无论何时你想搭建一个软件系统,即使你不认为它是一个人工智能主体,这个系统的组件也可能可以用机器学习的方式加以改进。例如,一个用于分析星系在引力透镜下的图像的软件可以通过机器学习的模型加速一千万倍(HezavehGal2017);通过采用另一种机器学习的模型可以将数据中心冷却的能耗降低40%(Gao,2014)0图灵奖得主大卫帕特森(DavidPatterson)和谷歌Al的掌门人杰夫迪安(JeffDean)宣称,计算机体系结
7、构的“黄金时代”的到来正归功于机器学习(Deanetal.2018)0我们已经见过了一些关于智能体组件的模型示例:原子模型、因子化模型,以及基于逻辑的关系模型或基于概率的关系模型等。人们针对所有这些模型设计了广泛的学习算法。本文中我们假设不存在关于这个智能体的先验知识(Priorknowledge):它从零开始,从数据中学习。在21.7.2节中,我们将考虑迁移学习(transferlearning),在这种情形下,一个领域的知识被迁移到一个新的领域,以更少的数据使学习过程进行得更快。我们当然还要假设系统的设计者选取了合适的模型框架,从而让学习过程变得更加有效。从一组特定的观测结果得出一个普遍的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 人工智能 机器 算法 学习
