《数据清洗与预处理》课程标准.docx
《《数据清洗与预处理》课程标准.docx》由会员分享,可在线阅读,更多相关《《数据清洗与预处理》课程标准.docx(18页珍藏版)》请在优知文库上搜索。
1、数据清洗与预处理课程标准课程代码26311026XQX适用专业大数据技术应用专业适用学制3年(5年一贯制、5+2贯通培养)编制人审核人版本号202302一、课程名称数据清洗与预处理。二、适用专业大数据技术应用专业。三、课程学时与学分72学时,4学分。四、课程性质本课程是大数据技术应用专业的一门专.业核心课程,是从事数据采集工程师、数据分析师等岗位必须学习的课程,将为后续学习数据可视化、大数据分析等课程奠定基础。本课程开设在第4学期,学习该课程之前需具备一定的数据采集、数据存储能力,Python程序设计基础、数据库技术应用是该课程的前导课程。本课程学习的知识和技能可以为考取大数据分析与应用X证书
2、(初级)做知识和技能准备。五、课程目标通过本课程的学习,能完成电商商品数据清洗与预处理任务、电商用户评论数据清洗与预处理任务、智能制造数据清洗与预处理任务、学生信息管理数据清洗与预处理任务、动物图像数据清洗与预处理任务,达到以下具体目标:(一)素养目标1 .培养学生的政治思维、政治洞察力与政治敏感性,培养学生的社会主义核心价值观、爱国主义情操。(培养规格1)2 .了解大数据、网络信息等产业文化,遵守职业道德准则和行为规范,具备社会责任感和担当精神。(培养规格3)3 .具备大数据思维,具备较强的逻辑思维能力。(培养规格7,培养规格8)4 .形成诚实、守信、善于沟通、合作和富有爱心的思想品质。(培
3、养规格9)5 .具备创新、创意的思维和团队协作精神。(培养规格9)6 .具备吃苦耐劳的优秀品质与较强的抗压能力。(培养规格10)(二)知识目标1 .了解数据清洗与预处理在大数据真实项目分析流程中的重要作用。(培养规格6)2 .掌握数据清洗工具KettIe的安装、配置与基本使用方法。(培养规格16)3 .掌握PythOn第三方库PandaS的安装、配置与使用方法。(培养规格11)4 .掌握结构化数据去重、缺失值处理、数据转换等基本的预处理方法。(培养规格16)5 .掌握非结构化数据文本编码、文本替换、分词等处理方法。(培养规格16)6 .了解图像数据的预处理方法与实践工具。(培养规格16)(三)
4、能力目标1 .能够使用数据清洗工具Kettle处理结构化数据。(培养规格16)2 .能够使用数据清洗工具Kettle处理非结构化文本数据。(培养规格16)3 .能够使用PythOn第三方库读取、处理结构化数据,并能导出数据。(培养规格16)4 .能够使用Python第三方库处理文本数据,进行文本编码检测、简单的分词处理。(培养规格16)5 .能够使用Python第三方库读取、展示图像数据,并能完成简单的预处理。(培养规格16)6 .具备考取大数据分析与应用X证书(初级)的能力。(培养规格16)六、课程内容与要求本课程以多种行业场景下的数据清洗与预处理任务为载体,坚持立德树人的根本要求,结合学生
5、学习特点,遵循职业教育人才培养规律,落实课程思政要求,有机融入思想政治教育内容,紧密联系工作实际,突出应用性和实践性,注重学生职业能力和可持续发展能力的培养。合理设计:学习单元、能力点、学习内容与要求。本课程按照数据类型和复杂性、数据清洗工具的使用复杂程度、技能水平从单一技能到综合技能、技术沿革从传统技术到智能技术的规律编排学习单元,合理序化教学内容。学习单元15在知识体系上是并列关系。其中,1、4属于结构化数据清洗与预处理,使用KettIe数据清洗工具;2、3、5属于非结构化数据清洗与预处理,使用Python语言进行数据清洗与预处理任务。表1课程内容与要求序号学习单元能力点学习内容与要求学习
6、成果建议学时1电商商品g、土数据清洗与预处理L在数据脏、舌L、差的情况下,能够使用Kettle数据清洗工具执行数据替换、删除等操作,以保证数据准确性。2.能够熟练掌握数据去重、缺失值填补等常用的数据预处理方法与实现方式。3.在数据不规范的情况下,能够利用人工检验或脚本校准处理数据,保证数据内容的符合行业标准。L了解电商网站商品相关数据的含义、特点及意义。2 .掌握数据清洗工具Kettle的安装步骤。3 .了解Kettle的概念模型,掌握Kettle的操作规范流程。4 .掌握使用Kettle校验将电商商品数据源基本格式规范的方法。5 .掌握在Kettle中创建、执行商品数据去重、缺失值替换等转换
7、实例的操作过程,掌握使用Kettle导出处理数据的方法。6 .了解数据清洗与预处理专有名词、规范专业术语与行业用语的使用方式,与团队保持顺畅沟通交流。L经过数据预处理的高质量商品数据集1份。167.了解大数据行业法规法则,自觉维护行业良好风气。2电商用户评论数据清洗与预处理1 .能够编写Python脚本程序对商品用户评论数据进行预处理。2 .能够使用正则表达式对文本字符串进行处理,去除多余字符、空格等。3 .能够使用分词工具对文本数据进行分词。4 .能够使用Python第三方库对中文编码格式进行处理,保证数据内容的符合行业标准。1 .了解电商用户评论数据数据的含义、特点。2 .了解中文分词的含
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据清洗与预处理 数据 清洗 预处理 课程标准