《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx
《《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx》由会员分享,可在线阅读,更多相关《《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx(4页珍藏版)》请在优知文库上搜索。
1、课题实时统计逾期还款的用户数量课时2课时(90min)教学目标知识技能目标:(1)掌握自动生成数据源的方法。(2)使用DStream的不同操作分析数据。素质目标:综合应用所学知识,提升归纳总结能力和实践能力.教学重难点教学重点:使用DStream的不同操作分析健教学睚点:实时统计数据教学方法案例分析法、问答法、讨论法、i井授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务请大家回顾前面所学内容.【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问
2、题导入【教师】提出以下问题:如何统计实时数据?【学生】思考、举手回答课程实践【教师】描述和分析本次任务内容,并详细演示任务操作过程,弓I导学生操作【任务描述】使用SparkStreaming实时统计逾期还款的用户数量,有助于银行更好地管理业务。如果逾期还款的用户数量增加,银行可以迅速调整管理策略,提高监管强度,从而最大程度地减少损失。本任务先以银行个人信贷业务数据为基础,自动生成数据源;然后使用SparkStreaming实时统计逾期还款的用户数量。1.自动生成数据源【任务分析】本任务先设置每隔10秒从CreditCarcLdataiSV文件中随机获取100行数据并写入新的日志文件中,然后将新
3、生成的日志文件存放在新建的7usr/local/spark/mycode/CreditCard/credit_dataH目录下。这样做便可以自动生成数据源。打开PyCharm,在CreditCard目录下新建MsgProducepy文件,然后在该文件中编写应用程序,自动生成幡源。实现步骤如下。步骤1定义generateOgjlleo函数。步骤2在函数内部,定义两个变量log_file_directory和da(a_file_paih,分别表示存储日志文件的目录和数据文件路径。步骤3A在函数内部,使用无限循环whileTrue不断生成日志文件。(详见教材)【参考代码】importtimeimpo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Spark大数据技术与应用案例教程 Spark 数据 技术 应用 案例 教程 教案 23 实时 统计 逾期 还款 用户数量