2021下学期|第十七次课-第五章第三节-数据的清洗与保存(加上课注释)
株洲市二中高中信息技术必修一《数据与计算》集体备课资源(2020年下学期)
必修2《信息系统与社会》株洲市二中集体备课资源(2020年下学期)
海龟绘图在线编程网址:https://wood.codemao.cn
2021下学期|第五次课-海龟绘图设计LOGO(加上课注释)
2021下学期|第六次课-海龟绘图自由创作(2115班作品)
--第六次课-2112班作品展示 --第六次课-2113班作品展示 --第六次课-2116班作品展示--第六次课-2117班作品展示
--第六次课-2118班作品展示 --第六次课-2119班作品展示 --第六次课-2120班作品展示
2021下学期|第七次课-我的生涯规划-顺序结构(加上课注释)
2021下学期|第八次课-我的生涯规划-顺序结构的应用(加上课注释)
2021下学期|第九次课-我的生涯规划-选择结构(加上课注释)
2021下学期|第十次课-我的生涯规划-多重选择结构(加上课注释)
2021下学期|第十一次课-我的生涯规划-for循环结构(加上课注释)
2021下学期|第十二次课-我的生涯规划-while循环结构(加上课注释)
2021下学期|第十三次课-我的生涯规划-循环嵌套结构(加上课注释)
2021下学期|第十四次课-我的生涯规划-第四章复习总结(加上课注释)
2021下学期|第十五次课-第五章第一节-认识大数据(加上课注释)
2021下学期|第十五次课-第五章第一节-认识大数据(谢清华)
2021下学期|第十六次课-第五章第二节-数据的采集(加上课注释)
教学设计
教学课题:第五章第三节-数据的清洗与保存
教学目标:
讲解BueatifulSoup库的安装
讲解BueatifulSoup清洗数据代码
将上节课爬取的小说源代码中的小说清洗并保存
教学重点:讲解BueatifulSoup清洗数据代码
教学难点:将上节课爬取的小说源代码中的小说清洗并保存
教学课时:40分钟1课时
教学课件
导入,一边等学生到齐,一边给学生播放视频介绍数据清洗与分析的意义。然后引入上堂课的教学内容进行复习,进而引出数据清洗学习的必要性。
发放学案资料,让学生先安装库文件。由于网络的原因安装库文件需要一定的时间,提前安装是最好的选择。
这是在MOOC上录屏的嵩天老师的课,介绍BeautifulSoup库的视频。先播放,让学生对BeautifulSoup库有一个初步的了解。
播放完视频后,继续讲解BeautifulSoup库的用法,同时引导学生体验BeautifulSoup库编程清洗数据的代码,在上堂课的代码基础上补充代码,查看数据的清洗效果。
引导学生打开网页的原文件,并查找标签title下的文本,是否跟清洗的数据完全一致,初步体验BeautifulSoup库在清洗数据中的强大功能。
然后输出一个p标签的内容,引出认知冲突,从而引出select()函数的必要性,清洗多个相同标签内的文本内容。
复习列表的内容,select()选出的文本保存在列表中。通过不断反复的学习列表,复习第四章学过的教学内容。同时提醒学生利用自己上堂课下载的网址,来清洗自己的小说,并提交作业。
分享学生作品,并评价总结。有时间就尽量多看几个学生的作品,体验分享交流的快乐以及成功的喜悦。
教学反思
本教学设计对去年的内容进行了大量的修改,当然是变得更简单了,因为去年的作业达成率没有达到我的期望,再加上豆瓣在上课的过程中出现将我们当“黑客”禁止爬取现象,所以今年开始进行了大改,改成了各自爬取小说,同时将难度降低了。
第十六次课学生对爬取的小说非常感兴趣,并且有学生很开心地说:“这个真的太实用了!”不少学生喜欢在课堂上看小说,而有些小说甚至禁止复制,但是却可以爬取下来,学生的兴趣在第十六次课已经被激发了,所以本堂课趁热打铁,直接教学生清洗小说,这样跟学生的学习需求也息息相关,又在上一堂课的基础上进行迭代加深,所以上课效果还不错。
越上到后面,越发现爬取纯文本数据的应用价值其实还蛮大的。然后自己也积累了一些应用价值方面的感悟:不仅仅是看小说的需要,还有做研究性学习收集资料,还有对网上的评论的收集等等……应用这个基础爬虫知识就可以完成。
由于有些老师嫌弃百度网盘下载限流,所以增加了阿里云盘分享,两个云盘都放了下载文件,均可免费下载。
百度网盘下载地址:
链接:https://pan.baidu.com/s/1RxnMzvp6o8IWhv-4k-usxw
提取码:1111
阿里云盘下载地址:
链接:https://www.aliyundrive.com/s/CLSYNuuySCs