查看原文
其他

2021下学期|第十七次课-第五章第三节-数据的清洗与保存(加上课注释)

株洲市二中信息组 信息科技时代 2024-03-15

株洲市二中高中信息技术必修一《数据与计算》集体备课资源(2020年下学期)

必修2《信息系统与社会》株洲市二中集体备课资源(2020年下学期)

高中信息技术粤教版必修1习题集

海龟绘图在线编程网址:https://wood.codemao.cn


2021下学期|第一次课-数据与信息(加上课注释)

2021下学期|第二次课-知识与智慧(加上课注释)

2021下学期|第三次课-算法及其描述(加上课注释)

2021下学期|第四次课-程序设计语言(加上课注释)

2021下学期|第五次课-海龟绘图设计LOGO(加上课注释)

2021下学期|第六次课-海龟绘图自由创作(2115班作品)

    --第六次课-2111班作品展示

    --第六次课-2112班作品展示    --第六次课-2113班作品展示    --第六次课-2116班作品展示
    --第六次课-2117班作品展示
    --第六次课-2118班作品展示    --第六次课-2119班作品展示    --第六次课-2120班作品展示

2021下学期|第七次课-我的生涯规划-顺序结构(加上课注释)

2021下学期|第八次课-我的生涯规划-顺序结构的应用(加上课注释)

2021下学期|第九次课-我的生涯规划-选择结构(加上课注释)

2021下学期|第十次课-我的生涯规划-多重选择结构(加上课注释)

2021下学期|第十一次课-我的生涯规划-for循环结构(加上课注释)

2021下学期|第十二次课-我的生涯规划-while循环结构(加上课注释)

2021下学期|第十三次课-我的生涯规划-循环嵌套结构(加上课注释)

    --2112黄艺馨的第四章文理科测试程序代码

2021下学期|第十四次课-我的生涯规划-第四章复习总结(加上课注释)

    --第四章已经学完,看看2115班孩子们的心声

2021下学期|第十五次课-第五章第一节-认识大数据(加上课注释)

2021下学期|第十五次课-第五章第一节-认识大数据(谢清华)

2021下学期|第十六次课-第五章第二节-数据的采集(加上课注释)

2021下学期|第十七次课-第五章第三节-数据的清洗与保存

2021下学期|第十八次课-第五章第四节-文本数据的可视化表达

2021下学期|第十九次课-第五章第五节-爬取天气数据

2021下学期|第二十次课-第五章第六节-数据可视化

2021下学期|第二十一次课-第六章第一节-认识人工智能

教学设计

教学课题:第五章第三节-数据的清洗与保存

教学目标:

  1. 讲解BueatifulSoup库的安装

  2. 讲解BueatifulSoup清洗数据代码

  3. 将上节课爬取的小说源代码中的小说清洗并保存

教学重点:讲解BueatifulSoup清洗数据代码

教学难点:将上节课爬取的小说源代码中的小说清洗并保存

教学课时:40分钟1课时

教学课件



    导入,一边等学生到齐,一边给学生播放视频介绍数据清洗与分析的意义。然后引入上堂课的教学内容进行复习,进而引出数据清洗学习的必要性。


    发放学案资料,让学生先安装库文件。由于网络的原因安装库文件需要一定的时间,提前安装是最好的选择。


    这是在MOOC上录屏的嵩天老师的课,介绍BeautifulSoup库的视频。先播放,让学生对BeautifulSoup库有一个初步的了解。


    播放完视频后,继续讲解BeautifulSoup库的用法,同时引导学生体验BeautifulSoup库编程清洗数据的代码,在上堂课的代码基础上补充代码,查看数据的清洗效果。


    引导学生打开网页的原文件,并查找标签title下的文本,是否跟清洗的数据完全一致,初步体验BeautifulSoup库在清洗数据中的强大功能。


    然后输出一个p标签的内容,引出认知冲突,从而引出select()函数的必要性,清洗多个相同标签内的文本内容。


    复习列表的内容,select()选出的文本保存在列表中。通过不断反复的学习列表,复习第四章学过的教学内容。同时提醒学生利用自己上堂课下载的网址,来清洗自己的小说,并提交作业。


    分享学生作品,并评价总结。有时间就尽量多看几个学生的作品,体验分享交流的快乐以及成功的喜悦。

教学反思

    本教学设计对去年的内容进行了大量的修改,当然是变得更简单了,因为去年的作业达成率没有达到我的期望,再加上豆瓣在上课的过程中出现将我们当“黑客”禁止爬取现象,所以今年开始进行了大改,改成了各自爬取小说,同时将难度降低了。

    第十六次课学生对爬取的小说非常感兴趣,并且有学生很开心地说:“这个真的太实用了!”不少学生喜欢在课堂上看小说,而有些小说甚至禁止复制,但是却可以爬取下来,学生的兴趣在第十六次课已经被激发了,所以本堂课趁热打铁,直接教学生清洗小说,这样跟学生的学习需求也息息相关,又在上一堂课的基础上进行迭代加深,所以上课效果还不错。

    我好像对学生太“实诚”了?

    越上到后面,越发现爬取纯文本数据的应用价值其实还蛮大的。然后自己也积累了一些应用价值方面的感悟:不仅仅是看小说的需要,还有做研究性学习收集资料,还有对网上的评论的收集等等……应用这个基础爬虫知识就可以完成。

    由于有些老师嫌弃百度网盘下载限流,所以增加了阿里云盘分享,两个云盘都放了下载文件,均可免费下载。

百度网盘下载地址:链接:https://pan.baidu.com/s/1RxnMzvp6o8IWhv-4k-usxw提取码:1111阿里云盘下载地址:链接:https://www.aliyundrive.com/s/CLSYNuuySCs
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存