2021下学期|第十九次课-第五章第五节-爬取结构化表格数据(加上课注释)
株洲市二中高中信息技术必修一《数据与计算》集体备课资源(2020年下学期)
必修2《信息系统与社会》株洲市二中集体备课资源(2020年下学期)
海龟绘图在线编程网址:https://wood.codemao.cn
2021下学期|第五次课-海龟绘图设计LOGO(加上课注释)
2021下学期|第六次课-海龟绘图自由创作(2115班作品)
--第六次课-2112班作品展示 --第六次课-2113班作品展示 --第六次课-2116班作品展示--第六次课-2117班作品展示
--第六次课-2118班作品展示 --第六次课-2119班作品展示 --第六次课-2120班作品展示
2021下学期|第七次课-我的生涯规划-顺序结构(加上课注释)
2021下学期|第八次课-我的生涯规划-顺序结构的应用(加上课注释)
2021下学期|第九次课-我的生涯规划-选择结构(加上课注释)
2021下学期|第十次课-我的生涯规划-多重选择结构(加上课注释)
2021下学期|第十一次课-我的生涯规划-for循环结构(加上课注释)
2021下学期|第十二次课-我的生涯规划-while循环结构(加上课注释)
2021下学期|第十三次课-我的生涯规划-循环嵌套结构(加上课注释)
2021下学期|第十四次课-我的生涯规划-第四章复习总结(加上课注释)
2021下学期|第十五次课-第五章第一节-认识大数据(加上课注释)
2021下学期|第十五次课-第五章第一节-认识大数据(谢清华)
2021下学期|第十六次课-第五章第二节-数据的采集(加上课注释)
2021下学期|第十七次课-第五章第三节-数据的清洗与保存(加上课注释)
2021下学期|第十八次课-第五章第四节-文本数据的可视化表达
教学设计
教学课题:第五章第五节-爬取结构化表格数据
教学目标:
动手安装相关库文件并学会select()函数的使用
利用代码爬取天气数据
修改代码爬取自定义表格数据
教学重点:利用代码爬取天气数据
教学难点:修改代码爬取自定义表格数据
教学课时:40分钟1课时
教学过程
原视频卡在PPT里,我嫌弄下来比较麻烦,所以网上找了一个介绍结构化数据的视频。作为导入引入新课。
这个库不需要安装,海龟编辑器已经安装好了。
引导学生打开网页源代码,一定要学生打开自己学会看网页源代码。
只要给学生时间,学生能够回答出来第六行代码应该填哪一个。毕竟前面已经学过爬取小说,讲过一些标签如title、p、div等。所以在这个网页源代码里,只要教师引导到位,学生能够回答出td以及tr标签。
在这里,我加入了一行代码:print(t),在接下来要填空的四行代码前面,加入这行代码的作用是,填好tr后运行,第一行列表数据会在运行后显示出来。然后引导学生查看列表数据的定义,通过查看输出数据,接下来四个空都可以填出来。
第一个空填日期,学生能够回答出来填t[0],第二空引导学生填写t[1]+t[2],也非常容易,学生可以回答出来,第三四空也可以想得到。
打开保存的CSV文件,即可查看保存下来的数据。然后试图插入图表,会引起认知冲突,发现摄氏度符号要去掉,引出replace知识,补充完善代码。
完成后,学生还剩下不少时间,所以引导学生爬取人均GDP表格数据或自行爬取自定义表格数据。
学生的兴致很高,这里就是学以致用。
特别提示:df.to_csv('人均GDP排名.csv',index=0)要改为df.to_csv('人均GDP排名.csv',index=0,encoding='utf-8'),否则第二十次课做图表的时候会出现读入数据错误。
作品提交与展示。
教学反思
本教学设计依然是建立在前面的非结构化数据的基础之上的提升。之前爬取的是小说这种非结构化数据,所以这一次爬取的是结构化表格数据。
昨天还有老师在问我粤教版教材第五章里的聚类、特征探索等算法怎么上,我刚拿到这本教材的时候的感觉是第四章刚学会走,第五章就开飞机了,这前后的编程基础、思维跳跃都衔接不上。我们也是经过两年摸索,在之前第四章的基础上一步步迭代更新,在学生的认知基础上逐步推进才改成今年的这个授课内容。
一个算法纯粹讲理论,学生既理解不了也实现不了,本身没有多大的意义,因为思维层次跟不上。就像有人批评让小孩子背唐诗宋词一样,就是死记硬背。我娃现在读一年级,上次老师要他背《悯农》,昨天背《风》,孩子都说背不下来。所以我就网上找到了教学视频,首先给他详解了这两首诗的意思,然后再一句句地理解联想才背完。
教学首先应该基于学生已有的知识基础,让学生跳一跳就能够得着最好。如果得死命蹦才能够得着,那么一大群学生就直接放弃了。每个班都可能会有人因为跟不上教学内容而放弃学习,但是一定要控制好放弃学生的比例在一个比较小的范围内。
学生作品展示:
由于有些老师嫌弃百度网盘下载限流,所以增加了阿里云盘分享,两个云盘都放了下载文件,均可免费下载。
百度网盘下载地址:
链接:https://pan.baidu.com/s/1RxnMzvp6o8IWhv-4k-usxw
提取码:1111
阿里云盘下载地址:
链接:https://www.aliyundrive.com/s/CLSYNuuySCs