2021下学期|第十六次课-第五章第二节-数据的采集(加上课注释)
株洲市二中高中信息技术必修一《数据与计算》集体备课资源(2020年下学期)
必修2《信息系统与社会》株洲市二中集体备课资源(2020年下学期)
海龟绘图在线编程网址:https://wood.codemao.cn
2021下学期|第五次课-海龟绘图设计LOGO(加上课注释)
2021下学期|第六次课-海龟绘图自由创作(2115班作品)
--第六次课-2112班作品展示 --第六次课-2113班作品展示 --第六次课-2116班作品展示--第六次课-2117班作品展示
--第六次课-2118班作品展示 --第六次课-2119班作品展示 --第六次课-2120班作品展示
2021下学期|第七次课-我的生涯规划-顺序结构(加上课注释)
2021下学期|第八次课-我的生涯规划-顺序结构的应用(加上课注释)
2021下学期|第九次课-我的生涯规划-选择结构(加上课注释)
2021下学期|第十次课-我的生涯规划-多重选择结构(加上课注释)
2021下学期|第十一次课-我的生涯规划-for循环结构(加上课注释)
2021下学期|第十二次课-我的生涯规划-while循环结构(加上课注释)
2021下学期|第十三次课-我的生涯规划-循环嵌套结构(加上课注释)
2021下学期|第十四次课-我的生涯规划-第四章复习总结(加上课注释)
2021下学期|第十五次课-第五章第一节-认识大数据(加上课注释)
2021下学期|第十五次课-第五章第一节-认识大数据(谢清华)
教学设计
教学课题:第五章第二节-数据的采集
教学目标:
讲解爬虫原理
体验数据爬取过程
应用爬虫技术爬取网页
教学重点:体验数据爬取过程
教学难点:应用爬虫技术爬取网页
教学课时:40分钟1课时
教学课件
这是正常导入,让学生初步了解爬虫。
系统每次启动都会还原,所以每个班上课前都要自己安装库文件,在讲解爬虫原理前先将代码发到学生桌面上,引导学生先将库文件安装了。
海龟编辑器安装库是目前我觉得最简单的软件之一,但是还是受学校网络的限制,会影响安装速度,提前让学生安装是最好的选择。
抖音找的视频,进行了截取及倍速处理,原视频是一节整课。这个内容自己讲很耗时还很难讲清楚,所以直接丢给了教学视频。
代码讲解,利用类比来讲解,教学视频里讲了请求与响应,在这里其实就是这两个的体现,用代码的形式表示出来了。
打开源代码,让学生进行比较,这里的网页源代码学生大部分是不晓得啥东西,直接反应就是这是乱码?所以我给学生解释了网页的标记语言,真正的网页设计也是编程,你们看到的是网页的“祖坟”,将整个网页的源代码都给你了,所以表示你将人家的“祖坟”都刨下来了。不认得不要紧,下节课我们会讲解如何从这些数据里清洗自己想要的数据。
解释响应代码、编码与源代码的程序表示,及相关概念。
让学生将taobao改为douban。让学生先体验douban返回的是408错误,然后再解释两个网站的robots协议。跟同学们讲解:淘宝是不用注明身份可以直接爬取,但是豆瓣需要注明身份。用类比的方式可以让学生更容易理解。
这张改得比较多,是因为我发现很多网站返回的编码是不一致的。而返回的编码也是导致乱码出现的主要原因,特意跟学生解释了编码解码,以及中文编码的两种主要方式:utf-8与gbk,这是本堂课的真正的难点,问问题也是问得最多的。
展示学生的作品提交情况,并展示学生作品,有针对性的解决问题。
教学反思
本教学设计是在去年的基础上稍微修改而成了,只是在抖音找了两个视频,一个为导入,一个为内容讲解视频,稍微进行了处理,截取了其中的教学内容相关的一段作为演示。
学生的整体兴趣还是非常高的,能够完成爬取数据的学生占到90%上下。但是在乱码处理上大部分学生很难理解,这是由于编程基础比较弱,也是可以理解的,所以问乱码处理的问题的学生特别多,这个难点我用的是直接提供代码解决的,所以耗时并不多。但是学生要真正理解还需要时间。
本堂课的教学内容也是下一节课的基础,我们的教学设计习惯是,能够前后连贯的尽量连贯起来,通过反复的迭代优化让学生螺旋式的掌握知识,并了解知识之间的关联关系。实际上第五章的编程知识也是在第四章的程序知识上的应用,通过第五章的学习,也能让学生更加意识到第四章学习编程的重要性。
由于有些老师嫌弃百度网盘下载限流,所以增加了阿里云盘分享,两个云盘都放了下载文件,均可免费下载。
百度网盘下载地址:
链接:https://pan.baidu.com/s/1RxnMzvp6o8IWhv-4k-usxw
提取码:1111
阿里云盘下载地址:
链接:https://www.aliyundrive.com/s/CLSYNuuySCs