查看原文
其他

2021下学期|第十六次课-第五章第二节-数据的采集(加上课注释)

株洲市二中信息组 信息科技时代 2024-03-15

株洲市二中高中信息技术必修一《数据与计算》集体备课资源(2020年下学期)

必修2《信息系统与社会》株洲市二中集体备课资源(2020年下学期)

高中信息技术粤教版必修1习题集

海龟绘图在线编程网址:https://wood.codemao.cn


2021下学期|第一次课-数据与信息(加上课注释)

2021下学期|第二次课-知识与智慧(加上课注释)

2021下学期|第三次课-算法及其描述(加上课注释)

2021下学期|第四次课-程序设计语言(加上课注释)

2021下学期|第五次课-海龟绘图设计LOGO(加上课注释)

2021下学期|第六次课-海龟绘图自由创作(2115班作品)

    --第六次课-2111班作品展示

    --第六次课-2112班作品展示    --第六次课-2113班作品展示    --第六次课-2116班作品展示
    --第六次课-2117班作品展示
    --第六次课-2118班作品展示    --第六次课-2119班作品展示    --第六次课-2120班作品展示

2021下学期|第七次课-我的生涯规划-顺序结构(加上课注释)

2021下学期|第八次课-我的生涯规划-顺序结构的应用(加上课注释)

2021下学期|第九次课-我的生涯规划-选择结构(加上课注释)

2021下学期|第十次课-我的生涯规划-多重选择结构(加上课注释)

2021下学期|第十一次课-我的生涯规划-for循环结构(加上课注释)

2021下学期|第十二次课-我的生涯规划-while循环结构(加上课注释)

2021下学期|第十三次课-我的生涯规划-循环嵌套结构(加上课注释)

    --2112黄艺馨的第四章文理科测试程序代码

2021下学期|第十四次课-我的生涯规划-第四章复习总结(加上课注释)

    --第四章已经学完,看看2115班孩子们的心声

2021下学期|第十五次课-第五章第一节-认识大数据(加上课注释)

2021下学期|第十五次课-第五章第一节-认识大数据(谢清华)

2021下学期|第十六次课-第五章第二节-数据的采集

2021下学期|第十七次课-第五章第三节-数据的清洗与保存

2021下学期|第十八次课-第五章第四节-文本数据的可视化表达

2021下学期|第十九次课-第五章第五节-爬取天气数据

2021下学期|第二十次课-第五章第六节-数据可视化

教学设计

教学课题:第五章第二节-数据的采集

教学目标:

  1. 讲解爬虫原理

  2. 体验数据爬取过程

  3. 应用爬虫技术爬取网页

教学重点:体验数据爬取过程

教学难点:应用爬虫技术爬取网页

教学课时:40分钟1课时

教学课件

    这是正常导入,让学生初步了解爬虫。


    系统每次启动都会还原,所以每个班上课前都要自己安装库文件,在讲解爬虫原理前先将代码发到学生桌面上,引导学生先将库文件安装了。

    海龟编辑器安装库是目前我觉得最简单的软件之一,但是还是受学校网络的限制,会影响安装速度,提前让学生安装是最好的选择。


    抖音找的视频,进行了截取及倍速处理,原视频是一节整课。这个内容自己讲很耗时还很难讲清楚,所以直接丢给了教学视频。


    代码讲解,利用类比来讲解,教学视频里讲了请求与响应,在这里其实就是这两个的体现,用代码的形式表示出来了。


    打开源代码,让学生进行比较,这里的网页源代码学生大部分是不晓得啥东西,直接反应就是这是乱码?所以我给学生解释了网页的标记语言,真正的网页设计也是编程,你们看到的是网页的“祖坟”,将整个网页的源代码都给你了,所以表示你将人家的“祖坟”都刨下来了。不认得不要紧,下节课我们会讲解如何从这些数据里清洗自己想要的数据。



    解释响应代码、编码与源代码的程序表示,及相关概念。


    让学生将taobao改为douban。让学生先体验douban返回的是408错误,然后再解释两个网站的robots协议。跟同学们讲解:淘宝是不用注明身份可以直接爬取,但是豆瓣需要注明身份。用类比的方式可以让学生更容易理解。


    这张改得比较多,是因为我发现很多网站返回的编码是不一致的。而返回的编码也是导致乱码出现的主要原因,特意跟学生解释了编码解码,以及中文编码的两种主要方式:utf-8与gbk,这是本堂课的真正的难点,问问题也是问得最多的。


    展示学生的作品提交情况,并展示学生作品,有针对性的解决问题。


教学反思

    本教学设计是在去年的基础上稍微修改而成了,只是在抖音找了两个视频,一个为导入,一个为内容讲解视频,稍微进行了处理,截取了其中的教学内容相关的一段作为演示。

    学生的整体兴趣还是非常高的,能够完成爬取数据的学生占到90%上下。但是在乱码处理上大部分学生很难理解,这是由于编程基础比较弱,也是可以理解的,所以问乱码处理的问题的学生特别多,这个难点我用的是直接提供代码解决的,所以耗时并不多。但是学生要真正理解还需要时间。

    本堂课的教学内容也是下一节课的基础,我们的教学设计习惯是,能够前后连贯的尽量连贯起来,通过反复的迭代优化让学生螺旋式的掌握知识,并了解知识之间的关联关系。实际上第五章的编程知识也是在第四章的程序知识上的应用,通过第五章的学习,也能让学生更加意识到第四章学习编程的重要性。

    由于有些老师嫌弃百度网盘下载限流,所以增加了阿里云盘分享,两个云盘都放了下载文件,均可免费下载。

百度网盘下载地址:链接:https://pan.baidu.com/s/1RxnMzvp6o8IWhv-4k-usxw提取码:1111阿里云盘下载地址:链接:https://www.aliyundrive.com/s/CLSYNuuySCs
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存