查看原文
其他

爬虫俱乐部的精彩答疑之换行问题

爬虫俱乐部 Stata and Python数据分析 2023-01-01

本文作者:张   迪,中南财经政法大学金融学院

本文编辑:陈志林

技术总编:方一卓


Stata&Python云端课程来啦!

      好消息好消息,爬虫俱乐部开辟小鹅通战场!!爬虫俱乐部隆重推出小鹅通网络课程,将Stata基础课程Stata进阶课程Python课程都上传至小鹅通平台,欢迎大家多多支持订阅!报名课程即可加入答疑群,对报名有任何疑问欢迎在公众号后台留言哦。如需了解详情,可以通过课程链(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或课程二维码进行访问哦~



1.引言



在炎炎的夏日里,新一期的 Stata 课程学习在如火如荼地进行中,纵使暑期持续高温,但是丝毫无法阻挡同学们的学习热情,同学们学习热情高涨,时不时提出自己在操作中遇到的难题,我们爬虫俱乐部答疑团队都在第一时间给出了详细解答,同学们得到解惑,纷纷感慨学习效率提高。

在这里,有李春涛教授授业解惑、网课老师薛原解答指导、专职答疑老师实时解答和同学们相互学习指正;在这里,我们为同学们提供相互学习和交流的优秀网课平台,专业、强大、负责、高效和细致入微的答疑服务,更有授课老师每天安排Office hour进行一对一解惑。







2.答疑案例分享


这位同学在学完爬虫的基本课程之后,在练习中出现了问题。他在爬取百度首页源代码时出现了问题,结果窗口报错以致无法成功抓取网页源代码。
  接下来我们看一下解答这位同学的问题的精彩过程。
  首先,看一下这位同学的代码。
copy"www.baidu.com"text.txt,replace//抓取网页源代码

查看该同学的代码截图,我们发现他的代码书写出现了换行问题。

根据 copy 命令的语法结构 copy filename1 filename2 [, options] ,copy 和网址、要保存为的文件名应该同属于一条完整的命令。而这位同学将其分为了三行,且没有换行符号表示连接。
  基于此我们团队答疑负责人及时指出了问题所在,并给出了解答方案和关于换行问题的详细学习资料。



这位同学在我们的帮助下修改了他的代码,但是运行时又遇到了问题。


乍一看这位同学修改后的代码仿佛没有问题,我们答疑负责人准确抓住了其间存在另外两个问题:

  • (1)网址内容不完整。
      通过 
    help copy 查看帮助文件,我们发现 filename1 可以为 URL 或者是文件名。而完整的 URL 语法结构为 protocol :// hostname[:port] / path / [;parameters][?query]#fragment,其中, protocol 指定使用的传输协议,最常用的是HTTP协议。
      而这位同学的 URL 为 
    www.baidu.com,缺少了关于协议部分和 ://
  • (2)注释符号 // 与代码之间至少需要一个空格。
      针对上述问题,我们给出了参考代码:
copy "http://www.baidu.com" text.txt,replace //抓取网页源代码

对此,我们给出了详细解释说明和建议,建议最好是复制粘贴网址,这样不容易出错,且便捷。




以上就是本次分享的精彩答疑案例了,希望我们挑选出的案例对大家有所启发和帮助。
  本课程中,我们配备了两位日常答疑老师,学员遇到的问题,可以在群里直接提出疑问,每天提供全天候的在线答疑服,此外还有授课老师每天安排 Office hour进行一对一答疑解惑
  最后,欢迎大家报名参与我们的 Stata 课程学习,爬虫俱乐部将为您提供的零基础、无障碍的Stata数据分析和网络爬虫课程,更重要的是,讲得好不如答疑答的好! 我们高效、强大、负责的答疑团队,将为您提供认真负责,细致入微的答疑服务。在这里,您的学习效率和效果将成倍提升,一站式购买,无后顾之忧





最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。


对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!





往期推文推荐

爬虫俱乐部的精彩答疑--路径设置乱码怎么破?

爬虫俱乐部的精彩答疑--putdocx的二三事

爬虫俱乐部精彩答疑之Python篇

爬虫俱乐部的精彩答疑--花式重命名变量

      今天你还是“刘畊宏女孩”吗?

爬虫俱乐部在山东财经大学金融学院暑期Stata网课上的精彩答疑

JupyterNotebook——如何更换默认文档目录

Stata绘图系列——玩转绘图通用选项(一)

出人意料!这所大学的A级学科总数竟超越清华北大!

Stata数据读入——打开方式不同?

数据类型——Dict、Set与Frozenset简析

Stata小贴士之外部命令安装路径

有一种夏天叫做宫崎骏的夏天

换装术|多个Excel文件如何一键转为dta格式

【基础篇】Python可变对象与不可变对象

Stata绘图系列——细节掌控绘图区域!

 4月A股的收官战之概念板块哪家强?

解放双手!你必须要会的两个命令—inlist & inlist2

【基础篇】字符串之判断方法

Stata绘图系列——让你的直方图随心所欲

关于我们 


   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里
为作者署名,并有赏金分成。

2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众
号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存