原创:白杨 全文2791字 预计阅读5分钟
前言:这是白杨SEO公众号原创第149篇。今天是3月最后一天了,所以分享这篇文章,让大家思考一下,建议看到文尾,欢迎留言。
我们在对比人工手动与机器自动谁更靠谱之前,我们先说说数据挖掘与信息收集分析这两个事儿,好吧。
想象一下,你什么时候需要挖掘数据?你最近一次去寻找数据是什么时候?在做SEO或者推广中,你用到过数据挖掘吗?做运营或者市场分析也会用到吗?如果你回答是,那么请继续往下看。比如拿白杨SEO自己来说,我写公众号文章都会用到数据挖掘。为什么?因为我写作需要【主题】。主题是什么?就是一篇文章要写的中心思想,比如本文,主题就是数据挖掘重要性,如果关键词就是数据挖掘与收集。
那么,你可能会问,白杨SEO,你的主题是如何进行数据挖掘的呢?那我这里分享三点给你:比如白杨SEO的谷歌书签栏里有各大排行榜,比如百度风云榜、知乎热榜、微博热榜、搜狗热榜、新榜热门文章排名,还有各大搜索引擎,如百度、360、搜狗、微博搜索、头条搜索、微信搜一搜、淘宝搜索等。
甚至还有我关注的SEO、流量、运营、科技相关的网站。如图。为什么收集这些,很多人不知道,你写作的思路也许就在这里。比如百度风云热搜榜就有最近一天,最近七天热搜排名关键词。比如知乎,就有最近热搜问答,再比如打开微信搜一搜也能看到最近热词。
每一个关键词背后都是需求。不知道你明白这句话不?比如我抛一个问题,“如何”与“怎样”两个关键词,你觉得哪个指数大?公众号留言给我。
再比如,我之前朋友圈发过,如果你不知道搜索引擎背后的流量,你可以打开手机百度,你只需要输入类似“20岁”、“30岁”“40岁”都会提示不同的需求。再比如,你把副业两个字,放到知乎里,你能找到很多副业项目。
如果上面1、2点你都做了,比如像白杨SEO本篇文章主题一样,确定是数据挖掘与收集,那么,你就可以验证是否是真需求了。
先从流量验证,如果你有百度竞价后台,关键词规划师工具打开,放入数据挖掘,或信息收集看流量如何。如果没有,可能用5118、爱站之类的工具来看。比如我之前写过这篇实操举例:
其次从用户需求验证,去微信搜索、知乎、百度知道里,放入关键词,看有没有人提问,嗯找到提问的共性,那么这就是用户需求!
我们再说一下信息收集分析。为什么先说数据挖掘再说收集呢?因为只有先挖掘出来,然后才有信息收集整理进行分析。
信息收集过来存储也有很多种方式,不过白杨SEO最喜欢还是用EXCEL表格,因为这样处理方便。可能对于技术的朋友来说,应该是他们喜欢的格式。比如最近火热的Python,但没基础学会它不简单哈哈哈。
关于数据分析这块,我觉得如果你想往这方面发展,白杨SEO给你两个建议:一是你得见过好的数据分析案例,你得见过有大量数据分析需求,二是你得实操。这个数据分析能力是需要不断在实战中提升的。
讲个真实故事。2016年7月,我受公司委派去湖北联通公司做SEO营销顾问,第一次接触到大量数据,我们合作团队一个同事那处理数据真的强,比如数据引用,数据透视表,还有函数。感觉比别人用技术代码处理都快。
你也许会说,我又不会遇到。一般人如果想往高处走,这些基础技能可能会让你事半功倍,信么?
说明下,这里的前提是数据挖掘与信息收信及分析处理。这里的机器,主要指的是“爬虫”。爬虫是什么东东,是搜索引擎那个蜘蛛么,原则可以这么理解。不过这里指的是技术人员写的采集某网站的规则的一串代码。
比如大家做SEO写内容都听说过【火车头】采集工具吧。再比如5118站长工具,这些工具来的数据就是爬虫采集。对,你要学会写采集规则。
问题来了,到底是用人工来挖掘收集更好还是用爬虫呢?白杨SEO以前一直是人工派,就是那种所谓要眼见为实,或者理解为保守派。比如2013年帮公司开淘宝店时,为了写标题找关键词,还有看排名,都是手动一个一个找。
比如现在写文章,或者去找蓝海市场都会手动人工,确实很花时间。为什么我说我写文章一般2-4小时,因为至少有一小时要花在找主题确定及素材上面啊。
虽然我是人工保守派,但我也不是否定技术流。比如在白杨SEO付费星球我就邀请了Python数据采集大牛明白老师做嘉宾,如下图。再来说说机器爬虫数据采集的能力。去年白杨SEO实战培训第二期来了一个大学专业是学Python的同学伯劲,那是我第一次知道这个东东。有一次,我记得是阿波跟我说,他说我的公众号被朋友全部采集了,但并未对外,他们说只是用于他们内部学习,我第一次感觉很神奇。所以特意邀请了伯劲做了个入门分享。知道了后羿采集器以及Webscraper。后面才知道,原来明白老师已经开了一堂课叫《不用写代码的爬虫课》,里面正好讲了webscraper,而且写了好多采集模板,恰好他也在我的星球里。
数据挖掘与信息收集分析,人工还是爬虫谁更靠谱,其实是我故意抛出的问题。其实你心里应该也知道,二者是缺一不可!就算爬虫,那个逻辑规则如果没有人写,不可能找到想要的。
如果只是人工呢,有时真的太慢了。你可以现在网上随便搜一搜会数据挖掘工具的工作工资待遇就知道了。嘿,写到这里,你是不是想问:白杨,你是不是想推Python课啊?真不是,哈哈哈。讲真,入门容易想精难,实话。但是呢,我倒是推荐一下,不用写代码、学爬虫也能做数据挖掘的课给你。对,你没想错,就是明白老师又重新打磨一年半的《21堂学会信息收集课》。啥,明白是谁?和我一样,不太出名(偷笑),不过在技术圈挺出名的。不用写爬虫那个第一课,听说卖出近2000份!偷偷说下,我已经看完了课程了。前期思路很棒,中后期需要爱好学习。当然如果你想偷懒,他已经写了300多个抓取实操爬虫案例模板,比如抓知乎热门回答,抓取QQ群成员、抓取头条搜索结果等等。
本课程已于昨天正式推出,4.1号前原价299的课,现在只要199!对,你没看错,你看到这条信息的时候,只剩半天了!因为我觉得你可能需要,所以推荐给你。
当然声明说一下,如果你没有时间去学习看,也没有想用数据挖掘就不要买了,自己考虑清楚哈。最后最后,白杨SEO也推荐下自己的付费星球,因为今天是月底,3月的60元优惠券即将过期,后续应该没有这么大优惠了。
目前星球人数430+,嘉宾12位(与流量相关各行专家,明白老师也在)连续9周在整个付费星球每周内容更新超过90%星球,白杨SEO,专注SEO研究十年,SEO实战派。个人微信:baiyang2047 对新媒体精准引流有深入研究。前杰恩西运营总监(COO),现自由职业。