查看原文
其他

做了点SQL题。

爱德宝器 数据管道 2021-08-09

经常看数据管道的朋友应该知道近2个月几乎没有写原创,大部分是转载,发文时间也没个定数,而且有时候还不发文,以前每周末记录的仪式感也没了。


为什么?


公众号于我初心是记录与输出而后逼着自己输入,但当广告主一再的问是否可以合作,我还是会心动,虽然从没接过一次广告,但我也会同意加好友然后把广告推给一些朋友去接,心里的小九九无非就是等我想变现的时候,不差资源。


这样的我不是我想要的,会让我变得很着急,走的太快而迷失自己,我该停下想想了。


好的,我也不知道写了些啥,还是写点对大家有作用的东西吧。这两天私信讨论问题的朋友挺多的,我也都回复了,响应其中一个读者的朋友的要求。


“请问有SQL或者数据分析的面试题吗?”


说实话,我真没刷过题,上上周群里有朋友问了一道sql题,那种难度级别已经够你面任何一家公司了。所以,没做出来也很正常,我之所以会做也只是因为用的多而已。再套路一点的问题无非就是,"为什么hive select count distinct 查询的reduce一直卡在99%,这可能是什么原因导致的,你有什么解决方法"。


这里强调一下,不是说你做出来了这些题,SQL很熟练大厂就会要你,今年的分析师岗位不太好找,如果你还是一直在努力爬虫、熟练Python、为了分析而分析的阶段,建议去找爬虫工程师或者Python开发,不会有一家大厂要你做分析师的。


因为,你一开始就错了,Python是Python,分析是分析,请真的不要把Python和数据分析画上等号。对分析师来说,熟知业务的重要性远比你会一两个工具重要,而论重要性,SQL的重要性比Python重要的多(这里不是让你不去学Python哈,宝器每天也还是要写写Python的)。再配一张有趣的图:



很多在学校的朋友会觉得算法工程师巨厉害,上手就是达模型,这么说吧,差不多算法工程师的实习工作大部分时间就是写SQL(CV那一块的不太了解,如果说错了,还请不要diss)。为什么要你写SQL,因为你连特征工程都做不好,就别扯回归、分类这些东西了。


就好像做推荐的朋友第一步需要把用户画像建好,而画像核心就是各类分层标签,埋点上报再到数仓的数据是明细表,明细表的数据不会给你做好这些标签的,所以第一步你就是需要用SQL把各类标签表做出来,而后在定用户画像。


好了,言归正传。今天做了一下sql zoo上面的题,还算有趣的一个做题网站。大致几部分内容:基础、关联子查询、聚合函数、JOIN等等,不算太难。



 比较有趣的是,每次你提交代码对了会给你一个笑脸,如下:


每做完一个章节的题,还附带一个选择题小测验,不错的一个功能~


附上网址,点阅读原文也可访问:

https://sqlzoo.net/


另外,已将全部章节的可以运行成功的答案记录下来,篇幅太大,不全部展示了,一会丢到群里:



总结:

本文不知道写了些什么,希望对你有点帮助。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存