数据管道

其他

解一下TMD几道热门数据分析面试题。

ntile将每个用户和对应的支付金额分成5组(这样每组就有1/5),取分组排名第一的用户组即前支付金额在前20%的用户。(注意这里是求前20%的用户而不是求支付排在前20的用户)
2019年8月28日
其他

AB test | 数据分析师面试必知 !

test,具体做法是在全量中抽样出两份小流量,分别走新推荐策略分支和旧推荐策略分支,通过对比这两份流量下的指标(这里按用户点击衡量)的差异,可以评估出新策略的优劣,进而决定新策略是否全适合全流量。
2019年8月13日
其他

现在的计算机专业已经沦为调包专业了吗?

前京东底层数据打工人,现字节跳动不知名分析师。专注于数据分析、Python、ML、DL等知识圈。定期分享Python数据科学系列、分析报告系列、趣味产品系列等免费资源。
2019年8月12日
其他

数据科学精简版PDF,助力复盘你的DS知识圈!

前京东底层数据打工人,现字节跳动不知名分析师。专注于数据分析、Python、ML、DL等知识圈。定期分享Python数据科学系列、分析报告系列、趣味产品系列等免费资源。
2019年8月11日
其他

做了点SQL题。

说实话,我真没刷过题,上上周群里有朋友问了一道sql题,那种难度级别已经够你面任何一家公司了。所以,没做出来也很正常,我之所以会做也只是因为用的多而已。再套路一点的问题无非就是,"为什么hive
2019年7月2日
其他

一边吃粽子,一边思考流量数据分析!

举个栗子:如果京东内部运营人员想看一下如下图“粽情端午节”这个活动的效果,研发人员可以通过在下图红色箭头所指地方“埋点”,当用户点击这一栏的时候,后台将会触发并上报这样一条用户点击行为数据。
2019年6月8日
其他

用户画像。

导读:关于用户画像的技术分享,分享给有需要的小伙伴,这里给的部分案例并非本人的作品,来自于其它优秀的公司和前辈,大部分来自于他们的技术分享及网络图片,如果不妥欢迎批评指正。
2019年4月27日
其他

数据分析招聘要求:熟练SQL!| 精简版复习大纲送给大家!

前京东底层数据打工人,现字节跳动不知名分析师。专注于数据分析、Python、ML、DL等知识圈。定期分享Python数据科学系列、分析报告系列、趣味产品系列等免费资源。
2019年3月25日
其他

数据分析只需要看懂一张图,附下载链接!

前京东底层数据打工人,现字节跳动不知名分析师。专注于数据分析、Python、ML、DL等知识圈。定期分享Python数据科学系列、分析报告系列、趣味产品系列等免费资源。
2019年3月11日
其他

Python VS R,你会选择谁呢?

2.6、两种语言在数据分析领域的相关量化数据对比向上滑动,查看第三部分对比图第三部分对比内容:3、R和Python的相互阐述优点3.1、第一回合R:我图形功能强大。
2019年2月26日
其他

这些祝福和干货比那几块钱的红包重要的多!

后记:三十晚上边看春晚,边写公号(大概吃饱了想消化一下)。愿爱德宝器今年可以写很多干货、资源(本节代码在群资料)。不行了,老头子开始在催了,不多比比。创作不易,喜欢的朋友点个好看安排一下。
2019年2月4日
其他

面试必备之Python深、浅拷贝。

聊Python的浅拷贝深拷贝问题之前,先举一个例子:现在你有一份家族名字的列表,你家里人想让你们加入Ed家族但是要保证之前的家族名字列表保持不变,你可能会写一个Python程序如下如:你发现你确实使得家族名字前面都加上了“Ed”,但与此同时你把原始的家族名字列表也给修改了,这是什么问题导致的呢?下面请看。变量、引用、对象开场白:在Python中,有一句话:“一切皆为对象,一切皆为对象的引用“,所以
2019年1月31日
其他

你会用Python做数据预处理吗?

异常值是数据集中偏离大部分数据的数据。从数据值上表现为:数据集中与平均值的偏差超过两倍标准差的数据,其中与平均值的偏差超过三倍标准差的数据(3σ原则),称为高度异常的异常值。
2019年1月24日
自由知乎 自由微博
其他

你愿意花十分钟系统了解数据分析方法吗?

理论介绍:分布分析是用来解释数据的分布类型和分布特征,显示其分布情况。所以可以对一开始拿到数据可以首先进行初步的分布分析。分布分析主要分成两种:①对定量的数据进行分布分析②对定性的数据进行分布分析。
2019年1月23日