中国如何缺席ChatGPT盛宴

最新库子,45亿地址信息泄漏

母子乱伦:和儿子做了,我该怎么办?

独家丨拿到ChatGPT版Bing搜索的内测后,我觉得所有大厂都该慌了。

民营离场论又变了:改扬弃论了

自由微信安卓APP发布,立即下载! | 提交文章网址

数据不吹牛

2020年小红书校招数据分析笔试题

今天给大家带来2020年小红书校招的数据分析笔试题的详解1、如果在小红书商城中某一商户给一产品定价,如果按照全网最低价500元定价,那么客人就一定会选择在此购买;价格每增加1元,客人的流失的可能性就会增加1%。那么该商户给客人报出最优价格为()A、520B、535C、550D、565答案:C解析:要求定价为多少时,利润能最大。设价格涨幅为x,利润为y,M为顾客数未知,但是一个固定值。求二元一次方程y=M(1-x/100)x的最大值。2、在一次集卡活动中,有5种不同的卡片以相同的概率出现,每分享一次笔记就可以得到一张卡片,集齐所有卡片所需点赞的笔记数量的期望,与以下哪个结果最为接近?()A、9B、11C、13D、15答案:B解析:考察多个几何分布的和。首先题目符合几何分布,独立试验->拿到一种卡片的概率相同->为了集齐卡片要进行多少次试验。对于几何分布,若其每次成功的概率为p,则期望为1/p.回到本题,有几种情况:假设这里面只有一种卡片,拿一次就拿齐了所有卡片,期望是1假设这里面有两种卡片,第一次肯定能拿到一种,那么,再拿多少次可以拿到剩下的那种呢,就又变成了一个几何分布,p
2020年10月23日

Pandas进阶,从0到100你还差这篇文章!

作者:youerning来源:51CTO博客大家好,我是小z~今天分享的这篇文章,是关于pandas的一个串讲,很适合查漏补缺。一、数据对象pandas主要有两种数据对象:Series、DataFrame注:
2020年10月6日

Python数据可视化教程实战!

0.1})大致可以看出:会员在工作日出行较多,节假日次数减少,而临时用户相反,第一季度出行人数总体偏低,出行人数受天气影响较大,会员在每天早晚有两个高峰期,对应上下班时间;非会员在下午出行较密集
2020年9月20日

文末送书 | 手把手教你玩转,Python 会交互的超强绘图库 Plotly!

里完成导入:单变量分布:柱状图和箱形图单变量分析图往往是开始数据分析时的标准做法,而柱状图基本上算是单变量分布分析时必备的图表之一(虽然它还有一些不足)。就拿博客文章点赞总数为例(原始数据见
2020年9月13日

取数,取数,取个屁啊!

大家好,我是小z每过一段时间,总是能听到群友吐槽:“我顶着数据分析师的title,但天天就是取数,取到爆炸!”“分析师难道就是取数吗?我想要接触更多有成就感的分析内容应该怎么做?”“取数,取个屁啊!”其实,取数和成就感并不完全冲突。当你掌握一个新的奇淫技巧(像Pandas),把原来Excel处理需要3个小时的数据,压缩到了3分钟,准确率还提升到100%。这个成就感,就像吃火锅辣到头皮发麻汗流浃背,来两口冒着冷气儿的冰镇雪碧,要多爽有多爽!只是技能提升所带来的成就感,来去匆匆,边际效益还递减的贼快。今天小z想聊的,是除了技能提升以外的成就感。来看一个实际的取数场景。第一种:蒙头就做型业务:帮我拉一下近3个月不同城市的销售额占比,这个需求很急!听到这个需求,一顿group
2020年9月3日

超硬核的 Python 数据可视化教程!

30.45)plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')plt.xlim([0,15])
2020年8月31日

「数据分析报告」思路提升超实用指南!

总结构,是最常见的结构,如果是对一个专题进行分析,用这种形式是非常好的,举个例子:某电商App近一个月内的销售额出现下滑,让你针对这个问题进行一次专题分析:①
2020年8月30日

我分析了b站10万条弹幕,发现了歪嘴战神的终极奥义!(文末重磅福利)

大家好,我是小z~天气太热,今天文末一次性送出5本很nice商业智能可视化书籍,给大家解解暑。最近,歪嘴战神血洗b站,靠着“耐克式微笑"成功出圈,迷倒众生。这次,小z爬取了10万条相关弹幕,从数据分析的角度,扒一扒歪嘴战神那该死的狷狂魅力。歪嘴战神
2020年8月15日

禁令之下,苹果和微信还能共存吗?

最近,川普以移动应用程序TikTok与微信对美国国家安全构成威胁为由,宣布45天后禁止与微信以及字节跳动进行任何交易,这意味着在没得到允许的情况下,美国企业不能与它们合作,此消息一出,也导致腾讯市值暴跌。
2020年8月11日

数据可视化 | 20行代码玩转象限图!

bottom=True)今天的案例先到这里,如果对案例代码和数据源感兴趣,后台回复“象限图”,即可获取文中完整数据和代码~●2020中国独角兽分析报告!●12000+字超详细
2020年8月9日

2020中国独角兽分析报告!(附榜单)

导读:独角兽企业代表着新经济的活力,行业的大趋势,国家的竞争力。2019年全球经济复苏动能减弱、融资环境趋紧,投资人为独角兽企业慷慨融资的时代已经结束。2020年新冠肺炎大流行,全球独角兽面临前所未有的生存压力,同时在线办公、新能源汽车、人工智能、医疗健康、新一代信息技术等领域异军突起,新基建带来新机遇。2020年独角兽榜单有哪些重大变化?透露出哪些科技趋势和投资机会?作者:任泽平
2020年8月8日

难倒81%数据分析师的面试题!

从网上整理了11道数据分析面试真题,供大家参考学习~注:其中第一题之前文章有涉及到过,现已做了修正统计学部分
2020年7月31日

Python实现常用的假设检验 !

开门见山。这篇文章,教大家用Python实现常用的假设检验!服从什么分布,就用什么区间估计方式,也就就用什么检验!比如:两个样本方差比服从F分布,区间估计就采用F分布计算临界值(从而得出置信区间),最终采用F检验。建设检验的基本步骤:前言假设检验用到的Python工具包Statsmodels是Python中,用于实现统计建模和计量经济学的工具包,主要包括描述统计、统计模型估计和统计推断Scipy是一个数学、科学和工程计算Python工具包,主要包括统计,优化,整合,线性代数等等与科学计算有关的包导入数据from
2020年7月27日

数据哪里找?200个源数据网站全给你!

导读:资料搜集是个相当繁琐与累的工作,也是数据分析入门的基本,良好的信息资料搜集能力有利于我们快速了解基本情况,为后续的调研及一手资料的获得打下较好的基础。作者:王术,发表于知乎来源:https://www.zhihu.com/question/22698541/answer/22367802部分内容来自网络01
2020年7月24日

淘宝广告数据分析实战!(附代码和100W数据源)

在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。本文为Rambo同学原创投稿,以项目分析的架构,从多维度展开分析。全文共4000+字,建议收藏。相关数据源和代码已经打包整理好,后台回复“广告数据“即可获取。P1
2020年7月23日

电影院要开门了,最受期待的电影是...

成年人的精神世界遭遇打击时,小朋友们也没了往年的快乐。原定于大年初一上映的《熊出没·狂野大陆》没能准时出现,连续六年的春节档动画电影冠军,今年也因为疫情没能和《姜子牙》来一次正面对线。
2020年7月18日

12000+字超详细 SQL 语法速成!

作者:静默虚空https://juejin.im/post/5c7e524af265da2d914db18f本文针对关系型数据库的一般语法。限于篇幅,本文侧重说明用法,不会展开讲解特性、原理。一、基本概念数据库术语数据库(database)
2020年7月13日

我的这份99页Pandas实战PDF,你收藏了吗?

大家好,我是小z说到python数据分析,pandas是绝对绕不开的一个神器。对于这个神器呢,我结合实践经验,用沙雕文风,花了N个月的时间,把pandas学习过程提炼成一个个深入浅出的案例。相关内容不仅在我的公众号“数据不吹牛”后台收到了非常多的正面反馈,在知乎上也有2100+点赞,6000+收藏量,含金量不用多说文档介绍最近,我把这些文章汇总成了这份99页的《用实战玩转Pandas数据分析》,作为读者福利分享给大家,在我的公众号《数据不吹牛》,后台回复“电子书”即可获取。注:文档已做过朋友和群内分享,有部分同学已经下载,安心食用就好,我会在公众号以月的周期对文档进行持续更新目前整个PDF分成4大章基础教程和4个数据分析实战案例。所有教程和实战案例均附带完整的实战数据源和代码,深入浅出,知行合一,还会持续更新版权声明本文档和对应源数据、代码主要用于学习交流,任何转载、传播需获得作者确认授权以及详细注明出处。且不得随意修改、篡改,更不可商用,若有违反,必将追究法律责任。最后最后再唠叨下,本文档相关数据源、代码以及案例,小z将在公众号持续更新,关注“数据不吹牛”,后台回复“电子书”,不再迷路。↓扫他关注↓感谢大家支持!干货整理不易,来个三连鼓励鼓励👇
2020年7月12日

心中无码便是高清,用“脑补”除马赛克!

训练的模型,数据集都是白人,因此算法「脑补」出的也都是白人脸。这在如今高喊「黑命贵」的美国,无疑是一股扎眼的“逆流”。有网友就拿奥巴马的低分辨率照片进行测试,结果生成的都是白人男性,更加坐实了
2020年7月11日

复购分析实战 | Pandas遇到了大难题..(附40000+数据源和代码)

大家好,我是小z~在电商等消费场景下,复购率是最耳熟能详的指标之一了。上到平台、下到品牌、店铺,各种复盘分析一定绕不开复购率,今天我们就从实战的角度聊聊复购率。本文是Pandas实战系列的番外篇,是小z特意总结的案例,对于pandas操作是一个很大的考验。食用建议:略硬略干,建议食用前先喝杯水初识复购率实际业务经常会遇到以下场景:“哈,我们的复购率同比/环比提升了XXX!”台下一片欣然..“哎,近XX时间复购率有明显下降趋势”Boss脸色变得难看...小z发现,复购率的讨论很容易陷入鸡同鸭讲,明面上都在说复购率,但实际连指标计算逻辑都是不同的:有留存角度的,A时间段购买人数,在其后B时间段重复购买人数占比有客户生命周期角度的,A时间段购买人数,在整个生命周期中,重复购买人数占比有截断角度的,A时间(这个时间一般比较长)段购买人数,在A时间段重复购买人数的占比还有自定义角度的....各种眼花缭乱的复购计算方法,及其延伸的复购分析体系,以后会详细展开讲解。这次,我们先以一种计算逻辑切入,搞清楚如何用Pandas计算客户复购率。复购率计算本文采用一种比较简单,但非常考验Pandas技巧的口径来定义(可能是一些同学用pandas遇到的最大挑战)复购率:一段时期内,购买两次及以上的客户占总人数的比重比如最近半年,有10000个客户购买我们的产品,在这半年内,有1000个客户重复购买(购买2次及以上),那半年期复购率就是1000
2020年7月9日

扒一扒最让人后悔的专业 ,你躺枪了吗?

朋友,虽然DT君学的不是设计,但被迫深夜修改一二三四五六七八稿的感觉是共通的。如果硬要说什么特殊的感觉,可能就是头顶比较凉快。这大概也方便我们以后重考一个佛学专业,从俗家弟子转正出家吧。
2020年7月7日

用Python玩连连看是什么效果?画面太美

作者:Laziji源自:https://laboo.top/2018/11/07/lianliankan/1、前言Python
2020年6月25日

3分钟画出酷炫动态地图的秘诀!

Map曲线救国。找了几个小伙伴做测试,发现个别打开没有这个功能,需要额外设置一下。左上角“文件”,然后左下方导航栏点击“选项”,再找到“加载项”:然后点击“转到”把Microsoft
2020年6月24日

老板让给方案排个序,我用层次分析法 !

缘起工作之中,老板经常像你发问,有三个方案A、B、C,你给它们排个序,我稍后开会要用?遇到这样的需求,我的第一反应就是给每个方案打个分,按照权重进行排序。这就是接下来重点论述的部分0X01
2020年6月22日

Python数分实战 | 玩转百万级游戏数据(附练手源数据)

今天分享的一个实战案例是关于游戏行业的,数据量级比较大,数据包含近229万条记录和109个字段,以下取较重要的字段进行说明。相关数据已经给大家打包好,感兴趣的同学后台回复“游戏数据”,即可获取完整数据集,做更多有趣探索分析。字段说明user_id:用户编码,用户唯一标识bd_stronghold_level:要塞等级,相当于游戏账号等级wood_reduce_value:木头消耗数量stone_reduce_value:石头消耗数量ivory_reduce_value:象牙消耗数量meat_reduce_value:肉消耗数量magic_reduce_value:魔法消耗数量general_acceleration_reduce_value:通用加速消耗数量building_acceleration_reduce_value:建筑加速消耗数量reaserch_acceleration_reduce_value:科研加速消耗数量training_acceleration_reduce_value:训练加速消耗数量treatment_acceleration_reduce_value:治疗加速消耗数量pvp_battle_count:玩家对玩家次数pve_battle_count:玩家对机器次数avg_online_minutes:日均在线时间pay_price
2020年6月21日

敲黑板,互联网数据指标大全!

作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识。一、常见指标先来看一看常见的一些数据指标们1、DAU:Daily
2020年6月20日

Python让你画的图会自己跳舞 !?

的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——FuncAnimation,可以让我们的静态图表动起来。FuncAnimation
2020年6月18日

13个Pandas实用技巧,有点香 !

原作:风控猎人归纳整理了一些工作中常用到的pandas使用技巧,方便更高效地实现数据分析。文章很短,不用收藏就能Get~1.计算变量缺失率df=pd.read_csv('titanic_train.csv')def
2020年6月16日

20000字干货笔记,一天搞定Mysql~

|+------+-------+--------+通过分析可以发现,只要把score表中的s_no字段值替换成student表中对应的name字段值就可以了,如何做呢?--
2020年6月11日

看腻了Python,高级分析师是怎么玩转Excel的?

添加趋势线,并且显示回归分析的公式和R平方值从图得知,R平方值=0.9995,趋势线趋同于一条直线,公式是:y=0.01028x-27.424R
2020年6月8日

微信号可以改了?我用Python发现了隐藏的6大秘密..

'被关注人数':[follwer_count],'创建时间':[created_time],'更新时间':[updated_time],'评论数':[comment_count],
2020年6月5日

数分面试题到底能不能面出真实水平​ ?

这些为什么是典型的问题呢?增速或者减速的程度超出或者跌出了预期,当预期与实际有差异时,大脑的第一反应,这就是问题,但这真是的问题吗?这里给大家思考几秒,再继续读下去
2020年6月3日

销量下降,到底应该怎么分析?!

数据分析里常用的五个统计学概念小z微信坑位限时开放后台回复“芝麻开门”即可捕捉号主本人“干货~”
2020年5月31日

我用3秒,画完了老板要求的30个折线图!

数据分析里常用的五个统计学概念小z微信坑位限时开放后台回复“芝麻开门”即可捕捉号主本人“秀啊!”
2020年5月28日

好看的 BI 大屏 Pyecharts 也可以做!

两个网站,以及一份它们的地理信息数据(源码和数据都在文末~):为了给去广州的游玩的人提供一些美食的参考,制作一个
2020年5月26日

机器学习万字实战宝典!

作者:吴晓晖转自:知乎注:未经原作者授权,严禁二次转载!不知道你有没有这样的感受,在刚刚入门机器学习的时候,我们一般都是从MNIST、CIFAR-10这一类知名公开数据集开始快速上手,复现别人的结果,但总觉得过于简单,给人的感觉太不真实。因为这些数据太“完美”了(干净的输入,均衡的类别,分布基本一致的测试集,还有大量现成的参考模型),要成为真正的数据科学家,光在这些数据集上跑模型却是远远不够的。而现实中你几乎不可能遇到这样的数据(现实数据往往有着残缺的输入,类别严重不均衡,分布不一致甚至随时变动的测试集,几乎没有可以参考的论文),这往往让刚进入工作的同学手忙脚乱,无所适从。Kaggle则提供了一个介于“完美”与真实之间的过渡,问题的定义基本良好,却夹着或多或少的难点,一般没有完全成熟的解决方案。在参赛过程中与论坛上的其他参赛者互动,能不断地获得启发,受益良多。即使对于一些学有所成的高手乃至大牛,参加Kaggle也常常会获得很多启发,与来着世界各地的队伍进行厮杀的刺激更让人欲罢不能。更重要的是,Kaggle是业界普遍承认的竞赛平台,能从Kaggle上的一些高质量竞赛获取好名次,是对自己实力极好的证明,还能给自己的履历添上光辉的一笔。如果能获得金牌,杀入奖金池,那更是名利兼收,再好不过。Kaggle适用于以下人群:我是小白,但是对数据科学充满求知欲。我想要历练自己的数据挖掘和机器学习技能,成为一名真正的数据科(lao)学(si)家(ji)。我想赢取奖金,成为人生赢家。0
2020年5月25日

我用加强版RFM模型,轻松扒出B站优质up主!(含数据+实战代码)

=(sc.groupby('author')['L'].sum()/sc.groupby('author')['date'].count()).reset_index()L.columns
2020年5月22日

100道练习题,玩转Numpy模块!

来源:和鲸社区https://www.kesci.com/home/project/59f29f67c5f3f5119527a2ccNumpy是Python做数据分析所必须要掌握的基础库之一。以下为入门Numpy的100题小练习,原为github上的开源项目,由和鲸社区的小科翻译并整理(保留了部分原文作为参考)。受限于篇幅,小编在这里只提供了部分题目的运行结果。友情提示:代码虽好,自己动手才算学到。1.
2020年5月15日

面试真题:1亿张彩票堆起来有多高?!

数据分析里常用的五个统计学概念数据不吹牛读者群已经建立后台回复“入群”一起加入有趣讨论吧~“有点东西~”
2020年5月6日

据统计,6.5亿网民月收入不足5000!

数据分析里常用的五个统计学概念数据不吹牛读者群已经建立后台回复“入群”一起加入有趣讨论吧~“有点意思”
2020年4月29日

平均每天有1.6个直男在虎扑发问:“我被绿了,该怎么办?”

遗憾的是,由于虎扑在发展历史中经历过一次整体数据迁移,包括上述《女友出轨》在内的部分回帖被删除、隐藏。在这里,我们只能从792条现存的“被绿”帖子中(截至4月13日),窥视虎扑绿色文学的真正奥义。
2020年4月28日

Pandas基础+进阶10000字笔记!

https://raw.githubusercontent.com/Apache-Labor/labor/master/labor-04/labor-04-example-access.log2.
2020年4月27日

总结了28道数据分析经典面试题

扑克牌54张,平均分成2份,求这2份都有2张A的概率。M表示两个牌堆各有2个A的情况:M=4(25!25!)N表示两个牌堆完全随机的情况:N=27!27!所以概率为:M/N
2020年4月26日

绘制炫酷的地图,不只是pyecharts!

导读:地图可视化是一种非常直观的数据分析结果展现形式,python有很多可视化库可以实现,pyecharts就是很多python爱好者喜爱的实现地图可视化方法之一。不可否认,pyecharts绘制的地图实现方便、图形美观而且支持交互,但在面对不同需求时,其实我们还有很多其他手段实现地图可视化。01
2020年4月24日

干货案例 | Pandas数据可视化怎么做?

['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']df.plot(kind='pie',
2020年4月23日

数据分析里常用的五个统计学概念,你知道几个?

实战解读:数据分析,如何更进一步?数据不吹牛读者群已经建立后台回复“入群”一起加入有趣讨论吧~“有用”
2020年4月20日

趣谈5W2H | 被冷落的经典分析法!

最近,听到刚入职数据分析的旁友小P抱怨:“面对业务方抛出来的一个新的需求,总是一脸懵逼,不知怎么下手”我不假思索的回复:“在熟悉业务逻辑的基础上,可以参考一些经典的数据分析方法和框架,像5W2H、漏斗分析,参考这些框架,对于打开分析思路,找到头绪还是蛮有帮助的~”小P一脸不屑:“5W2H??那个老掉牙的分析模型?实不相瞒,我真不知道这个模型有什么实际的效用!?”我没有说话,抿了一口手中阿姨给倒的卡布基诺,感叹年轻人不懂存在即合理背后的哲思。“刚老板问我销售额为什么下降了,我不知道该怎么分析,这5W2H能给到头绪吗?”小P继续抛出问题。“在解决这个问题之前,我还是简单讲一下分析框架的背景,顺便告诉你,你的女朋友是如何通过5W2H分析法来吊打你的”
2020年4月17日

20个增长黑客经典案例。

增长,基本上是所有成长型公司都会面临的问题。本篇文章汇总了世界上最具创新性的公司,在发展的过程中使用到的20个增长黑客策略。如今,一家公司仅仅赚取可观的利润,并将其再投资于长期的增长是远远不够的。对于现在的创业公司来说,增长是衡量成功的唯一标准,更多的公司需要寻找更具独创性的方法,让新用户了解它们的产品或服务。这就是增长黑客策略。什么是增长黑客?在我们阅读今天的20个经典的增长黑客策略之前,先来看一个假设。假设你现在在一家餐馆里,你吃完饭,该付钱了。当你从钱包里掏出一张卡片并决定给多少小费时,服务员会把账单带给你,然后退到柜台。与此同时,在另一张餐桌上,同样的仪式刚刚开始,但这次服务员不仅带来了账单,还带来了额外的薄荷巧克力。根据《应用社会心理学杂志》开展的一项研究,从统计数据来看,第二位服务员得到的小费可能比第一位服务员高出23%。这只是一个小而简单的“增长黑客”例子,这是一种旨在增加收入或赢得新客户的策略。这种餐馆中的策略,在更广泛的商业领域也同样有效。让我们来看一下“额外的东西”主题的变化。你从电子商务网站买东西,当你到达付款和结账阶段时,你可以选择送货选项,包括免费(三天或四天送达)和增加额外费用(第二天在指定的时间段送达)。你选择“免费”,但几小时后你会收到一封电子邮件,表示你的订单已升级到“第二天”送达。如果“黑客”策略产生了它的效果,下次你想购买类似的东西时,这个商家将是你的第一个选择。当你看到快速扩张的创业公司时,它们很可能已经部署了自己的增长黑客策略,以获得市场的吸引力并赢得市场份额。这些策略可能是简单的,也可能是复杂的,它们可能发生线上,也可能发生在线下。共同的因素是,它们以创新的方式吸引了目标受众的注意力,而且它们的首要目的,就是为了增长。在大部分领域有很多很棒的增长黑客策略可供选择。在这里,我整理了20家公司的增长策略,它们都是通过增长黑客的方式来获得成功的。你可能不同意将所有这些例子都归类为“增长黑客”。它们中的一些正在使用传统的营销策略,或者可能是偶然发现了这一策略,而不是刻意去做的。我认为这并不重要,这里的重点是,所有的这些例子都导致了某种形式的增长,所以你应该从中学习一些东西。希望你能够在评论中分享你自己的例子,大家一起讨论与学习。1Shazam:线下传播音乐科技公司Shazam想出了一种巧妙的营销手段,来传播人们对其歌曲识别应用程序的兴趣,同时将遇到的问题转化为自己的优势。Shazam的应用程序,允许用户通过录制一小段音乐,并将其与在线数据库进行匹配,来识别他们在俱乐部、电台或派对上听到的歌曲。当背景噪音很大时,软件就很难识别出来歌曲,所以Shazam鼓励用户将智能手机尽量靠近音箱。这是个巧妙的方式。其他人看到有人举着智能手机往音箱上靠近时,会问“怎么回事?”关于Shazam的消息开始通过口口相传而迅速传播。结果就是,有了5亿次的下载量。2Uber:鼓励宣传Uber在73个国家开展业务,估值超过700亿美元,可以说是迅速扩大规模的典范。但在2009年,它只是一家区域化的汽车租赁公司,拥有一个供需匹配和处理付款的平台。Uber知道,它正在解决一系列与传统出租车服务相关的问题,但它需要牵引力。它在旧金山的基地是关键。Uber最初专注于技术社区,并组织活动,并为那些参会者提供免费的乘车服务。那些使用这项服务的人向他们的朋友讲述了他们的经历。进而推动了快速增长,而且这一模式可以在其他地区重复使用。3Netflix:直接与买家沟通和Uber一样,如今征服一切的Netflix,通过瞄准感兴趣的社区来推动早期的增长。这家公司从DVD租赁业务开始。为了传播公司名字,它充分利用了狂热的DVD购买者经常光顾的网络论坛平台等推广。其策略是向早期用户传达一个“软发布”的信息,即Netflix提供了在其他地方难以获得的影片。这种方法预计只会吸引少数的几个买家。事实上,Netflix发现,自己在一个月内每天处理高达1000个订单,而不需要任何传统的营销支出。现在,通过Reddit这样的网站向目标受众进行宣传仍然有效,Reddit现在有一个广告产品,可以帮助你扩展这种方法。4Buffer:第三方博客的力量在获得入站流量方面,公司博客所扮演的角色越来越很重要。但是在你自己的网站上发布博客文章,并不是唯一的方式。Buffer就是一个很好的例子,它是一个帮助人们管理和安排社交媒体帖子的应用程序。该公司的用户群从0增加到10万,主要是通过创始人利奥·维德里奇(Leo
2020年4月14日

数据分析干货 | 留存率模型应该怎么搭建?

"几乎所有的业务数据分析和运营工作都是围绕着“拉新”、“留存”、“促活”、“转化”4个环节来开展的。我们常常面临这样的问题,好不容易拉进来一批用户,玩着玩着就都流失了,更别谈转化和变现了。所以,弄明白“留存率”非常重要,它是衡量产品质量、运营效果的重要指标,也是预估产品盈利能力的重要参考!"01.
2020年4月14日

淘宝数据分析实战:热销美食爬取和分析

大家好,我是小z~之前写了篇关于如何画桑基图的文章,结果还真有小伙伴把“桑基”看成了“桑葚”,看来大家对于吃的兴趣十分高涨。今天分享的这篇文章,就是关于吃的一个分析案例:本文爬了淘宝搜索美食出来的商品信息,简单做了个分析,借此案例给大家学习参考。◆◆数据采集◆◆淘宝的页面也是通过Ajax来抓取相关数据,但是参数比较复杂,甚至包含加密秘钥。用selenium来模拟浏览器操作,抓取淘宝商品信息,即可做到可见即可爬。我就用selenium爬了淘宝网页上能显示的100页的数据,大约4400个左右,速度也不慢,具体步骤如下:1.准备工作用selenium抓取淘宝商品,并用pyquery解析得到商品的图片,名称,价格,购买人数,店铺名称和店铺所在位置。需要安装selenium,pyquery,以及Chrome浏览器并配置ChromeDriver。我们的目标是获取商品的信息,那么先搜索,例如我们搜索美食。而我们需要的信息都在每一页商品条目里。在页面的最下面,有个分页导航。为100页,要获得所以的信息只需要从第一页到带一百页顺序遍历。采用selenium模拟浏览器不断的遍历即可得到,这里为直接输入页数然后点击确定转跳。这样即使程序中途出错,也可以知道爬到那一页了,而不必从头再来。我们爬取淘宝商品信息,只需要得到总共多少条商品条目,而淘宝默认100页,则只需要每一页商品条目都加载完之后爬取,然后再转跳就好了。用selenium只需要定位到专业和条目即可。整体代码如下:from
2020年4月13日