南京楼市火吗|16000套二手房数据分析
这是菜鸟学Python的第116篇原创文章
阅读本文大概需要3分钟
前面有篇文章写了如何爬取南京16000多套二手房成交数据分析(南京的房子卖的有多火|二手房成交数据分析上篇),数据分析最有趣的地方是数据探索和展现部分,利用周末的时间,我用三大神器Pandas/Mat,Tableau和R语言的ggplot2来综合展现一下南京二手房成交数据分析,小伙伴们一起来看一下吧
1
用Tableau总览
Tableau是一款非常方便好用的神器,数据可视化软件里面数一数二.今天我就用它打头阵,来总览16000多套二手房的数据
1.二手房成交的套数
数据的采集是南京10月底的二手房成交量,发现南京8大区域,秦淮区,鼓楼和江宁成交量非常大,其中秦淮区成交最多.
2.成交的均价和挂牌的天数
我想了解一下房屋的成交和挂牌的天数,在南京8大区域的关系和数据分析情况
用两个子图来反映房价和挂牌天数的对应关系,发现浦口和栖霞区挂牌在50多天就可以成交。
而鼓楼和玄武区的基本都要在2个半月才能成交。从价格上看,鼓楼区的价格高,但是玄武区的价格低依然不好卖。
3.降价分布情况
都说房子要降了,那么我想知道南京这几个区域的房价那个区域降的最多呢
降价最多的是鼓楼区,平均降幅达到4.6万,降的最少的浦口区!看了浦口区还是比较坚挺的。
看一下整个南京的均线80%的降幅在2万多,也就是说买二手房砍2-3W还是很正常的。
4.均价和面积
看看房子的均价和面积有啥关系,是不是越贵的面积越大呢
发现鼓楼区均在在32000多,全市单价均值最贵的房子都在鼓楼,而且面积也是最小的平均70平米不到
典型的老破小房子都在鼓楼区,但是为啥还卖的这么贵呢,学区房呗.
5.房子的装修分布情况
16000多套房子,到底有多少是装修过的,每个区域的房子精装的多还是毛胚的多啊,分布情况如何?
对比发现,精装最多的是江宁区有1500多套精装二手房,毛胚最少的浦口区!看了浦口最特别,精装900多套,毛胚普通和其他都是200多套,反差非常强烈!
说明新房很多,很多炒家囤房的.一个区域毛胚越少,说明这个区域越成熟,自住的越多!
二
用ggplot2挖掘
上面通过Tableau神器总览了一下,给我们一个总体的南京二手房数据全貌!下面我们用ggplot2来深入分析一下这些特征值之间的相关性如何.
1.二手房14个的特征维度的关系分析
房屋的装修
房屋的面积
楼盘的名字
成交的总价
每平米的单价
房屋的挂牌价
房屋的楼层数
房屋的房龄
房屋的地段
房屋多少天成交
房屋的朝向
有无电梯
房间数
挂牌价和成交价的差值
上一篇提到我抓取了二手房14个维度,我们来分析一下这些特征值的关系
发现相关性比较高的:面积,总价,单价和房间数!其中房龄和总价的关系为0.222, 不是非常相关,但是我也很想知道房龄对南京二手房房价的影响
2.房龄和房价关系
发现60-80年的很旧的房子住要在玄武和鼓楼,而且数量比较少.而1980-2000年左右的房子大部分都在鼓楼和雨花区
2010以后的房子100-250平面积在雨花区和江宁,300平米的新房大部分在建邺区
3.二手房成交里的日光盘
上一篇我提到有400多套日光盘的二手房,我很有兴趣想知道什么样的房子比较好卖!
看了日光盘鼓楼和建邺区的特别多,也就是鼓楼和建邺的房子特别好卖,而且房价总价也是最高的
而江宁,浦口,秦淮的日光盘比较少,这3个区的房子不好卖!而栖霞区的日光盘总价最低,看来栖霞区急售的很多啊
三
用Pandas细细观察
最后我们用Pandas来细细的分析一下亮点的数据,仔细的咀嚼数据里面的秘密和排行情况
1.看一下全市成交最高的Top10楼盘
浦口非常多,其中江南水岸卖了100多套房子.
2.放大看一下成交量第一的秦淮区
发现万达紫金明洙和瑞金北村出售的比较多,不知道是不是跟周围的楼盘,地价有关!
秦淮区的二手房单价如何,我们取前10名看看:
排名第一的是CFC长发中心单价48000,发现万达字号的楼盘房价不低啊,排第三,第四!
结论:
南京二手房的数据分析基本写完了,前前后后写了好几篇,涉及爬虫,数据清洗分析和数据可视化3大点综合运用,通过数据的分析让我对南京的二手房市场又有了更深入的了解,限于篇幅还有一些地方没有深入探究,以后会继续写一些有趣的数据分析文章,小伙伴敬请期待!
另外:
小密圈已经开群1个多月了,目前有近200人的规模,非常幸运有这么多志同道合的小伙伴一起学习Python,如果你想有人加油鼓劲,在你学Python困惑的时候,希望有人指点一下,少走弯路,欢迎加入小密圈!
长按二维码,加入小密圈
还差8个人满200人
超过200人会涨价
来源 | 菜鸟学Python
作者 | xinxin
本文章为菜鸟学Python独家原创稿件,未经授权不得转载