爬了杭州的租房数据,原来……

大家好,我是“猫玛尼”,一名程序员 。
在外打工,大部分人每个月总要花一笔钱在租房上面,一起来看看杭州的租房情况 。
数据来源是F天下,该网站,按照百度的说法:“是全球最大的房地产家居网络平台”,数据源靠谱 。
一共爬取到15485条出租房源数据,按照区域分布如下:
【数据分析】
一、房源分布
我们可以清晰地看到,几大城区,房源数量基本上都比较接近 。上下两城和拱墅较少一点,这也符合实际情况,近几年杭州往外扩,余杭、萧山、滨江等地区房源自然也多了 。后面5个周边,桐庐、富阳、临安、建德、杭州周边,房源较少 。
二、租金差异
标价大,不一定就代表实际租金高,还需要考虑标价对应的出租面积,比如A房源4000块每月(面积150平米),B房源2600块每月(面积50平米),显然不能直接说4000块每月的贵 。得把月租金,均摊到每平米,就能做出公平的比较 。即一平米每月需要多少钱:
A房源:4000块每月 /150平米 = 26.67
B房源:2600块每月 / 50平米 = 52
计算之后发现B房源更贵 。
按照这个思路,我们计算出各个地区,一平米每月多少价格 。计算的是平均数:
数值做了四舍五入,取整 。其中江干、西湖、滨江、上城,价格都超过了50 。
我们来计算一下各主要城区,租住一间20平米的房间,房租平均要花费多少钱:
江干:20 * 55 =1100
余杭:38 * 20 =760
西湖:53 * 20 =1060

爬了杭州的租房数据,原来……

文章插图
萧山:40 * 20 = 800
滨江:60 * 20 = 1200
下城:47 * 20 =940
上城:68 * 20 =1360
拱墅:45 * 20 = 900
大家可以看下自己是高于平均还是低于平均 。总体上,房租每个月花费1000,在杭州基本是少不了的 。
这个统计,和我们平时的认知还是比较符合的,越往周边,租金越便宜 。滨江,互联网公司较多,里面有好多拿着高工资的程序员、产品经理,他们消费能力强,当地的租金自然也水涨船高了 。
从图表来看,余杭相对来说租金较便宜,如果不计较路程的话,租住在余杭也是个不错的选择 。
三、租住方式
整租数量最大:
四、户型
经过统计,1室1厅、3室2厅、2室1厅、2室2厅最多,都是主流户型 。再其他的户型,数量就很少了,我把他们合并成了“其他”:
五、房屋特色
这个统计,可以很清晰的看出卖家的营销套路,基本都是给房源标上类似“拎包入住”、“随时看房”、“随时入住”、“家电齐全”、“南北通透” 。
这个从侧面也说明了,大家租房会比较看重:是否能够直接、简便的入住 。
图中“合租男生”、“合租女生”看不太清,实际上这两个是差了一倍的,虽然数据样本总体不算大,但还是能看出来女生更受欢迎一些,我猜想可能是女生比较爱干净吧 。
其实还有更多有意思的分析,篇幅原因,就分析到这里了 。
爬了杭州的租房数据,原来……

文章插图
【原始数据】
原始数据提取地址如下:
【代码】
数据源:F天下(机智的你,应该知道是哪个网站)的租房栏目
只需要创建两张表,如下:
BEGIN;### 房天下所有城市的主页信息DROP TABLE IF EXISTS `sou_fang_city_index`;CREATE TABLE `sou_fang_city_index` (`id`INTNOT NULL AUTO_INCREMENTCOMMENT '数据库自增ID',`create_time`DATETIMENOT NULL DEFAULT '1970-01-01 00:00:01'COMMENT '数据创建时间',`modify_time`DATETIMENOT NULL DEFAULT '1970-01-01 00:00:01'COMMENT '数据修改时间',`province_name`VARCHAR(40) NULLCOMMENT '省份名称',`city_name`VARCHAR(10) NOT NULLCOMMENT '城市名称',`city_index_url` VARCHAR(40) NOT NULLCOMMENT '城市首页链接',PRIMARY KEY (`id`),UNIQUE KEY `uk`(`city_index_url`))ENGINE = InnoDBDEFAULT CHARSET = utf8mb4COMMENT = '房天下所有城市的主页信息';# 房天下租房数据DROP TABLE IF EXISTS `sou_fang_renting`;CREATE TABLE `sou_fang_renting` (`id`INTNOT NULL AUTO_INCREMENTCOMMENT '数据库自增ID',`create_time`DATETIMENOT NULL DEFAULT '1970-01-01 00:00:01'COMMENT '数据创建时间',`modify_time`DATETIMENOT NULL DEFAULT '1970-01-01 00:00:01'COMMENT '数据修改时间',`city_index_id` INTNOT NULLCOMMENT 'sou_fang_city_index的自增ID',`province_name` VARCHAR(40)NULLCOMMENT '省份名称',`city_name`VARCHAR(10)NOT NULLCOMMENT '城市名称',`area_name`VARCHAR(20)NOT NULLCOMMENT '区域名称',`detail_url`VARCHAR(120) NOT NULLCOMMENT '房屋详情的url',`name`VARCHAR(50)COMMENT '名称',`rent_way`VARCHAR(4)COMMENT '出租方式',`door_model`VARCHAR(4)COMMENT '户型',`area`VARCHAR(10)COMMENT '建筑面积',`toward`VARCHAR(10)COMMENT '朝向',`unit_price`VARCHAR(10)COMMENT '单价',`feature`VARCHAR(100)COMMENT '特色',PRIMARY KEY (`id`),UNIQUE KEY (`detail_url`))ENGINE = InnoDBDEFAULT CHARSET = utf8mb4COMMENT = '房天下租房数据';# 搜房网-小区详情首页-小区详情-原始数据DROP TABLE IF EXISTS `fang_community_detail`;CREATE TABLE `fang_community_detail` (`id`INTNOT NULL AUTO_INCREMENTCOMMENT '数据库自增ID',`create_time`DATETIME NOT NULL DEFAULT '1970-01-01 00:00:01'COMMENT '数据创建时间',`modify_time`DATETIME NOT NULL DEFAULT '1970-01-01 00:00:01'COMMENT '数据修改时间',`community_id`INTNOT NULLCOMMENT 'fang_community的自增ID',# 基本信息`address`VARCHAR(128)COMMENT '小区地址',`area`VARCHAR(32)COMMENT '所属区域',`postcode`VARCHAR(8)COMMENT '邮编',`property_description`VARCHAR(32)COMMENT '产权描述',`property_category`VARCHAR(8)COMMENT '物业类别',`completion_time`VARCHAR(20)COMMENT '竣工时间',`building_type`VARCHAR(64)COMMENT '建筑类别',`building_area`VARCHAR(32)COMMENT '建筑面积',`floor_area`VARCHAR(32)COMMENT '占地面积',`current_number`VARCHAR(10)COMMENT '当期户数',`total_number`VARCHAR(10)COMMENT '总户数',`greening_rate`VARCHAR(10)COMMENT '绿化率',`plot_ratio`VARCHAR(10)COMMENT '容积率',`property_fee`VARCHAR(20)COMMENT '物业费',`property_office_telephone` VARCHAR(100)COMMENT '物业办公电话',`property_office_location`VARCHAR(40)COMMENT '物业办公地点',`additional_information`VARCHAR(32)COMMENT '附加信息',PRIMARY KEY (`id`),UNIQUE KEY (`community_id`))ENGINE = InnoDBDEFAULT CHARSET = utf8mb4COMMENT = '搜房网-小区详情首页-小区详情-原始数据';COMMIT;