三分钟教你挖掘出9个亿的5位数QQ号,QQ大数据的( 二 )


文章插图
从情感方面的分布图,未婚比已婚的比例高 。这个话题,我表示比较有兴趣:70后的土豪Q们大部分时间都在忙事业了,Q男的不着急生娃,Q女不着急婚嫁 。大龄女可以叫“剩女”,大龄男不能喊“剩男”,那得叫成熟的“黄金单身”!这让至今未婚的Q女们肿么办? 可以考虑学学小龙女,也许能遇上一段世纪佳缘,百合一生,或者干脆将单身进行到底,做坚强的“黄金剩斗士”!!!

三分钟教你挖掘出9个亿的5位数QQ号,QQ大数据的

文章插图
原来IT腐男宅女,商界精英,工程师,退休老大爷最爱混迹QQ圈!
用户职业方面,QQ好像可以随便,因此职业也是五花八门,挑了前十几个最多的做一副云图 。另外标识退休的一部分估计早已财务自由 。计算机及互联网行业的居多,很好理解 。早期QQ号码随便申请,没人知道他的价值,同时安全性也非常差,主要的上网渠道–网吧中有各种后门及盗号木马神马的 。所以很大一部分靓号都被各类计算机大神“收集”起来 。所以最终形成如下现在的分类图:
三分钟教你挖掘出9个亿的5位数QQ号,QQ大数据的

文章插图
后记:拥抱互联网数据
很有感悟“ 互联网上没有垃圾信息,只有放错位置的资源” 。关于WEB数据挖掘方面其实是很值得研究的 。以上的数据分享案例仅从5个维度做了对应分析,其实根据数据采集的维度,是可以做更广泛分析的 。如从腾讯开放的QQ群、QQ会员、QQ拼音及QQ秀等多个公开数据源渠道挖掘收集到非常有价值的数据 。就像百度中有很多你需要的开放数据,关键看你怎么去挖掘收集 。
多年前,数据采集工作是需要程序员自己写各种爬虫程序,同时需要搞定多线程、数据库、高匿IP等多个技术门槛才能比较随心所欲地做到,整个过程是非常繁琐的 。现在好多了,随着互联网云存储计算、大数据相关云技术的成熟,使用支持云采集的SaaS工具化交易平台,一方面自己可以使用工具轻而易举收集到想要你的数据,另一方面也可以直接发个需求让其他开发者或供应方定制给你 。自己就可以聚焦在擅长的数据分析方面了 。
言归正传 。以上数据源由托管在发源地数据交易平台,有兴趣的朋友可以去这个链接:&op=&=1123看看(需要登录),2万多原始数据都在里面 。
三分钟教你挖掘出9个亿的5位数QQ号,QQ大数据的

文章插图
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,谢谢 。