魔蝎座和白羊座(魔蝎座男和白羊座女感情如何)
导语
最近在做热词趋势分析的过程中发现一个有趣的现象,某些大型的数据统计平台(比如腾讯浏览指数和微博的微指数)他们都有用户的属性分析,其中有一项是星座分析。经过几次热词查询,我发现对大部分热词感兴趣的人都是白羊座和摩羯座。这到底是为什么呢?
1眼见为实
眼见为实,让我们先来看几张实际的热词分析图表(来自腾讯浏览指数,分别搜索“计算机”、“内衣”、“美食”关键字):
以上图表来自腾讯浏览指数里面人群属性分析,为了区分,我分别搜索了“计算机”、“内衣”、“吃货”等不同领域的热词,最后发现不管是什么领域,都是白羊座的用户占比遥遥领先。
让我们再来看一下微博的微指数,同样搜索“计算机”、“内衣”和“吃货”,看看有什么结果:
不管是哪个词,摩羯座都是位列前三,而且远远甩其他星座几个圈。而且让人诧异的是两个大型平台搜索一样的关键热词,最后人群的星座属性完全不一样,一个是白羊座居多,另外一个是摩羯座。这到底是为什么呢?
2问题出在哪里
如果说白羊座天生热情、好奇心重对万事万物都很感兴趣,那勉强可以接受,那么闷骚沉稳的摩羯座该怎么解释呢?而且注册两大平台的人群几乎重复涵盖了中国全部的网民,不可能出现白羊座的只注册了腾讯平台,而摩羯座的大部分只注册了微博平台的情况,但统计结果却大相径庭。
那么问题到底出在哪里呢?
答案是:数据收集的方式有问题。
我先来看一下腾讯的用户信息源自哪里。腾讯大部分用户属性的收集都来自QQ,在早期的时候星座录入的方式是选择式的,白羊座因为居于星座之首,所以为了图个方便不填的用户都会默认选择白羊座。因此就产生了平台白羊座用户非常多的情况。
微博就不太一样,微博用户后台编辑没有星座这一栏,他们的星座的计算方式来自他们的生日的转换,绝大部分平台的生日默认值都是1月1日。而同样,用户为了图个方便或者是个人隐私都会选择不填,于是就默认了1月1日,而这一天刚好落在了摩羯座(出生日期 12月22日-1月19日)。
至此最终真相大白,数据收集方式的不同最终导致了两个平台出现了完全不一样的统计结果,于是位于特殊位置的白羊和摩羯成功躺枪。。。
3意外发现
那么微博统计出来的“美食”,竟然发现天蝎座遥遥领先,这该怎样解释呢?
这涉及到两点,一点是平台用户信息的可信度,微博要比腾讯稍微好一点,因为至少他们能有点差异,不像腾讯那样白羊座碾压所有人。。。
其次。。。那是因为天蝎座要真的真的真的是地地道道的吃货中的吃货,他们的用户群才能强大到把平台默认值摩羯座也超过了,而且很有可能绝大部分的摩羯座对美食一点兴趣都没有,导致“食欲狂魔”天蝎座遥遥领先。。。。(小编:难怪说天蝎座的美女都很丰满,难道都是吃出来的?)
嗯,记住了,下次如果要讨好天蝎座的,一定要请他们吃美食。
另外貌似无意中也发现对“内衣”很感兴趣竟然是双子座。。。嘿嘿
4设计缺陷
于是反过来,我们可以利用平台设计的缺陷发现真正对某热词特别感兴趣的星座,但对于白羊和摩羯座而言,要想了解到底什么能引起他们的注意,那就没办法了,因为他们的数据都是虚高的。。。。
另外这样的设计缺陷还存在于性别统计和地区统计之中。尤其是性别统计,绝大部分平台用户注册之后会性别默认选择的是男性,导致很多统计结果看到的都是男性占绝大部分。但某些游戏平台为了标榜女性用户很多从而吸引男性用户,会让用户默认选择女性角色。
但现在很多平台为了做数据分析和预测考虑,已经不设默认值,用户不主动填入则会留空或者“未知”,在数据统计的时候也会单独列出一项是“未知”。大大增加了数据的可信度。
结语
并不是大平台的数据都是可信的,
关键是这些数据从哪里来,
是以怎样的方式收集的。
当初系统是怎么设计的,
数据分析师们,
心里要有点逼数...
与本文知识点相关的文章: