大数据处理关于星座性格测试的实用案例

时间:2021-03-14 09:27:16 星座

真庆幸我不是处女座,否则都不好意思报自己的生日!大数据总是这样,时不时的拿一群人开涮,最近处女座因为败家程度超过均值太多个标准差,已经被纳入异类,不过我们今天不黑处女座,一起来看看大数据处理技术是怎么驱动“星座性格”的!

世界真小,其实星座性格是个大数据案例!它毫无二致的遵循着“大数据法则”,标准的工作内容分为以下几步:

1、 确立星座与日期的对应关系

2、 掌握了名人的生日,映射到星座上,给每个名人赋予星座。

3、 给每个名人打性格标签,每个人可能拥有数个不同标签。

4、 统计海量的名人,按星座划分标签

5、 每个星座都得到了一些标签,按出现的频次排序,靠前的标签就成为星座性格标签

6、 稍作加工,使得星座标签更易于表述

注意到前两条,其实表达的意思是每个名人都有一个星座,整理出这笔资料来!但是我分列了两条,这里表达了大数据的行动风格,也就是,没有人告诉第一个研究星座性格的人,星座是和性格有关系的,这本身就需要敏锐的眼光,从第一步走到第二步,整个研究基本上就成了,后面就都是顺水推舟的过程!然而这一步星座大数据,需要的是大量数据的验证和超前的想象力。

有时我们看到星座性格蛮准的,一方面是由于大量的样本匹配,还真有点科学的味道,另一方面就是星座性格在组织语言时,运用了和中国传统娱乐活动——“算命”一样的道理,将一些中庸的、模棱两可的词汇加入进来,使得大家能够更好的对号入座。

这可能是最没有科学依据的大数据案例了!但是它的风靡程度是前所未有的,年轻人很喜欢这个玩法,她们乐此不疲星座大数据,充分的将这些内容应用到生活的方方面面!有人用来找男朋友、有人用来找女朋友、有人用来评价房客、有人用来评价老师,更有甚者用来评价宠物,要知道一只处女座的狗,也是败家的!

但是这有什么关系呢!星座已然成为一代人的文化标签,寄托了太多人的情感和慰藉,人们从这些东西里获得的社交价值,远远超过其他大部分号称“科学”的玩意!虽然数据是世界上最精确的东西,但是近些年来,它似乎想摆脱这样的称谓,开始涉足那些以往自己不擅长的领域,尽管有着太多的争议,大数据现在更多的被用来娱乐和消费,有人专门拿数据分析搞出一些“娱乐新闻”,常用经济、消费、饮食、交通、教育的精确数字来制作动画,配以活泼语言,一则广受欢迎的节目就诞生了,和星座玩法别无二致。

进军文艺界?天知道大数据在干什么!

星座大数据