您当前的位置:首页 > 互联网百科 > 大数据

你是如何被大数据操控的?

时间:2022-01-21 10:02:52  来源:  作者:上下前
你是如何被大数据操控的?

 

我们每天都要和手机、电脑、Siri、小艺同学发生千百次的交互,你的每一个点赞,每一次滑动,每一笔消费,每一次刷抖音微博快手,都会被准确无误地记录着。

但是,在我们尽情享受互联网带给我们的便利和愉悦的同时,你正在放弃一件重要的东西,那就是你的数据

现在的大数据可以有多神奇呢?

就是你今天刚办完婚礼,明天就能看到婴儿车的广告;刚买完汽车,马上看见全年优惠洗车;今天心情不太好,搞笑段子马上出现。当然了,这些都是比较初级的应用,真正的大数据,都是悄然无声的,在背地里头暗自进行,以各种微妙的形式影响着我们的行为,甚至是影响总统选举。

可怕的是,当这一切都已经发生了,我们还毫无察觉。这不是危言耸听,前一阵子Facebook数据泄露的事儿,闹得沸沸扬扬,扎克伯格都被拉到国会山被质问和训话了,是不是听着很玄乎呢?

这次呢,咱们来聊点硬核的,它涉及到一些心理学和大数据的内容,我感觉还挺有意思的,因为刚了解到这个事儿的时候,我自己也非常震惊,大数据已经偷偷改变了所有的游戏规则。

身在这个游戏当中的我们,就非常有必要知道改变的是什么了,知己知彼嘛。

那这些我们可能平时都不太留意的数据,是如何配合着心理学的武装加持,被拿来利用而改变世界的呢?

你是如何被大数据操控的?

 

这个事儿呢,要从一个叫做SCL的公司说起,这公司成立于1990年,本来是一个做战争心理咨询的公司,曾经帮助美国和英国的军方参与过阿富汗和伊拉克的战争。所谓战争心理咨询呢,就是希望通过心理学的一些手段,去影响战局,专业名词就叫心理战(Psychological operations)。比如说,他们研究怎么去劝服阿富汗的小孩,不要加入基地组织,或者是怎么去劝一支游击队投降等等。

除战争外,那你想一想,这套策略如果真的能通过改变人的心理,去影响他们的行为,那就有一个发挥更大作用的地方,也就是选举。这世界很多国家都有选举,那么多钱,那么多民众,SCL很容易大捞一笔。

于是呢,SCL公司真就这么干了。他们以一个政治咨询家的身份开始掺和到各个国家的选举当中,像阿根廷、特多、泰国、印度、马来西亚、意大利、肯尼亚等等,这么多国家的大选都曾经被SCL掺了一腿。

不过之前影响大选呢, SCL用的都算比较初级的玩法,因为当时还没有大数据。

直到2013年,他们看到了一篇研究文章,这文章是剑桥大学的一个叫科辛斯基(Michal Kosinski)的教授和他的学生一起写的,文章声称他们可以拿一个第三方的App放到Facebook上去给用户做问卷调查,如果你说明以研究为目的话呢,就可以从Facebook随意地收取用户数据。

于是,这两个人在六年时间里收集了58000个用户数据,而且通过研究这些数据,他们惊奇地发现,这些简简单单的点赞、评论、转发的信息,就可以反应出这些用户的明显性格特征。

比如说,这些数据有88%的正确率可以判断用户的性取向,95%的准确率可以判断出用户的人种,85%的准确率可以判断出用户的知识水平以及党派特征,当然用户的性格弱点也逃不过这套数据的出卖。

就是这么神奇,那你想啊,SCL高层当时看到这篇论文是什么感觉?那当然是眼前一亮了,毕竟Facebook在全球有几十亿的用户,如果这些数据我都能拿到手,那我就知道他们支持哪个党派了,同时我又知道他们是什么性格,再结合着SCL多年心理战的技术,不就可以直接去影响这个国家的大选嘛,这是多么大的一个商机啊。

于是呢,SCL立马成立了一个子公司,还特意把剑桥的名字借过来,给它起名叫做剑桥数据分析(Cambridge Analytical),当然了,这个名字未来真的是名扬天下,又遗臭万年,我们就简称它CA好了。

你是如何被大数据操控的?

 

CA公司为了操控某国大选来谋取利益,就把这事情分成了三步:

第一,获取数据;第二,分析数据;第三,改变选民行为

首先,自然是要获取数据。其实获取数据这个事儿科辛斯基教授都已经研究出来了,Facebook接口也是现成的,那CA就想直接找教授来帮我获取不就得了嘛。

于是他们火速找到了发表论文的科辛斯基,就说,哎,哥,我们现在想做一个数据研究,你来支持我们拿数据吧,我们有重金相谢。但你别说,这个科辛斯基教授还是非常有职业操守的,他知道CA拿这个数据肯定是不干好事儿的,于是果断拒绝了。只可惜,他不干还有别人干啊。

CA也是快马加鞭,开始去划拉划拉其他的人,终于让他们找到了。这个人呢,同样是在剑桥里做研究的另一个小哥,叫做科根(Aleksandr Kogan),他的职业操守就没有那么高了。而且,他特别急于出研究成果证明自己,既然有人资助,Facebook有现成的接口,又可以做研究,那何乐而不为呢?

于是,这个科根就如法炮制了科辛斯基教授做的事儿,弄来了一个新的APP,改了个名字叫做你的数据人生(does your digital life),然后就拿这个新的APP在Facebook上开始给人发问卷。

他这个问卷呢,算是科辛斯基教授的升级版,一共有120道题。本来吧,答120道题还是挺多的,但是这个科根有CA的资助可以给钱啊,只要打满全部问题,科根的APP就给你发几美元。

这一下可不得了了,科根在研究调查问卷的同时,发现了Facebook的一个巨大安全漏洞,他发现问卷发出去之后,不光可以收获到填问卷的这些用户的数据,连这个用户的好友的数据,也被全部收集过来了。

这是什么概念呢,就比如你的任何一个微信好友,在微信里做了一个问卷,跟你八竿子打不着的一个问卷,然后呢,你的数据包括你的姓名、年龄、家庭住址,种族等等各种信息就被人家给拿走了,完全都没经过你的同意,就是这么随意。

这可是海量的信息啊,科根本人也相当兴奋了,几个月的时间里,就发出去了27万份调查问卷,收获了超过5000万人的用户数据,当然还有一些数字,说是7000万或8000万,不过就这个数量级,大家可以感受一下。

这样一来,科根这么一个小小的调查问卷小程序,居然造成了有史以来影响范围最广的数据泄露,当然这些都是后来被披露出来的。你想啊,那时候的CA,拿着全球几千万用户的数据,偷着在家里乐呢。

数据获取这第一步搞定了,CA现在已经有了海量用户的个人信息,还有他们各种转发,点赞,评论的数据,你说他是怎么通过这些信息就分析出来大家的性取向,政治取向,甚至智商等等等等的呢?

其实答案就在那个剑桥科辛斯基教授的论文里边。

科辛斯基教授的研究原理呢,详细说起来比较复杂,心理学上有不少模型用于定量刻画一个人的性格,他就利用了一些经典的模型结合大家社交媒体中的操作,对人们进行性格侧写。

简单点说呢,就是科辛斯基教授可以通过看你的点赞转发,就判断出你是个怎么样的人

你是如何被大数据操控的?

 

假设你经常给一些科学论文,给一些理论分析点赞,大概率呢,你可能是一个逻辑思维比较强、高智商的人;你要整天点赞一些什么娱乐八卦,谁谁离婚了,谁又被抓了,或者网购信息呢,那大概率…..,嗯,当然大家也别对号入座啊,这只是说他们分析出来这个信息是高度相关的,但也不是绝对的,所以你要爱看八卦娱乐,爱点赞,那你就接着点,做人嘛,最重要的是开心。

在他们研究里呢,发现了一个非常有趣的现象,就是那些喜欢点赞hellokitty的人,大概率是一个性格外向,情绪稳定而且有责任心的人,那这个人就更有可能倾向是一个民主派或是一个基督徒,而且大概率还是个年轻人。

你看吧,就因为这人点了一个hellokitty,就被人知道了这么多信息,是不是既神奇又吓人。所以你想啊,咱们平时刷个抖音,每一次浏览,每一次划动,每一次的小爱心,这些数据都毫无保留地被送到了字节跳动的总部了,对于他们来讲,是不是轻轻松松就可以做出一份你的性格分析报告了,就是不知道他们敢不敢了。

根据科辛斯基教授自己的说法呢,如果他了解一个人10个Facebook的点赞,足以让他对这个人的了解超越这个人的普通同事;70个点赞,则足以让他对这个人的了解超过这个人的朋友;150个点赞,那么他对这个人的了解可以到达这个人家长的程度;如果有超过300个点赞,那么他可以比这个人最亲密的伴侣更了解这个人。

这么说吧,下次你要真的想了解一个人,想知道他平时关注什么,性格喜好是什么的话,直接把他手机拿过来,抖音上刷一刷,立马就知道了呗。

扯远了,我们接着回来说这个CA,他们拿着Facebook的海量用户数据,对科辛斯基教授的这套分析理论做了一些改进,就形成了一套他们的五维性格分析法,被简称为OCEAN。通过这个方法,他们就可以从五个维度来评测出一个人的性格特点。

好,那既然分析了大数据,前期又做了这么多的准备工作,接下来CA就要干一票大的,他们成功掺和到了全球最大的选举盛会——美国大选,加入到了特朗普的选举团队中。

接下来他们要做的,是他们最擅长的,也是最终目的,就是通过改变行为来影响选举结果。

为什么说这个事儿是CA最擅长的呢,别忘了,它的母公司SCL一直都是做这种通过心理策略来影响选举的行家。咱们先来讲一个他们之前的成功案例吧,在中美洲加勒比海地区,有一个国家叫做特立尼达和多巴哥,地方不大,总人口只有121.8万,不是特别有名,我们可以把它简称“特多”。

2009-2010年呢,正值特多大选的时候,SCL就掺和进去了。当时,特多大选主要分两派,一派主要是印度人,另一派主要是黑人,SCL就是帮这个印度派在做选举咨询的,咱们来看看它是怎么玩儿这个心理战的啊。

SCL当时经过一系列的分析,决定拿年轻人作为突破口,搞了一个叫做Do So的运动,它的Logo很简单,就是一双交叉的手臂,大概意思呢也很直白,让大家拒绝投票。很快,这个运动在年轻人里边就形成了一股叛逆的风潮,再加上这么一个非常有显眼的手势,直接就传播开了,大家都在社交媒体上疯传,鼓励年轻人都不要去投票。

你是如何被大数据操控的?

 

你这么听,好像SCL也没帮着印度派做什么事情啊,但是,这就是他聪明的地方了,因为他搞的这个活动呢,根本也不是针对哪个政府或哪个帮派的,而纯粹就是针对政治的。

你想啊,年轻人叛逆,肯定或多或少都觉得政治就是一些阴谋诡计,没意思,我要跟政治隔绝,我不要政治,所以他这个Do So的活动,恰巧就迎合了年轻人当时的心理,所以就有了非常好的传播效果。

咱们再想想,这又跟印度派有什么关系呢?

其实,SCL的目标非常精准,你看特多这个国家当时的选举阵营分印度人派跟黑人派嘛,这两派里头的成年人呢,其实不太会因为社交媒体上的一个什么活动就不去投票,大家该投谁还投谁吧。

但是小孩儿就不一样了,小孩都很叛逆,就很容易受社交媒体的影响,这样问题就来了,黑人这边呢,家长其实是不太去管孩子的,你爱投投,不投拉倒,但是印度派这边就不一样了,家教非常森严,不管你社交媒体上怎么Do So,该你投票还得来投票,不投票你都不敢回家。

所以,最后造成的结果,就是黑人派的小孩都不去投票了,印度派的小孩儿在家长的威逼利诱之下就都老老实实来投票了,最终在18到35岁的这个人群当中,印度派这边的得票率高出了40%,整体的结果呢,是印度派险胜6%,你看吧,就是这样,让印度派最后获得了选举胜利。

厉不厉害,SCL的心理学玩得溜不溜?他也不需要去改变人们的政治倾向,那也不好改对吧,但只需要让黑人小孩别去投票,就可以支持印度派这边的选举胜利了。

咱们光看这个案例,就知道这SCL是既阴险又聪明了,还是非常有一手的,这回又有了大数据的加持,CA就可以更加精准地干预选举了。

他们甚至可以根据不同人群的分类,去打不同的广告,见人下菜碟儿,你喜欢糖我就多给你点儿甜的,你喜欢蹦迪我就多给你放点音乐。

我们前面讲CA是帮着特朗普的,而且他知道美国选民的性格对吧,如果有人的性格是那种比较容易焦虑,比较听风就是雨的类型呢,那就给他来点针对性的危言耸听的广告,比如说,你不投特朗普,美国就完蛋了,只有特朗普能带领美国走向美好未来之类的。假设CA要看这人的性格是比较温和,比较讲理,又是那种家庭导向型的传统性格的话,就给他投放一条广告,讲一讲特朗普当选之后怎么关注家庭的收入,怎么共建美好社区,如何带领美国走向新时代,大致就这个意思。

我们都知道,美国大选这个东西,其实到最后比的就是谁能造声势,谁有更多的钱,谁能更加精准的进行广告投放,把这些钱都花在刀刃上,让效果最大化。

你是如何被大数据操控的?

 

结果我们也都看到了,16年11月份大选前夕,当时各种主流媒体,包括金融的二级市场里,就没有人会觉得特朗普会赢,所有人都觉得,美国的第一位女总统马上就要诞生了,包括很多预测的网站上,也就是象征性地给特朗普一个15%的胜率意思一下,结果呢,却是特朗普以微弱的优势翻盘获胜。

之后,就有Facebook内部的人士透露,当时特朗普在社交媒体上打广告的效果,是要远远好于希拉里的,这一点CA肯定是功不可没。这件事儿呢,其实一直在被很多人讨论着,但是也没有什么定论。直到2018年,随着各种媒体不断地深挖,还有CA的一个内部员工爆料,整件事才被公之于众。

就因为这个事儿,Facebook也被推到了风口浪尖,你想啊,那么大的数据泄露事件,居然在所有人都毫不知情的情况下,要是被黑客攻击了,倒也是个说辞,问题是Facebook就把数据接口那么敞着,随意让人拿数据,以后谁还敢信你,对吧?要不小扎同学要赶紧给Facebook改名META呢,名声臭了就换个马甲继续混,这招好像是跟某宝的网游工作室学的吧。

话说CA这波操作之后,也是顶不住压力了,和它的母公司SCL两个公司一起在2018年都注销了。至于CA的这套模型,在多大程度上左右了美国大选的结果,这个事儿很难有一个确切的结果,甚至还有人爆料CA之前还深度参与到了英国的脱欧公投当中,毕竟当时半年之内连续两次让人大跌眼镜的相反结果,很难不让人起疑。

不过,不管CA这边他做了什么没做什么,咱们都能从这个事儿里看到数据本身有多么的强大和可怕。这就好像一滴水,看似没什么,但是如果你给每一滴水都施加那么一点点力,就可能改变整个洪流的方向,必然也会影响我们的行为和生活。

所以你看,大数据其实早就比你自己还了解你自己了。那为了迷惑大数据,咱们以后是不是也可以适当地给不喜欢的人点点赞呢?



Tags:大数据   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
我们每天都要和手机、电脑、Siri、小艺同学发生千百次的交互,你的每一个点赞,每一次滑动,每一笔消费,每一次刷抖音微博快手,都会被准确无误地记录着。但是,在我们尽情享受互联网...【详细内容】
2022-01-21  Tags: 大数据  点击:(6)  评论:(0)  加入收藏
岁末年初,身为“打工人”都逃不掉写“年度报告”来总结并回顾过去一年的工作与发展。近几年各大与人们生活息息相关的App也开始生成“年度报告”——展示用户过去...【详细内容】
2022-01-19  Tags: 大数据  点击:(9)  评论:(0)  加入收藏
文|小代每次疫情发生时,当地的病例人数公布后,大家最紧张等待的便是他的活动轨迹。流调是漫长又辛苦的工作,但时间不等人,需要快速调查清楚病例的活动轨迹,以防止疫情的大规模扩...【详细内容】
2022-01-17  Tags: 大数据  点击:(25)  评论:(0)  加入收藏
随着科技的进步,通信技术的不断发展,我们对网络的要求越来越高,视频必须看蓝光以上的,游戏不能有卡顿,直播必须流畅。我们是否有想过这些视频从何而来呢?下面我们就来讲讲大数据时...【详细内容】
2022-01-10  Tags: 大数据  点击:(14)  评论:(0)  加入收藏
近日,国家网信办等四部门联合发布了《互联网信息服务算法推荐管理规定》。根据规定,算法推荐服务提供者应当向用户提供不针对其个人特征的选项,或者向用户提供便捷的关闭算法推...【详细内容】
2022-01-06  Tags: 大数据  点击:(9)  评论:(0)  加入收藏
金价通常在1月获资金和节日黄金消费需求支持,如何理解这一现象?一方面是年底资金轮转,一方面是中国传统的黄金消费旺季推动。1月金价表现往往也代表了基金机构看法,反映了资金在...【详细内容】
2021-12-31  Tags: 大数据  点击:(14)  评论:(0)  加入收藏
为啥这几年偷税漏税的新闻这么多?不是偷的人多了,是因为国家有了查税大杀器: ...【详细内容】
2021-12-24  Tags: 大数据  点击:(27)  评论:(0)  加入收藏
张欣安科瑞电气股份有限公司 上海嘉定 201801 摘要:随着电力行业各系统接入,海量数据涌现,如何利用电网信息化中大量数据,对客户需求进行判断分析,服务于营销链条,提升企业市场竞...【详细内容】
2021-12-14  Tags: 大数据  点击:(20)  评论:(0)  加入收藏
1、什么是数据分析结合分析工具,运用数据分析思维,分析庞杂数据信息,为业务赋能。 2、数据分析师工作的核心流程:(1)界定问题:明确具体问题是什么;●what 发生了什么(是什么)●why 为...【详细内容】
2021-12-01  Tags: 大数据  点击:(40)  评论:(0)  加入收藏
数据作为新的生产要素,其蕴含的价值日益凸显,而安全问题却愈发突出。密码技术,是实现数据安全最经济、最有效、最可靠的手段,对数据进行加密,并结合有效的密钥保护手段,可在开放环...【详细内容】
2021-11-26  Tags: 大数据  点击:(43)  评论:(0)  加入收藏
▌简易百科推荐
我们每天都要和手机、电脑、Siri、小艺同学发生千百次的交互,你的每一个点赞,每一次滑动,每一笔消费,每一次刷抖音微博快手,都会被准确无误地记录着。但是,在我们尽情享受互联网...【详细内容】
2022-01-21  上下前    Tags:大数据   点击:(6)  评论:(0)  加入收藏
知乎业务中,随着各业务线业务的发展,逐渐对用户画像和实时数据这两部分的诉求越来越多。对用户画像方面,期望有更快、更准、更方便的人群筛选工具和方便的用户群体分析能力。对...【详细内容】
2022-01-19  大数据推荐杂谈    Tags:数据架构   点击:(11)  评论:(0)  加入收藏
文|小代每次疫情发生时,当地的病例人数公布后,大家最紧张等待的便是他的活动轨迹。流调是漫长又辛苦的工作,但时间不等人,需要快速调查清楚病例的活动轨迹,以防止疫情的大规模扩...【详细内容】
2022-01-17  代码工场聊开发    Tags:流调   点击:(25)  评论:(0)  加入收藏
小伙们经常听到这样一句话:“数据分析师一定要懂业务!”那到底啥玩意才是业务?懂多少才算懂业务?今天跟大家分享一下。一、什么是业务?业务是相对于技术和行政来说的,是企业里一种...【详细内容】
2022-01-07  数据分析不是个事儿    Tags:数据分析   点击:(14)  评论:(0)  加入收藏
今天来讲讲数据大屏自适应如何实现。 我们知道,根据不同的业务场景,做一个好的大屏需要考虑大屏布局、图表展现、交互动效、操作是否简单、是否能自适应等等因素。其中大屏是...【详细内容】
2022-01-07  思迈特软件Smartbi    Tags:数据可视化   点击:(17)  评论:(0)  加入收藏
数据是时代发展与科技进步的产物,也是当下时代最重要的生产要素之一。要让数据进入市场实现经济效益,需要明确界定所有、支配、使用、收益、处置等产权权能的完整技术和规则要...【详细内容】
2021-12-31  CyborgGoody    Tags:GoodData   点击:(9)  评论:(0)  加入收藏
作者:俊欣来源:关于数据分析与可视化大家好,又是新的一周,也是2021年的最后一周,今天小编来和大家说一说怎么从DataFrame数据集中筛选符合指定条件的数据,希望会对读者朋友有所帮...【详细内容】
2021-12-30  CDA数据分析师    Tags:Pandas   点击:(17)  评论:(0)  加入收藏
前言什么是数据脱敏数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护常用脱敏规则替换、重排、加密、截断、掩码良好的数据脱敏实施1、尽...【详细内容】
2021-12-28  linyb极客之路    Tags:数据脱敏   点击:(20)  评论:(0)  加入收藏
张欣安科瑞电气股份有限公司 上海嘉定 201801 摘要:随着电力行业各系统接入,海量数据涌现,如何利用电网信息化中大量数据,对客户需求进行判断分析,服务于营销链条,提升企业市场竞...【详细内容】
2021-12-14  安科瑞张欣    Tags:大数据   点击:(20)  评论:(0)  加入收藏
1、什么是数据分析结合分析工具,运用数据分析思维,分析庞杂数据信息,为业务赋能。 2、数据分析师工作的核心流程:(1)界定问题:明确具体问题是什么;●what 发生了什么(是什么)●why 为...【详细内容】
2021-12-01  逆风北极光    Tags:大数据   点击:(40)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条