“21世纪什么最贵?”
20年前,这个问题的答案是“人才”,今天,这个问题有了新的答案,那就是“数据”。
在这个电子产品不离手的年代,只要连接了网络,我们就在留下行为数据,作为全球资本主义的生命线,数据就是金钱。
那么,数据到底有多值钱?举个例子,同样是做图片的,具有社交属性的Instagram以10亿美元出售时,成立于1881年的世界最大影像产业柯达,正申请破产。几十年河东几十年河西,这正是时代飞速变化导致的结果,识时务者为俊杰。
时间回到一百六十年前,第一条横跨大西洋的电报,沿着海底电缆从英国来到了美国,它虽然一共只由21个单词组成 ,最终却花了17个小时才到达美利坚。
一百六十年后的今天,“每一秒钟就有543TB的数据流过国界,其总数据量相当于约1300万份莎士比亚全集”。
人类已经进入了“大数据时代”。
而最早提出“大数据”时代到来的,是全球知名咨询公司麦肯锡,麦肯锡这样描述:“数据,已经渗透到当今每一个行业,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
那么,既然叫大数据,这个数据到底有多大?
一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD,发出的邮件有2940亿封,相当于美国两年的纸质信件数量,发出的社区帖子达200万个,相当于《时代》杂志770年的文字量,卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……
这决定了大数据的4V特征里的第一个特征:数据量大(Volume)。
大数据的起始计量单位至少是PB,我们在互联网时代都熟悉GB,那么啥是PB?1PB=1024x1024GB,可想而知大数据的量有多大。
类型繁多(Variety),是大数据的第二个特征,这些数据包括文字、音频、视频、图片、地理位置信息等。
价值密度低(Value),是大数据的第三个特征,数据如此海量,这导致有价值的信息密度越来越低,数据提纯成了亟待解决的问题。
这就促使了云计算的产生,未经加工的数据就仿佛一盘散沙,“加工”是使数据增值的重要步骤,实现聚沙成塔的就是云计算。而想要实现云计算,就必须有超级计算机的加持,这些设备体积庞大,耗能巨多,维护成本昂贵,难以在一二线城市找到容身之所。
直到马云和马化腾发掘了一片宝地——具有“避暑之都”美称的贵阳,这里不仅能源充足,电力便宜,同时这里身居祖国内陆,还有许多山洞,山洞里恒温恒湿,保密性也绝佳,阿里云、腾讯云、苹果亚洲最大数据中心,纷纷在这里落户。贵阳的房价也因此节节攀升。
而云计算也决定了大数据的第4个特征,那就是速度快、时效高(Velocity),通过云计算,海量的数据被归纳整理起来。
在这样的大数据时代。我们的生活前所未有的高效便利,殊不知,我们的信息正被大佬们研究利用。
2016年,一家名叫Cambridge Analytica的数据分析公司,通过为脸书平台开发的性格小测试程序,收割了超过5000万的用户数据。并且,利用这5000万用户操纵了这一年的美国大选。
不知道是否该投票给特朗普,Ok,给你推送希拉里的负面新闻,向你灌输希拉里不行的概念,再坚定的吃瓜群众,都会在日复一日的不经意洗脑中倒戈,这就是著名的脸书丑闻,扎克伯格也因此被大众唾弃。
在大数据时代,大到总统选举,小到你经常骑共享单车去哪里,数据公司对我们了如指掌。
他们收集用户的个人基础信息、点赞、社交圈、消费习惯,并将这些信息建立成模型,从而猜测我们的喜好,预估我们的行为,这个过程,叫做用户画像。
于是,算法推荐开始了。
一个宠物控在给萌宠视频点赞后,他的视频软件将给他推荐上百个同类型视频,如果不小心在购物网站看了一些奇怪的东西,你的购物软件将惨不忍睹,或者午餐前讨论了要吃顿小烧烤,打开外卖页面时,赫然出现了烧烤串吧,这种推荐机制导致人们习惯性地被自己的兴趣所引导,每天接收的信息范围被人为缩小,从而被困进了信息茧房。
信息茧房是指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”
甚至一直在取悦你的算法推荐,也开始杀熟,然而,比杀熟更可怕的,是信息泄露。
当你用某地图导航去了一家医院,你可能会发现手机里多了许多医疗广告,当你正打算寻找一家靠谱的留学机构,你可能会接到众多骚扰电话,当你正其乐融融地合家团聚,你妈可能突然接到你出车祸的消息。
当你的姓名住址亲人爱好被扒得精光,你早已裸奔在大数据铺就的路上,隐私被抛得一干二净了。
这是最好的时代,也是最坏的时代,我们找不到真正的自己,我们防不胜防,我们的视野被控制在大数据为我们预设的轨道里,早已沦为大数据的提线木偶。