从交通、安全、气象到身边的快递、广告、电子商务,大数据已经成为任何一座城市都离不开的基础设施。其实,在科学研究领域,大数据也产生了很大影响,心理学的研究也因其发生了改变。
目前,心理学教科书普遍认为,第一个专门用于收集数据的心理学实验室是心理学家冯特于1879年在莱比锡大学建立的。从那时起,心理学研究者都在“苦苦”地收集心理学的实证数据,以支持自己的心理学观点。
心理学家想要分析的人类行为的数据并不是那么容易获取到的,这里面涉及诸多困难。心理学领域曾一度“数据为王”,掌握稀缺的数据就站在了心理学的前沿。比如,对于较早获得脑功能成像技术的心理学研究者来说,脑功能成像数据使他们在脑神经这个心理学研究方向上取得领导地位。如今,科学家们又站在了大数据的“风口”,大数据能给心理学带来什么呢?
数据之“大”
大数据的可用性在许多领域越来越普遍,但是,何为大数据?尚未有很清楚和很严格的定义。
我们可以通过三个关键特征来定位大数据。第一个特征是数量。大数据的数据集比其他数据集大得多,以致可能导致存储和分析问题。第二个特征是速度。这意味着数据以高速率出现或必须在短时间内处理(例如,实时和交互式处理)。第三个特征是多样性。它可能是结构化的,也可能是非结构化的,包括文本、图片、视频和数字等。这三个特征对数据的处理能力都有很高要求,这也是为什么“大数据”概念在今天越来越凸显,它依赖于数据处理硬件和软件的发展。
除了上述特征,还有一个大数据的非限定性特征,即准确性。这是从数据的质量或真实性进行的定义。大多数大数据都具备这个特征。这些数据可能涉及人的真实生活的方方面面,让人无以遁形。这就是为何大数据时代的我们感到越来越难以保护自身隐私,人的生理、心理和行为都会有意无意地被记录下来,成为大数据的一部分。
心理大数据在哪里
如果说人为控制的小型实验室在过去长期主导了人类心理学的研究,那么今天的社交媒体和其他个人相关的数据端口则提供了一个活跃的超大型实验室。这些端口每天都在记录着世界各地数十亿人的语言、图片和行为。
与心理学相关的大数据可以包括社交媒体数据,健康/生理跟踪器数据、地理定位数据、动态公共记录、旅行路线数据、网购和消费数据,行为和遗传数据。
人们在社交媒体,例如脸书、微博和微信上产生的语言数据给研究者提供了前所未有的研究机会,因为其数据量极大,而且还具有实时性、互动性和关联性等特点。社交媒体上人们的个性化表达行为,比如头像和个人资料等,都提供了个体的身份信息。社交媒体上个体发布的动态和位置定位等,又提供了实时的个体行为轨迹及其与其他社会性或地理性信息的关系。这无疑是一个丰富的人类行为样本的数据源。
此外,人们佩戴的运动手环等收集生理数据的器件也会上传大到活动路线小到心率的生理数据到云端。生物医学机构也会记录人们的遗传和健康数据。这些数据源一旦打通,那么社会中每个个体的行为和生理信息将联合提供一个详细的对个人的描述。借助自然语言处理的技术,心理学家可以访问、获取和量化原始的语言数据以备描述人的心理和预测人的行为。
心理大数据的发现
大数据尤其擅长回答人们可能不愿意在调查中回答的问题。心理学研究者可以从中窥见更加真实的信息。
比如,在性取向方面,之前的研究发现不同地区的男性所报告的同性恋比例存在很大差异。在美国,相比于密西西比州,罗德岛的男性在调查中更多地报告自己是同性恋。有解释说,这可能是由于罗德岛的文化氛围对性取向问题更加宽容,而密西西比州更加保守,因此更多男同性恋搬到了态度包容的州定居。
一位名为斯蒂芬斯·大卫德威茨的学者用脸书数据尝试验证这个解释。他根据脸书的个人资料,将自我认定为同性恋的男性的出生地和他们迁居的目的地建立联系,发现从不太宽容到更宽容的地方有一定趋势,但仍未能解释调查中看到的巨大地区差异。
为此,他又用谷歌的数据来跟踪人们的搜索轨迹,并取得他们进行搜索时的位置信息。结果发现,男性对色情内容的搜索中有大约5%是男同性恋色情内容,而且在每个州都大致如此,并没有明显的地区差异。这说明,不同地区的男同性恋者可能并没有比例差别,文化因素对男同性恋者的居住地选择也并非想象中那么大。可能这主要还是由于不同地区的男性在自我表露上的深度不同。
心理大数据也可用于解决无法以其他方式回答的研究问题。比如,梦的神秘不只在于它的内容和形式,也在于它难以观察和研究。经典的精神分析学派创始人弗洛伊德认为梦是通往人的潜意识的途径,因而对梦进行了“复杂”的解析。但是,大数据提供了另一种探索它的途径,显得更加“简单”和直接。
比如,弗洛伊德认为,梦可能象征性地揭示无意识的性欲。梦中的香蕉或黄瓜可能是阴茎的替身。我们很难反驳这样的理论,因为弗洛伊德所讨论的欲望是无意识的。这意味着,即使人们在意识层面谈论他们的梦,但根据定义,他们却无法知道梦的真正意义。
有些手机应用提供与梦相关的服务,从而记录了很多用户的每天梦境信息。为了从大数据来研究,斯蒂芬斯·大卫德威茨从这些手机应用取得人们的梦的内容数据,并与这些人的其他生活数据建立关联,统计哪些因素最能预测梦中食物出现的频率。结果与弗洛伊德的理论预测并不相符,最能预测某种食物的出现频率的是个体在日常生活中食用该食物的频率。
因此,似乎并非对性的欲望造成香蕉和黄瓜出现在梦里,而是它们本身就常常出现在我们生活中。比如,梦中最常出现的蔬菜中,黄瓜是排在第七位的,而在日常生活中,黄瓜也是第七大最受欢迎的蔬菜。
在这项研究中,弗洛伊德关于梦的心理动力学理论并不被大数据所支持。换句话说,日有所思夜有所梦。心理学研究者多姆霍夫提出的认知神经梦境理论认为,大部分梦的内容都是对日常事件的真实反映。这是因为白天意识清醒状态下活跃的脑区在睡梦中仍然保持一定活性。
尽管未来会出现很多“大数据+心理学”的研究,比如“大数据+梦的研究”或“大数据+性的研究”。但是,在可以预见的范围内,它不会取代传统的科学心理学研究方式,比如实验室研究或问卷调查研究。因为许多心理和行为的因果关系和预测控制的探索还是需要实验室研究。但是,心理大数据的出现确实成为了解人们行为的重要工具。