筛选可能与心理健康一样糟糕…土豆


心理学家似乎无法做到 同意什么技术对我们的幸福感有所帮助。有人说数字设备已成为现代生活的祸根;其他人声称他们对此很有吸引力。他们之间存在一种不共识的阴影:作为美国国立卫生研究院最近告诉国会的主任,对技术对我们的思想,行为和发展的影响的研究已经产生了有限且往往相互矛盾的结果。

好像这种不确定性不够令人烦恼,其中许多发现来自同一个来源:巨型数据集汇集了数千甚至数百万参与者的调查数据。 “问题在于,两位研究人员可以查看相同的数据并获得完全不同的社会发现和处方,”牛津互联网研究所研究主任,心理学家Andrew Przybylski说。 “技术乐观主义者倾向于发现正相关。如果他们是悲观主义者,他们往往会发现消极主义者。”

在最新一期 自然人类行为Przybylski和他的合着者Amy Orben使用一种新颖的统计方法来说明为什么研究这些巨大数据集的科学家们已经得到了如此不同的结果,以及为什么研究人员发现的大多数协会,无论是正面的还是负面的,都非常小 – 可能不值得吓到。

考虑千禧年队列研究。该调查正在对20多万美国人的长期健康结果进行持续调查,其中包含数十个问题,研究人员可以合理地解释这些问题与一个人的福祉相关。这些问题涵盖的主题与自尊,自杀念头和整体生活满意度完全不同。 “但不同的研究人员对幸福感有不同的看法,可以选择不同的问题来适应这种观念,”奥本说。

无论他们是否意识到这一点,选择只专注于某些问题的研究人员决定在排除许多其他问题的情况下追求一条分析路径。多少?在MCS的情况下,将调查中关于福祉的问题与诸如电视观看,视频游戏习惯和社交媒体使用之类的问题相结合,产生了研究人员可以采用的总共603,979,752个分析路径。将它们与针对研究参与者护理人员的问题相结合,这个数字可以达到2.5万亿。

当然,这2.5万亿个结果中绝大多数都不是那么有趣。但是这些数据集的庞大性质允许出现在技术上具有统计意义但非常非常小的关联。在科学中,大样本量通常被认为是一件好事。然而,当你将主观调查问题提供的大量分析路径与大量的调查参与者结合起来时,它为像p-hacking这样的统计技术打开了大门 – 钓鱼的做法可以在大量数据中获得有利的结果。

Przybylski说:“研究人员基本上会对这些数据进行折磨,直到它们给出了他们可以发布的统计上显着的结果。” (并非所有报告此类结果的研究人员都是为了欺骗。但研究人员是人;科学作为一个机构可能会争取客观性,但科学家却容易受到偏见,这些偏见可能使他们无法滥用数据。)“他们想要通过这种统计学的挑选。所以我们决定寻找一种数据驱动的方法来同时收集整个果园。“

他和Orben在统计工具中发现了这种方法,称为规范曲线分析。 SCA不是通过千禧年队列研究调查单一的分析路径,而是让他们调查了20,000个。它还允许他们通过另外两个大型数据集探测所有41,338条路径,这些数据集称为监测未来和青年风险与行为调查,这些数据集通常用于评估数字习惯与青少年幸福感之间的关联。

结果是一系列可视化,映射了研究人员可以在三个储存库中检测到的广泛的潜在影响,并揭示了几个重要的事情:一,分析方法的微小变化可能导致沿该范围发生的显着不同的发现。二,技术使用与幸福之间的相关性是负面的。三,这种相关性非常非常小,解释了 – 最多 – 青少年福祉变化的0.4%。

为了正确看待,研究人员将技术使用和青少年福祉之间的联系与大规模数据集检查的其他因素进行了比较。 Przybylski说:“使用技术与吃马铃薯有关。”换句话说:几乎没有。根据相同的逻辑,欺凌的效果大小是屏幕使用的四倍。吸烟? 18次。相反,获得足够的睡眠和吃早餐与青少年幸福感正相关,分别是技术使用的44倍和30倍。

换句话说:技术对福祉的影响可能具有统计意义,但根据现有数据集,其实际意义似乎可以忽略不计。 “本研究中记录的关联程度与我们在屏幕时间等问题上看到的恐慌程度不一致,”加利福尼亚大学欧文分校心理学家Candice Odgers表示,他研究技术如何影响儿童的发育,并且与研究无关。 “这真的突出了公共领域的对话与大部分数据向我们展示的内容之间的脱节。”

这项研究没有做的就是关于技术效果的问题。相反,它突出了更多细微问题的必要性。并非所有的屏幕时间都相同,但迄今为止的大多数研究都将其视为单片。 “这就像问你的食物是好还是坏,最后,这样的问题永远无法帮助我们,”奥本说。 “我们需要停止关于通用技术使用对福祉的影响的讨论,以及开放空间,以便更多和更好地研究人们正在使用的技术类型,谁在使用它们,以及如何使用它们。”


更多伟大的有线故事