中国民间有一个“七十三,八十四,阎王不请自己去”的说法,说在这两个年龄上的人更容易去世。这个定律从直觉上就不太可能是对的。我们设想,应该是因为孔子和孟子分别死于这两个年龄,人们认为这是人生中的两道大关,然后每当听说有人在这个年龄去世都会进一步加深印象,以至于总结了这个纯粹是错觉的定律。
曾经有研究报道认为这是一个“科学家验证”了的规律:发现“人的生命有一个周期性的规律,大致是7~8年为一个周期”,而73和84岁正是这个周期的低潮。
但是问题是,把“能找到一个理论解释”,当成判断一个学说是否科学的标准——如果能用理论解释,它就是科学验证了的吗?
绝学与证据
不管你用来解释的理论对不对,这都是一个错误的判断标准。能用理论解释的结论未必正确,不能用理论解释的结论未必错误。古代文人的思维习惯,是遇到无法判断对错的局面就查经典,想获得理论上的指导。
科学家的方法则要朴素得多:你直接用事实验证一下不就行了么?我们根本不需要任何学派的任何医学知识,甚至不需要什么逻辑推理,只要随便找个死亡年龄分布数据就会发现73岁和84岁并不比其临近年龄更容易让人死亡。
73岁和84岁并不比其临近年龄更容易让人死亡。图片来源:pixabay
古人说“为往圣继绝学”,很多现代人也追求用某种特定理论来指导实践,而科学家强调的则是事实。有人指责科学家说你们只相信现代科学理论难道不也是一种迷信么?但科学家其实不迷信任何理论——很多情况下他们完全用不上什么绝学,唯一做的事情就是把事实搜集在一起,就好像集邮一样。只要有证据,反驳一个理论是非常简单的事情。
张载(年-年12月6日),“为往圣继绝学”出自他的“横渠四句”。图片来源:wiki
但是要想用证据建立一个理论,则要困难得多。只有运气好的时候,科学家才能在大量事实中发现一些有趣的规律,以至于可以向形成科学理论的目标前进一步。
相关性思维
最简单的规律叫做“相关性”。人是如此复杂的东西,我们在根本没办法精密计算各种物质致癌的概率,比如说吸烟对肺癌的作用。科学家常用的是没有什么技术含量,不需要任何高科技仪器,更谈不上什么门派的办法:他们直接调查吸烟人群和不吸烟人群的肺癌发病率。
科学家通过调查吸烟人群和不吸烟人群的肺癌发病率判断吸烟对肺癌的作用。图片来源:pixabay
这种研究要把被调查的人分组,比如分成两组:得了这种病的患者一组(叫病例组,case),没有这种病的人一组(对照组,control)。然后考察这两组人在生活习惯上和饮食、吃药方面有什么不同。如果你发现患有肺癌的人中烟民比例显著地高于没有肺癌的人,你就得到了肺癌与吸烟的一个正的“相关性”。这个方法很简单,得到的证据却是强硬的。睡眠时间与判断力的关系,孕妇焦虑与小孩任性的关系,出生季节与平均寿命的关系——我们看到的大量科学新闻本质上都是相关性研究。
相关性研究只是科研的初级阶段。但就是这样它也已经超越了我们的思维本能。某些人只要被某地区生产的产品坑过一次,就会认为这个地区的所有产品都不好,他们的发现连相关性都算不上。我们每天看到铺天盖地的各种营养品的广告往往都能找到几个用户出来现身说法,可就是没有一个疗效相关性的数据。“一朝被蛇咬十年怕井绳”,是人这种动物的最自然思维,而使用大规模统计发现实在的相关性这个最简单的科学方法,是我们摆脱童稚状态的第一步。
绝大多数人没有相关性思维。比如在一篇讨伐网瘾的文章中,作者援引“戒网专家”陶宏开的数据说,中国80%的青少年犯罪与网瘾有关,中国20%的网瘾少年有违法犯罪行为。
网络成瘾症,亦作不当网络使用或病态网络使用,简称网瘾,泛指对于互联网的过度使用,以致影响日常生活。图片来源:pexels
我们能否根据这些数字得出结论说网瘾人群比没有网瘾的人群更容易犯罪呢?
不能。我可以构建这么一个国家,这个国家80%以上的青少年有网瘾,而这个国家的所有青少年,不管有没有网瘾,都有20%的犯罪概率。这个虚拟国家完美符合以上数据,但是它的犯罪与网瘾完全无关。实际上,如果你把“网瘾”改成“钱”,甚至“空气”,那么我们可以说“中国xx%的青少年犯罪者都缺钱/需要空气,中国yy%的缺钱者/需要空气者有犯罪行为”,而缺钱和需要空气不是毛病。
这个错误就是没有建立对照组。我们缺少的关键数据是没有网瘾的青少年的犯罪率,以及没有犯罪的青少年的网瘾率。这是一个非常常见的错误。这就好比说列举再多“发达的民主国家”,也不能说明民主与发达的相关性,你还必须统计那些不发达的民主国家、不民主的发达国家、和既不发达也不民主的国家。
怎样发现因果?
发现相关性,已经是一个足够发表的科学成就,但相关性结论并不能指导实际生活。假设我用无可质疑的统计事实告诉你“吸烟的人更容易得肺癌”,而你不想得肺癌,那么你是否能推论出应该因此戒烟呢?
还是不能。因为你无法从“吸烟的人更容易得肺癌”,和“肺癌患者大部分都爱吸烟”这两个统计得出“吸烟导致肺癌”这个因果。也可能肺癌导致吸烟,比如说也许癌变的肺会使人对烟产生需求。也可能存在某种基因,这种基因会使得一个人天生就容易得肺癌,而这种基因同时还让一个人天生就喜欢吸烟。也可能吸烟的人往往是喜欢深夜工作的人,是深夜工作导致肺癌。也可能吸烟的人往往是经济状况比较差的人,其居住环境和营养不行,是贫困导致肺癌。
因为你无法从“吸烟的人更容易得肺癌”,和“肺癌患者大部分都爱吸烟”这两个统计得出“吸烟导致肺癌”这个因果。图片来源:pexels
中国青少年网络协会和中国传媒大学调查统计研究所发布的《年青少年网瘾调查报告》是一份值得发表的研究,因为其中给出了一些明确的相关性数据,比如:
自我评价学习成绩越不好的在校学生中,网瘾青少年的比例越高。认为自己“成绩较差”的学生中,网瘾青少年的比例达到28.7%,认为自己“成绩一般”的学生中,网瘾青少年的比例为14.5%。而自我评价“成绩很好”和“成绩较好”的学生中,网瘾青少年的比例均在11%左右。
那么根据这份报告我们能否得出结论说网瘾是个坏东西呢?
不能。也许并不是因为网瘾导致青少年成绩差,而是那些成绩差的青少年更容易得网瘾。报告没有统计网瘾与犯罪率的关系,但就算真的是越有网瘾的人群越容易犯罪,我们仍然不能说网瘾导致犯罪。比如我可以提出这么一个假说:
我认为网瘾是个好东西,因为它可以减少青少年犯罪。在任何国家的任何时候,都一帮青少年对学习不感兴趣,整天无所事事。他们喜爱在街上游荡,都是潜在的犯罪者。因为网络游戏的出现,相当一部分这样的人被留在了家中和网吧里,他们的野性在游戏中得到了发泄,以至于减少了出去犯罪的欲望和时间。
报告和前面提到的所有统计数字都无法反驳我这个假说。我甚至可以用这份报告支持我的假说。报告中提到一个有意思的统计是“在社会经济发展水平低的城市,网瘾青少年的比例更高”,这正好可以说明无所事事的人更容易得网瘾。
想要明确证明吸烟导致肺癌,唯一的办法是做实验。找完全相同的两组健康的人,让其中一组吸烟另一组不吸,其它各方面生活都完全一致。20年之后如果吸烟组中的肺癌患者数高于不吸烟组,那么鉴于这两个组的唯一区别就是吸烟,我们就可以断定是吸烟导致了肺癌。
想要明确证明吸烟导致肺癌,唯一的办法是做实验。图片来源: