但是,在我们的假设性的模型中,蛋白质摄入水平和癌症发病率之间有关联关系,并不能说明蛋白质是导致癌症的病因。我知道这一点比较难理解,请允许我举例来说明这一点。在有些国家,电线杆密度比较大的地方,通常也是心脏病或是其他疾病的发病率比较高的地方,我们说电话线密度和心脏病的发病率之间是存在相关关系的,但这并不说明电话线是导致心脏病发病的原因。实际上,相关性并不等于因果性。
但这并不是说相关性是个没有用处的概念。如果阐释合理的话,相关性可以有效地用于营养和健康关系的研究。举例来说,《中国健康调查报告》中一共得到了8000组具有统计学显著意义的相关关系,其价值是无可估量的。当这么庞大的数据都具有某种相关性的话,研究人员就可以凭此来确定营养和健康之间存在着什么样的关系模式。而这种模式,反过来说,可以用于揭示膳食和健康相互作用和影响的过程。这个过程是相当复杂的,如果一个人真的想找出单原因导致单结果的模式,仅仅具有相关性是远远不够的。
统计学显著性
你可能以为,判断两个因素之间是否存在相关性——相关或是不相关是很容易的,但事实并非如此。当你手头有大量的资料,你进行统计学分析,确定两个因素之间是否具有关联性,这个问题的答案不能用是或者否来回答,它是一种可能性。用一个术语讲,这种可能性的大小被称为“统计学显著性”。统计学显著性用于说明观察到的试验现象是否真实可信,或者仅仅是偶然发生的。如果你抛三次硬币,每次都是有头像的一面朝上,这是个概率的问题。如果你抛100次硬币,每次仍然是有头像的一面朝上,那么你可以比较有把握地说这枚硬币的两面都是头像。这就是统计学显著意义的意义——关联关系(或其他结论)真实存在、而不是偶然发生的可能性是多少。
我们说,某项资料和结果具有统计学显著意义,是指由于偶然因素造成这种结果的概率小于5%,举例来说明,就是你重复同样的实验,有95%的可能性都得到相同的结果,这样的结果具有95%的统计学相关意义。95%这个截点是人为规定的,但确实是一个广泛接受的标准。另外一个人为规定的截点是99%,这种情况下,结果吻合测试达到99%的时候,我们说具有高度统计学显著性。在我们有关膳食和疾病的讨论中,统计学显著性会经常出现在书中,这是我们评价资料可靠性的重要依据,称为证据的“可信度”。
作用机制
很多情况下,如果有其他研究结果证明,两个相关因素在生物学上也是相关联的,往往认为相关性是更可靠的。举例来说,电线杆的密度和心脏病的发病率之间存在相关性,但是并没有研究表明,电线杆怎样通过某种生物学机制与心脏病联系起来。但是现在已经有研究证明,蛋白质的摄入过程和肝癌发病过程之间在生物学上和因果关系上是相关联的(见第三章)。了解某种物质在人体内是如何发挥作用的,我们称此为作用机制。而了解其作用机制则会强化证据。换言之,这即是两个相关因素以一种“生物学上合理的”方式相关联。如果相关在生物学上是合理的,这种相关则被认为是很可靠的。
元分析
最后我们来理解一下元分析(metysis)这个概念。元分析是指将多个研究的多组数据整合为一组数据进行分析。通过整合分析大量的资料,可以使结果具有更高的可信度,结果也更具有说服力。尽管和其他的事情一样,例外的情况总是存在的。
从多个研究中得到结果后,我们可以使用某些工具和概念去考察这些证据的可信度。通过这些努力,我们可以知道哪些东西更接近于真实的情况,我们可以根据结果来作出适当的判断。如果其他假说不太可能,我们对得到的结果就会非常有信心。从纯技术的角度来说,绝对证据是无法得到的,也是不重要的,但是出于常识的证据是可以得到的,也是非常关键的。通过这样的过程,我们能对吸烟和健康的关系进行正确的分析,从而得到一个正确的结果。吸烟不会100%地导致肺癌,但是说吸烟和肺癌绝对没有关系,那却是非常荒谬的,再花时间研究这样的结论是没有意义的。
第三章 关闭癌症表达
在美国,癌症是一种令人谈虎色变的疾病。美国人对癌症的恐惧程度超过了其他任何一种疾病。躺在病床上,被病魔折磨长达数月甚至数年,最终离开人世,是多么悲惨的一种情景啊。这就是为什么癌症是最让人恐惧的疾病。
因此每次媒体报告说发现了一种新的化学致癌物,公众都会毫无例外给予强烈的反应。有些致癌物甚至造成异常的恐慌。几年前的丁酰肼事件就是一个鲜活的例子。丁酰肼是喷在苹果上的一种常见生长调控剂。自然资源保护委员会(NRDC)发表了一篇题为《无法容忍的危险:儿童食品中的杀虫剂》的报告1。报告发表后,有些电视栏目,如《60分钟》,还为此专门制作了专题节目。1989年2月,NRDC的一位代表在CBS的《60分钟》节目中声称:食品供应中苹果生产业中使用的这种化合物是最强的致癌物。2,3