用兄弟姐妹研究母乳喂养的效果,错了吗?

2016-03-25 作者: 特约作者 原文 #政見 的其它文章

用兄弟姐妹研究母乳喂养的效果,错了吗?

图片来源:Flickr – Mothering Touch

政见编者按 昨天我们推送了一篇关于母乳喂养的文章,引发了不少的讨论。知乎 “数据帝” chenqin 老师也撰文讨论了该文的研究方法。感谢 chenqin 老师授权我们在此刊发此文,供有兴趣的读者对 Sibling Comparison(也即用兄弟姐妹做研究) 这种方法获得更多的了解。同时,我们也在文末对 chenqin 老师的意见做了简单的回应。

除了 chenqin 老师从方法上提供了批评意见之外,还有一些读者指出:昨天那篇文章的研究者忽略了母乳喂养对于母亲的积极作用,例如降低乳腺癌风险。母乳喂养事关孩子的成长和母亲的幸福,更多的研究和讨论是必要的。我们欢迎更多朋友加入讨论,有意撰文论述可发送至:webmaster@cnpolitics.org

作者:chenqin
原文链接:http://zhuanlan.zhihu.com/chenqin/20672763 </br>

今天,我读到了政见发布的文章 《母乳喂养好?不一定!》。

这篇文章说的是,在研究母乳喂养对子女是不是有好处时,传统的研究直接找到一群吃母乳长大的孩子,再找一群吃奶粉长大的孩子,然后比较他们的身体发育状况、健康状况和智力水平。然而,这种研究方式忽略了一点,即导致孩子成长得更好的,很可能根本不是母乳,而是因为采用母乳喂养的家庭家境本来就更好。

为了改进这种方法,研究者找到了同一个家庭的兄弟姐妹来进行研究。他们认为,这些来自同一个家庭的兄弟姐妹,有些是母乳喂养大的,有些不是,但除此之外,他们的成长环境可以被认为是相同的。如此一来,通过比较同一个家庭内部被哺乳和没被哺乳的孩子,就能在很大程度上排除家庭经济条件的干扰、观测母乳喂养本身的效果。

这一类研究方法,叫做 Sibling Comparison,即「兄弟姐妹比较研究」,一些研究者声称这样的方法能够去除那些在家庭之间的不可观测因素造成的差异,得出更加干净的识别结果。用 Sibling Comparison 作为关键词在 Google Scholar 上搜索,共有 279000 篇文献,其中 2010 年之后出现的文献共有 29100 篇,可见 Sibling Comparison 算是一种比较常见的研究方式了。

但是,在很多情况下,不进行严谨的研究设计,用 Sibling Comparison 进行的研究只会事与愿违,造成更大的偏误,得到更不干净的识别结果。

回到一开始的选择:我们为什么不简单地进行家庭间比较,而要费力地进行兄弟姐妹间的比较呢?这是因为,家庭间的比较会包含许多不可观测因素进去。例如,在母乳研究中,父母的育儿知识等因素都会影响母乳喂养的时间,而同时也可能会影响孩子的生长发育;而且更糟糕的是,育儿知识这样的变量我们一般来说是无法识别的,也就不能判断母乳与否的孩子健康之间的关系到底来自于哪种因素。

而家庭内部的兄弟姐妹比较,则把这些不可观测的变量 (例如父母的育儿知识) 给大致控制住了,因此在控制住所有背景之后,兄弟姐妹之间的健康差异,很可能就完全来自母乳喂养的差异了。

这个推论里,漏了什么?

让我们举一个有一些极端的例子来帮助理解。例如,我要证明「穷养的孩子更加有 / 没有出息」,一种方法是找到背景相似的家庭,一家穷养,一家富养,然后控制各种变量,看两家的小孩最后表现如何。另一种方式,是找到一家人的子女,其中一个穷养,另一个富养,然后看兄弟姐妹的表现差异。

但仔细想想,如果一个家庭中存在着如此明显的穷养富养差别,很可能代表着这个家庭对子女存在偏好,而这对研究来说是致命的。很简单,一个穷养女儿的家庭,可能是因为这个家庭的观念就是要穷养小孩,也可能是因为他们重男轻女不想好好养女儿;然而一个穷养女儿却又同时富养儿子的家庭,这么差异化对待的原因就几乎肯定是因为重男轻女。

此时,我们用前一种传统方法,至少还能估计出一些 “穷养” 和 “富养” 带来的效果差异,但用后一种方法,我们估计出的效果就可能全都来自于重男轻女——Sibling Comparison,看似控制住了一些不可观测变量,却实际上产生了更大的不可观测变量,得到了偏误更大的结果。

为了避免这种情况,让 Sibling Comparison 达到预想的效果,可以有两种方法。

第一种,是让兄弟姐妹的差异无关父母对子女的偏好,而是由一个随机的外力冲击所致。比如,哥哥高考时,高考录取率很低;而第二年,弟弟高考时,一下子扩招了,高考录取率提高了十倍。那么这样的 Sibling Comparison,就能识别出扩招带来的效果,因为父母本身并无法决定什么时候生出的孩子会碰上扩招。

第二种,是让父母偏好的影响本身就纳入你的研究范围中。例如,你本身就是想研究重男轻女的效应。我与合作者的一篇研究就是建立在这个前提上的,我们研究的本身就是父母对子女态度不同对他们未来的影响,此时使用 Sibling Comparison 反而是上佳选择。

除此之外,我看不出 Sibling Comparison 比起普通的家庭间研究有任何优势,在很多情况下,这只会埋没整个研究的贡献。

比如,你用 Sibling Comparison 研究教育回报率。你发现,一个家庭内,哥哥上了本科,收入 1 万;弟弟上了初中,收入 3000。于是你写了一篇文章,说每增加一年教育,会带来 1000 元的额外收入,而且这个研究消除了家庭之间的不可观测差异,哥哥弟弟的社会经济背景是很类似的,结论非常可靠,你信心满满。

那么审稿人就问了,这个收入差异,会不会不仅来自于教育差异,也来自于父母偏好不同呢?比如父母更喜欢哥哥,所以让弟弟辍学供哥哥上学,还强迫弟弟从事没有成长性的低技能工作来保证家庭运转和哥哥的学费,那自然弟弟的收入会很低。

于是你花了 10 页纸来说明,虽然哥哥上学年限比弟弟多,但是弟弟是因为没考上高中才辍学的,并不是父母要求弟弟辍学,哥哥和弟弟之间没有父母上的偏好差异。

审稿人又问了,那会不会是因为父母更喜欢哥哥,所以总让哥哥在家好好学习,哥哥才能上大学,而弟弟总是干农活,所以成绩不好才没考上高中呢?

于是你又花了 20 页纸,找到了历史营养数据,说明哥哥和弟弟摄入的能量一样多;你找到了时间花费数据,说明哥哥和弟弟花在干农活和学习上的时间比例一样多,所以弟弟考不上高中,并不是因为父母偏爱哥哥。

审稿人又问了,虽然看起来哥哥弟弟收到的待遇类似,那会不会是因为母亲原来就只想生一个,不想生第二个,所以在怀上弟弟时又抽烟又喝酒,不在乎胎儿健康,造成弟弟出生时就先天不足呢?

于是你只好长叹一声,离开学术界,哦不,放弃 Sibling Comparison 了。

我们的回应

王绍达 / 政见观察员

昨天,政见推送了文章 《母乳喂养好?不一定!》,随后,陈老师撰文 《sibling comparison 在何时才是对的》 进行讨论。

对于陈老师文中的核心观点,我表示赞同:是否进行 sibling comparison 与能否得到一个正确的因果推断本身没有直接的关系。实际上,仅从 (简约式的) 因果推断的角度而言,不论是做跨国比较还是像本文一样在一个家庭内部进行比较,真正决定因果推断质量的核心因素都只有一条,即 “最终用来作比较的这些对象,它们之间在自变量上存在的差异,究竟是否近似于随机产生,或者是否在控制住一定条件以后近似于随机产生”。因此,就像陈老师指出的那样,如果在同一个家庭内部,不同子女之间谁能够得到母乳喂养并非随机分配,则这种比较并不能带来一个正确的因果推断。

另外我还想补充的是,当作比较的范围被不断缩小,研究者最终使用的很可能只是全样本中很特殊的一小部分,从而丧失了对总体的代表性。比如在本文这样的 sibling comparison 当中,那些没有多个子女的家庭,以及那些虽然有多个子女、但不同子女在是否母乳喂养上不存在差异的家庭 (都母乳喂养或都不母乳喂养),实际上都没有对结果的产生做出实质的贡献。如果我们认为上述两种家庭与那些 “多子女、并有且只有部分子女得到母乳喂养” 的家庭存在某些系统性的差异,我们就有一定的理由怀疑文章的结论是否具有普遍性。

如上所述,从方法论的角度,我支持陈老师文中的观点。但我们需要思考的是,具体到我们所讨论的这篇文章,陈老师的批评是否完全适用?或者说,我们要回答以下几个问题:原文作者所强调的发现是什么?它能否被文章中的分析所支撑?陈老师所提出的几点关于 sibling comparison 的批评,是否会推翻原文所提出的结论?

至少在我看来,原文所强调的并不是一个 “关于母乳喂养效果的精确的因果推断”,而只是一个相对笼统的定性结论,即 “过去关于母乳喂养的那些正面效果被夸大了,实际没有那么好的效果”,政见文章的标题和内容也都是这样进行表述的。作者用来支撑这一结论的证据来源于 sibling comparison:对同一个家庭的不同子女而言,那些接受母乳喂养的孩子并没有显著地比未接受母乳喂养的孩子更加健康、优秀。

如陈老师所说,同一家庭内部,哪个子女得到母乳喂养本身就是父母人为选择的结果,而并非随机决定,因此这一比较并非一个因果推断。这个说法我同意,但 “父母选择” 是否会推翻文章的结论呢?

最有可能发生的一种选择大概是这样的:假设一个家庭里有 A 和 B 两个小孩,父母更偏爱 A,并且他们认为母乳喂养具有正面效果,于是选择对 A 进行母乳喂养。由于他们更偏爱 A,除了母乳喂养,在未来的教育、医疗、饮食等各方面的投资中,他们也都将更多资源分配给 A。那么这样的选择会如何影响文章的结论呢?文章发现,A 和 B 最终在各方面都没有差异,于是声称母乳喂养没有正面效果。也就是说,如果上述的 “偏爱” 真的存在,则实际上是 “母乳喂养” + “一系列具有正面效果的投资” = “不母乳喂养”,这说明母乳喂养不仅没有正面效果,反而很可能有一定的负面效果;因此这不仅不会推翻原文的结论,反而会进一步加强文章的结论。

那么,有没有可能父母心疼体弱的小孩,并且他们相信母乳喂养有助于强健体魄,于是专门选择给体弱的小孩进行母乳喂养呢?如果这种情况成立,而作者发现母乳喂养与非母乳喂养的小孩没有差异,那么实际上就是 “母乳喂养” + “弱体质” = “强体质”,这说明母乳喂养实际上可能确实存在一定的正面效果,那么原文的结论就会受到威胁。但依据原作者在文中的说法 (政见的介绍中也专门提到这一点),体弱的孩子吸吮能力也相对更低,因此相对更少得到母乳喂养。这说明,上述的担心并非一种普遍的情况,因而难以对结论产生实质性的影响。

因此,综合来看,虽然原文并未进行一个严格的因果推断,但作者所提出的定性结论基本可以被他的数据分析所支撑。在相对符合常识的情境下,sibling comparison 本身的局限性也并不会对文章的结果造成太过严重的威胁。至于作者的定性结论本身是否具有足够的学术价值和现实意义,则又是另外一个见仁见智的问题了。

回到开头


文章版权归原作者所有。
二维码分享本站