有几个领域需要关注。这是我的顶级。
学习类型
虽然存在证据金字塔,但研究问题必须适合研究。有时,随机对照试验是不可能的。以确定吸烟风险为例。我们不能随机分配几百人每天抽一包烟,再分配几百人给对照组,然后看看20年内哪个组的死亡率更高。此外,研究时间越长,外部偏见和影响因素(如饮食和运动习惯)影响结果的可能性就越大。但是,当我们查看来自多项研究的所有数据时,情况就很清楚了。
虽然仍然没有对照试验,但我们有许多涉及大量受试者的研究一致表明,吸烟越多会增加患肺癌的风险。如果你戒烟,从未过滤切换到过滤,或者从每天吸烟两包减少到一包,患癌症的风险就会直线下降。不管你怎么看这个问题,吸烟都会增加患癌症的风险。因此,虽然一些研究问题永远不会通过临床试验的审查委员会,但有很多方法可以测试假设。
樱桃采摘数据
研究的主要目标是将结果转化为现实世界。为此,研究中包含的人员需要代表您要应用结果的人群。如果你想确定力量训练对孩子有多有效,看看评估中年人的研究几乎没有价值。这突出了了解谁被纳入研究的重要性。这些问题在营养研究中很常见。
例如,几个大的潜在队列得出的结论是,吃红肉会导致死亡风险增加。与吸烟研究不同,结果并不一致。此外,与素食者相比,研究中包括的肉食者还具有以下特征:
这就引出了几个问题。是否有可能是BMI升高,缺乏运动,过多的卡路里摄入或两者的组合导致死亡率增加而不是红肉?红肉很可能导致了这些条件的发展;但是,关联不是因果关系。
我不会进入营养辩论在这篇文章中。我可以把它留到另一天。相反,我想指出了解谁被研究以及做了什么的重要性。如果一项研究说物理治疗并不比家庭锻炼计划更有效,他们如何定义物理治疗?许多使用物理治疗作为包罗万象的术语的研究都是一般性和低强度的。研究人员设计的程序适合平均水平,而不是来诊所的个人。此外,强度通常太低。这给读者带来了困惑。我们在看待时必须谨慎观察性研究,意思是简单地观察一段时间内的结果,而不是专门干预4。
小数定律
我们还需要确保研究有足够的参与者。这被称为研究的力量。一项把握度不足的研究具有更大的可变性,并且难以得出结论。
请考虑 中概述的以下问题思考,快与慢作者:Daniel Kahneman:
最近一项关于美国 3,141 个县肾癌患病率的研究发现,发病率最低的县大多是农村,人口稀少,位于中西部、南部和西部的传统共和党州。
花点时间考虑一下原因。现在让我们看看肾癌发病率最高的县:
他们大多是农村,人口稀少,位于中西部、南部和西部的传统共和党州。
这不是错字。描述完全相同。为什么?答案就在小数定律中。密钥是“稀疏填充”。低数字导致高可变性。居民人数较少的县的比率变化最大。
致盲是关键
盲法是指参与者、研究人员或两者都不知道实际干预和对照之间的差异。例如,如果您正在测试药物的效果,患者是否知道他们正在接受实际的药丸或糖丸(安慰剂)。安慰剂是医疗保健环境中的一个程序或事件,一个人认为这是一种预期的治疗。由此产生的安慰剂效应是当人经历预期效果时,即使他们接受了确实具有直接作用机制的治疗(如抗炎药)。这意味着如果患者认为他们接受了止痛药,糖丸会导致疼痛缓解。
研究一致表明安慰剂效应是非常真实,非常强大.通过对研究参与者进行适当的盲法,我们可以确定是否发生了安慰剂效应。如果没有盲法,我们不知道改善是由于干预的预期作用(例如减少药物引起的炎症)还是由于思维的力量,或未知的第三方影响因素(例如睡个好觉)。
参与者并不是唯一需要盲法的人。研究已经证明,当实验者或提供者认为干预是假的(如糖丸)而不是真正的交易时,他们的行为会有所不同。肢体语言、努力、沟通和面部表情的微妙变化可以提示患者他们没有接受实验性治疗。这恶化了潜在的改善。
另一个问题是研究人员和参与者都可能表现出表现偏差。这是什么时候如果我们知道我们的表现正在被衡量,我们就会更加努力。研究人员在提供实际治疗时可能会更加关注,而不是假的。如果参与者知道他们接受了实验性治疗,他们可能会在性能测试中更加努力。这些细节很少出现在期刊文章或大众媒体中。
控制变量
另一个问题是控制变量。营养研究参考中对此进行了简要介绍。虽然一项研究可能会测试锻炼方案的有效性,但是否跟踪了参与者的饮食和睡眠模式?饮食和睡眠对运动都有巨大的影响。一些研究确实控制了他们,而另一些则没有。实验者呢?
提供治疗的临床医生的技能如何?除了技术交付的差异之外,患者对关节破裂的看法是什么?如果他们讨厌指关节破裂的声音,或者不喜欢与某人近距离接触,他们可能会紧张或只是对操纵反应不佳。病人的身心状况如何?这可能会影响任何类型的实验。如果他们进入实验并睡了一个难觉的夜晚,与重要的人吵架,最近在工作中被解雇,或者他们是金莺队的球迷,而 MLB 赛季刚刚开始(一个60场比赛的赛季对他们来说可能是一种解脱),他们很可能会处于可能影响结果的糟糕情绪中。我们无法控制一切,但我们应该知道研究的潜在问题。
得出结论
最后,我们有确定“那又怎样”的艺术。不幸的是,阅读标题并继续前进很容易。标题通常具有误导性或完全歪曲研究结果的实际内容。效果的大小很重要。让我们回到康复。如果你因为膝盖疼痛是 6 分(满分 10 分)而遛狗有困难,那么 5.5 分(满分 10 分)会有所作为吗?一项研究可能表明,一种新的治疗方法可以提供重要疼痛改善,但大多数患者会对“显着”一词翻白眼。研究中的“显著”一词通常意味着具有统计学意义。这是指一种统计计算,用于确定由于偶然性而观察到的效应发生的概率。我不会详细介绍。有兴趣的人,可以阅读我的详细研究文章这里.
你更关心的是一些与临床意义有关的东西。对于疼痛,这通常由 1.5/10 的变化表示。这意味着您需要经历至少 1.5 的变化才能在您的生活中产生明显的变化。如果您只是阅读标题或写得不好的文章,您将错过效果大小。这可能会导致您的体重比应有的更重。另一个问题是从相关性中得出结论。
相关性不等于因果关系
相关性只是两个变量之间的关联。这种关系可以是积极的,也可以是消极的。例如,学习与更好的考试成绩呈正相关。我学习得越多,我的分数就越高。虽然这种相关性是有意义的,许多相关性可以在不相关的情况下完成,但关联仍然存在。例如,从 1999 年到 2009 年,斯克里普斯国家拼写蜜蜂获胜单词中的字母与被毒蜘蛛杀死的人数相关。我认为可以肯定地说,一个不是另一个原因。您可以找到许多其他有趣且明显无关的内容例子.查看相关性中的两个数据集(A 和 B),关系可能是 A 导致 B、B 导致 A 或未知 C 导致 A 和 B。
许多人常说“相关性不等于因果关系”。正如我所表明的,这是真的。不幸的是,这通常被视为类似于“没有冒犯但......”承认问题但无论如何都要通过的方法。类似于某人在假设免责声明现在可以的情况下继续说一些真正令人反感的话,相关性仍然被视为因果关系,并导致对研究的理解有缺陷。
衡量风险
要讨论的最后一个问题是相对风险与绝对风险。通常,当标题说“风险的4倍”时,标题会吸引我们的注意力。然而,在不知道初始风险的情况下,这几乎没有意义。如果治疗副作用的原始风险为1/10,000,则特定患者群体增加4倍几乎不会引起恐慌。绝对风险是我们最关心的数字。现在,如果绝对风险是5%,并且增加了4倍,那么肯定有理由担心。我们需要这两个价值观。
翻译证据
归根结底,目标是将研究转化为我们的日常生活。不幸的是,许多人没有接受过有效理解研究所需的培训。如果我们仅仅依靠头条新闻和Facebook评论,我们很可能会误入歧途。这很有挑战性,但找到源头,或者至少提出正确的问题,将使您更好地了解研究以及它如何应用于您的生活。最后,以下是阅读研究报告时要考虑的提示摘要:
阅读和消化研究需要实践。我仍在学习和完善我的阅读能力,并将研究转化为日常实践。我鼓励你坚持下去并保持好奇心。
“科学知识是一系列不确定/确定性的陈述——有些最不确定,有些几乎确定,非绝对确定。
— 理查德·费曼