来源:Nature自然科研

  计量学的历史对于重复实验结果、提高科研可信度具有重要启示。

在亨利·卡文迪许(Henry Cavendish)利用扭秤测得引力常量两个多世纪后,计量学家依然无法就该常量的精确值达成一致意见。来源:The Royal Society

  人人都在谈论可重复性(reproducibility)——至少在生物医学和社会科学领域如此。过去十年里,人们越来越意识到,一项结果必须能被独立重复出来,才能被接受为真。

  物理科学也需要关注可重复性。《自然-物理》有一期内容专门探讨了这个话题,计量学家Martin Milton和Antonio Possolo撰文指出,人们应该换一种眼光看待可重复性。两人写道,当测量科学的结果不能被重复时,它体现了不同研究方法的效果,是帮助公众了解科学过程的好机会。(M。 J。 T。 Milton and A。 Possolo Nature Phys。 26, 117–119; 2020)。

  两位作者分别来自国际计量局(International Bureau of Weights and Measures)和美国国家标准与技术研究院(National Institutes of Standards and Technology),他们列举了三个案例,都是人类在测量某个自然界基本常数过程中的尝试。

  具体包括光速(c);普朗克常数(h)——将光子能量与其频率关联起来;引力常量(G)——衡量两个物体之间的引力强度。

  就普朗克常数和光速来说,不同的实验室利用不同的方法得到了相同的数值——这就是可重复性。其中,普朗克常数的值由于得到了普遍认可,去年5月被规定用来定义国际单位制中的千克。 

  不过,虽然过去三个世纪里开展过不计其数的实验,但G的精确值一直未得到确定。科学家对这种不确定性的根源一筹莫展:可能是因为测量这个值的方法还存在未知的误差,也可能标志着迫切需要新物理学。科学家正在探索的一种可能是G值会随时间变化,这种情况下,科学家可能先要改变认为G是常数的想法。

  虽说物理学家觉得可能性不大,但如果确实如此,它将成为一个例子,说明不可重复的数据也是科学过程的一部分:实验结果对长期公认的理论提出质疑,或是直接指向了另一种可能的理论。

  生物医学和社会科学领域的问题无法简化为测定自然界的一个基本常数。和计量学相比,癌症生物学等领域的结果重复性实验可能包括更多的可变性来源,而且极难控制。

  不过,计量学提醒我们,当研究人员尝试重复实验结果时,他们都会遵循一套通用而且非常精确的实验标准,这在测量领域被称为量值溯源(metrological traceability)。作者认为,正是这一点帮助建立了科学研究过程的可靠度和可信度。

  我们从Milton和Possolo的评论中得到的启示是,不同领域的研究人员应该保持对话,分享他们在可重复性上的经验。与此同时,当研究人员遵循最受认可的标准,重复某个结果而不得时,我们也不要轻言肯定是有什么猫腻。

  不可重复性不应被自动贴上失败的标签。它可能是一种提醒:是时候重新思考我们的假设了。

发表评论

电子邮件地址不会被公开。 必填项已用*标注