摘 要:理论生态学研究面临对野外实验和原假说显著性验证的质疑。前者可通过公众参与异质性研究予以消解;分析了原假说显著性验证后,认为可将后者改为多轮验证,由此保持假说-演绎方法的有效。根据生态学特点和原假说显著性验证要求,进一步修正了普拉特的强推理逻辑步骤并指出生态学进步模式为不同于精致证伪主义与波普尔强证伪主义的第三种证伪主义——弱证伪主义。
李际, 自然辩证法通讯 发表时间:2021-08-24
关键词:假说-演绎 科学说明 原假说显著性验证
一、生态学野外实验与NHST引发的质疑
《证伪主义的生态学假说判决性实验辩护》以证伪主义立场批判了奎宁(F. Quinn)和杜汉(A. E. Dunham)的观点。该批判主张生态过程并非都是多因子机制的,并坚持生态学野外实验可反映假说演绎的强推理逻辑而存在判决性实验的可能。[1]
野外实验已成为理论生态学(以下简称“生态学”)重要的研究方法之一,尤其是全球空间尺度的长期野外实验研究正迅速发展。[2] 迄今,生态学家们发展出了全球野外实验网络,甚至进行了方法总结,提出了协同分布式实验(coordinated distributed experiments, CDE)和分布协作式实验(distributed collaborative experiments,DCE)。[3]-[4] 但有限的站点使得对实验结果是否具有统计学意义产生了争议。[5]-[8] 这意味着即使在全球范围进行野外实验,其结果可复制性(replication)并未得到认可,即目前生态学野外实验方法还不可靠。①
另一方面,生态学实验数据的主流统计方法采纳了基于假说-演绎逻辑的原假说显著性检验(null hypothesis significance test, 简 称“NHST”)。但自NHST方法诞生以来,关于它的争议始终存在,并愈演愈烈视。研究表明,“大部分物理科学研究者认为NHST的可靠性是不科学的”,它存在 “导致针对原假说高度的证据误导”而过于武断的拒绝原假说。[9]-[11] 2010年,《科学》(Science)的新闻版发表了《这是科学最肮脏的秘密:通过站在脆弱基础上的统计学分析去验证假说的“科学方法”》,一周后的《自然》(Nature)刊发了《科学方法:统计错误》,该文成为当时《自然》被最多次浏览的文章。[12] 对于NHST的最有影响的批判来自于《基础和应用社会心理学》 (Basic and Applied Social Psychology,BASP)主编们发表的社论(editorial),宣布该刊已开始正式禁止(ban)采用NHSTP 的论文。[13]
若现有生态学野外实验和NHST都存在重大弊病,则生态学可能就不存在判决性实验。作为两者论证逻辑来源的假说 - 演绎逻辑受到了挑战,证伪主义立场也需质疑。《证伪主义的生态学假说判决性实验辩护》的基本结论也就不成立。
二、野外实验的逻辑困难与方法克服
生态学的研究对象和基本科学问题使得野外研究在生态学中的难度相较于生物学和物理学都显著增加。
生物学的野外研究的传统方法是野外观察。通过肉眼或简单仪器辅助,它描述个体以上生态层次(ecological hierarchy)可见的变化(比如:植物分布和形态研究、物种迁徙与捕食者-竞争关系观察),记录下生态过程演化的事件,实验者对于生物学过程并不进行干预,所以较易。古希腊时代就诞生了自然志(natural history)传统,近代的生物地理学和生物学都沿袭了这个传统。当代的公众科学也在生物学野外观察研究中清晰的体现了操作的简便与结论的坚实。[14] 但它仍旧是描述性的科学研究,并未完全进入以精确计量和实验为特征的现代科学阶段。生态学野外研究的主要方法是受控的实验。它与实验室实验最大的直观区别是实验环境和实验室实验产生了变化——实验者面对更为广阔和开放的实验环境。它最大程度拟合了真实世界中的演变,逻辑上结果更为可信且结论更为可靠。作为现代科学的研究方法,实验方法使得生态学野外研究优于野外观察,但对研究者的能力与条件提出了更高的要求——尤其在生理生态学和分子生态学领域。但这还是技术制约,逻辑上并不构成问题。
同为实验方法,生态学野外实验具有物理学实验室实验所没有的挑战。这种挑战来自于生态学的定义——研究动物和植物与它们的无机和有机环境之间的全部关系的科学,是对达尔文所称的生存竞争条件的那种复杂的相互关系的研究”。 [15] 野外实验的目的是找出处于生态过程演化中的生态因子(ecological factor)之间的相互作用(interaction,生态学术语,本文中的含义等同于因果关系或因果机制)。而生态过程同时存在单因子、双因子或多因子三种情况。这与物理学对因果机制的理解形成了差异。自古希腊开始的自然哲学传统以及当代粒子物理学都是单因子假设的,它在找寻基本粒子;牛顿力学是双因子假设的,比如第二定理的因子就是加速度与质量;当代量子力学是双因子假设的,它认为两个量子尺度的事物存在瞬间的超远距离作用的量子纠缠;但,未见物理学有超过两个因子的多因子假设。这恰好是生态学与物理学的基本假设的显著差异,也构成了野外实验的困难。生态学面对的影响因子往往超过两个,比如:很多生态学野外实验要考虑的外部影响因子至少包括气压、湿度和温度等。若对描述种群数量与物种丰富度相互关系的驼峰模型(hump-back model,HBM)分别在年中的南半球和北半球分别展开实验的话,则可能因为温度导致个体繁殖的差异而引发不同的结果和结论。两个实验的对象(生物个体以及种群)的生物学构成是同质的,形态学上也是同构的,两个实验对象本质上是同一的;实验操作是同时同步的;但,结果并不同一。生态学采纳任何一个结果都会导致对生态过程同质性的质疑,这种质疑进一步引发了生态学理论是否可能统一(即各种生态学理论是否可以最终归纳为一般性理论)的疑问。[16] 野外实验要模拟真实的生态过程,所以不能像物理学那样只保留一个影响因子而研究该因子导致的因果机制。这个逻辑困难可能是生态学研究目的和野外实验独有的。此外,外部影响因子彼此之间也存在着相互作用。比如:由于存在温度与湿度、海拔与含氧量、营养成分 / 水分 / 光照等多个相互关系的交错,年中在南半球的澳洲沙漠的实验结果与年中的北半球的阿尔卑斯山顶的实验结果可能差异更大——它进一步放大了这种困难,使得生态学野外实验逻辑困难比物理学实验或实验室实验呈现指数级增加。
历经了约一个半世纪的发展,生态学研究在引发逻辑困难的同时也在试图克服困难。它从地理学中借鉴了新的概念,出现了斑块(patch)、镶 嵌(mosaic)、 异 质 性(heterogeneity)和景观(landscape)等概念,它们之间是逻辑递进的。斑块很直观的把生态系统的地理分布看做是在一张大画布上的不同形的色斑,由于各个不同的斑块的内部系统构成和相互作用不同构,导致了它们就像是彼此镶嵌于对方或完整的系统中,呈现出不同质的特性,最后把这种不同质称之为异质性,并借鉴园林设计的概念而把具有异质性的生态地理拓补系统隐喻为景观。这种思路认为“自然生态系统 ..... 随时间以复杂的、有时是不可预测的方式而变化”,并批判“以往把生态过程所处的空间看做是环境的同质性和空间上的随机分布的基本假定是为了研究的方便和简化,...... 所有生态系统都在一个广阔的尺度(scale)范围内表现出异质性和斑块镶嵌的特点,这种斑块镶嵌是种群动态、群落结构与稳定、物质循环、能量流动和信息传递等发生的基础。”[17] 异质性研究和景观生态学从 20世纪80年代开始迅猛发展。我国国家自然科学基金委员会地理学部主任傅伯杰院士的主要研究方向即包括景观生态学,他还兼任国际地理联合会副主席,由此可见生态学认识的转变。
生态学已承认生态过程存在由影响因子导致的不同形、不同构、不同质与不同一。前文的逻辑困难就有望通过体现异质性的实验研究而消解。此前的野外研究局限于职业生态学家,受限于财务压力和发表压力等非科学因素等共同作用,使得他们很难开展更大尺度和更长周期的野外研究而获得充分的异质性研究结果。[18] 应对这一现实掣肘,有学者提出了将生物学和环境科学中已具有影响的公众参与野外观察的公众科学(citizen science)引入生态学的野外实验研究。[19] 至此,野外实验可以通过涉猎所有的异形、异构和异质的景观而完成相互作用研究。在此基础上,寻找其中的同一性,促进统一的一般性理论的发现。虽然现实条件还不能认为当前可以完全实现,但已不存在上述的逻辑困难。
三、假说-演绎方法与NHST辩护
科学证明可评价科学知识,它有演绎与归纳两种经典的评价方法,前者属于逻辑论证,后者属于经验证明。[20] 鉴于生态学还没有一般性理论的事实,它有时也被看做经验科学,证据之一就是大量采用归纳方法。比如:实验结果统计学评价的p值验证(即统计结果不支持原假说预测的频率阈值,一般为< = 0.05,低于该阈值则认为假说暂时通过了经验考察,符合证伪主义的原则)。但归纳逻辑的逻辑缺陷决定了永远可能出现反例,而生态过程的演化语境(context,为避免社会建构的争鸣,此处不得理解为“与境”)更凸显了归纳方法的弊端——逻辑上,只要演化持续,就可能产生新的事件推翻此前所有事件验证的理论。这意味着归纳逻辑并不能确保任何假说的实验证实,彻底采用归纳方法会导致无法获得理论。但实际研究中,生态学家的研究步骤是:(1)提出假说;(2)基于假说设计NHST实验;(3)开展实验并获得结果;(4)用p 值进行结果评价并得出科学结论。
这种步骤是普拉特(J. R. Platt)提出的假说演绎方法在生态学研究中的改版,是生态学最常见的科学说明方法,它其实是归纳与演绎的分步综合。具体而言,在假说提出与实验设计阶段采用了演绎方法,而在实验结果评价采用了归纳方法。它的起点是逻辑的,终点是经验的;它体现了波普尔的证伪主义,即用经验的结果评价假说;无论基于归纳方法的p值验证支持(本处采用“支持”一词,以免误解为“证实”原则)或证伪了假说,这都是对假说的判决性的实验结果的科学结论。[1] 假说-演绎方法也是实验重复性(此处的重复性同时包括p 值验证同一组实验的结果可重复与对重复多组实验的结果可重复两种情况,详见本文NHST部分)的逻辑前提。鉴于具有相同机制的生态事件逻辑上会出现同样的定性结果,通过被称为“科学的基石(cornerstone)”的结果可重复来最终完成第4步的判决工作。
由于假说 - 演绎方法的起点是逻辑的,后续的说明是基于假说演绎出来的。按照演绎方法原则,前件(假说)为真,后件(结果)必为真。但生态过程的特点使得最初的假说为真的可能性被质疑了。事实上,生态学迄今的确也未确立诸如第一原理之类的一般性理论——演化只是它的语境。 所以,前件为真在当前生态学中还未出现。此外,无法判断未来的演化对当前生态过程的相互作用影响,甚至无法评价假说是更多还是很少的为真。这导致绝对的演绎方法在生态学中是彻底失败的。因此,该方法是否有效的评价只能通过后续的归纳方法展开。归纳方法原则是后件(结果)为真,则前件(假说)才为真,但仍旧未必永真。其中扮演演绎方法和归纳方法转换关键的是第2步,即 NHST实验设计。若NHST合理,则该方法才可能逻辑合法。NHST的思路是将两个逻辑相悖的假说分别作为原假说(H0)和备择假说(alternative hypothesis)(H1),通过实验得到的结果,判定其中一个假说不为真,则另一个假说为真的逻辑概率(probability)相应增加。为尽可能确保结论为真的概率,NHST要求以逻辑上为假可能性更大的假说作为H0,当逻辑上为假概率更大的事件在实验中观察到了,则说明H0是在更为严苛的条件下被验证,得到的结论比用逻辑上为真概率更大的H1得到实验验证的结论更为可靠,即H0得到 NHST的的最严格的验证。[21] 这是证伪主义思路的体现。但生态过程的特点决定实际中实验达到完全重复几乎不可能,而假说太易被证伪,以至于没有理论出现。为此,出现了p值< = 0.05的通用阈值。换言之,对假说的最终判决其实并非直接来自假说或实验本身。它即非演绎的,也非归纳的;而是来自于统计学的约定,是约定论的。
因对H0采用了严苛的标准,NHST的优点是对于原假说的判决标准严格,却的确存在过于草率证伪的可能。但上述批判仅限于有限数量的结果和p值较大的情况下。显然加大实验量和提高p 值标准比无法预测的生态过程的演化与异质性相对容易。若加大实验量并提高p值的要求,即使 NHST采取了经验的归纳方法使得它不能判决假说是否永真,但可不断逼近永真。所以,不该就像武断的否定原假说那样武断的抛弃NHST。此时,问题已经不再是关于评价方法的,而是关于现实条件的。鉴于该方法中的前2步的演绎方法在逻辑上是无法彻底满足的,而真正支撑该方法的是后2 步的归纳方法——只有归纳方法在逻辑上存在逼近永真的可能,所以假说 - 演绎方法应更多的看做是归纳为主的方法。这个结论也符合生态学目前无法摆脱的经验科学现状。至于如何避免p值带来的其他困难,本文不予讨论。
四、普拉特(1964)强推理逻辑的步骤修正与证伪主义新理解
普拉特提出假说-演绎方法是基于他的强推理逻辑。起点也是来自于演绎方法的不可靠,即存在前件不充分(或“自明”)的弊病。前文已述,这种弊病在当前生态学的假说-演绎方法使用中也暴露出来了——NHST将假说置于仅存在被支持或未被证伪两种可能的境遇(医学统计学中早已存在 NHST第三种结果可能的应用,为简便表述与不偏离主题,本文不予讨论)。处于假说地位的科学理论还未受到严格的检验,它仅是对已发生的生态事件的因果机制的猜测。由于提出假说时可能未获得或忽略了相关的证据,提出的假说可能并未完整或正确解释了生态事件的因果机制。一旦有限的证据对此进行了判决,在实践中可能导致生态学家集体放弃持续研究的努力——直接证伪假说对于发现真正的因果机制存在负面影响的可能。生态学科学结论的争议表面上与以NHST方法和p值验证作为可重复依据的结果一致性,但这些争议都是采纳了一次性的判决性实验的思路。若对NHST的一次性判决的思路进行修正,有望满足前件为真的逻辑前提。
普拉特对此是有思考的,并提出了理论上可以穷尽前件的实验研究步骤:(1)设想(device)各种候选假说;(2)用候选假说设计一个(或多个)判决性实验,彼此尽可能的相互独立;(3)开展实验获得清晰的实验结果;(4)如果结果不支持候选假说,则进一步提出并检验子假设或提出新的假说,如此往复,直到最终确定的所有假设被证明是正确的。[22] 按照普拉特的本意,假说 - 演绎逻辑并非一定是一次性实验,而可能存在(对于生态学而言,这是更大的可能)多轮实验。多轮实验并非指的是对同一个假说的实验重复(并非是传统的可重复性理解),而是对不同假说的分别的实验——后者才是实验可重复的前提,前者是实验不可重复的证据并引发修正后的新假说的下一次判决性实验。这为化解生态学科学说明困难提供了启示。
按照现有的NHST,若对一个原假说通过单一的实验进行判决的统计学结论永远是0或1(即证伪或未被证伪但不代表确证)。但,只要样本量足够大,总会发现不同于假说和常识逻辑的反常事件。在确认实验操作和统计过程没有差错后,它会启发生态学家修正假说并进行数据验证或开展新的实验,如此反复,总是会得到严格验证的一般性理论。因此,他第三步说的不够明确,应为“开展多个基于同样实验协议的实验获得清晰的定性(视研究需要,也可为定量)的实验结果”。此外,基于 NHST,即使采用了多次实验的思路,每次实验只能对一个假说(即H0)进行判决,所以第1步的表述应改为“设想一种候选假说(即统计学意义的原假说)”且第2步就不应存在设计多个实验协议的要求,否则NHST无从判决原假说是否已被证伪或未被证伪。由于仅有1个实验协议,此时也不存在实验协议彼此独立的要求。但,第4步即使结果支持候选假说,仍需补充其他可能的候选假说并重复第2与第3步,如此往复,才能发现生态过程的真实机制且只应该存在一个解释力最强的最终结论。基于上述统计学和生态学分析,对普拉特的强推理逻辑的步骤做修正后的完整表述应为:(1)设想一种候选假说;(2)用候选假说设计一个判决性实验;(3)开展多个基于同样实验设计(或协议)的实验获得清晰的定性(视研究需要,也可为定量)的实验结果;(4)如果结果不支持候选假说,则进一步提出并检验子假设或提出新的假说;如果结果支持候选假说,则设想各种候选假说并逐一完成第2步与第3步,如此往复,直到最终确定一个未被证伪且解释力最强的假设。
据此,NHST的前件也通过后件的经验修正最终确保了永真的逻辑要求(此处的永真结论仅限于形式逻辑框架内,并不考虑生态过程持续演化的影响),假说 - 演绎方法的前2步也逻辑合法了。但必须始终记得NHST的原理是即使通过了经验验证,也仅仅表明该假说暂时未被证伪,而非该假说正确。这意味着逻辑合法并不等于现实中的完备证伪。因此,生态学家要秉持科学与哲学都坚持的质疑精神,始终对生态过程的因果机制提出其他可能的假说或影响因子,部署新的实验——只有穷尽了已知的一切知识与可能,才能在当时认为最终通过验证的假说是可被完全接受的理论。此时,始终被质疑的是各种假说,而非假说 - 演绎方法与NHST。生态过程的演化并不能有效质疑作为方法的假说-演绎与 NHST本身。
修正后的强推理逻辑的步骤仍旧符合普拉特的反复的持续实验验证的基本思路,但强化了对推理逻辑与实际操作程序之间的关联,从经验的角度为这个逻辑增加了更多的支持,也符合以生态学的研究现状。这种理解不同于精致证伪主义。精致证伪主义通过保护带强调了对研究纲领的硬核的维护。这种观点坚持科学进步模型并非纯粹的证伪。本文指出的多轮判决性实验在步骤上是反复与渐进的,但最终一轮的实验判决却是一次性的。此外,生态学还未进入科学说明阶段,正在努力发现作为硬核的一般性理论。因此,精致证伪主义不是本研究所认同的生态学进步模式。另一方面,本文强调最终还需进行判决,这与波普尔的证伪主义都采取了较为激进的科学进步模式的立场。但,本文提出的 NHST多轮判决性实验(非重复实验)以及对普拉特假说-演绎强推理逻辑的步骤修正比波普尔的证伪主义趋于温和。本文认为当证据证伪了假说后,可调整子假设或验证其他的假说,而不是直接抛弃整个体系。比如:当驼峰模型的第一轮实验结果引发争议后,研究者并未抛弃该模型,而是继续提供新的解释并试图将争议引向新的影响因子与相互作用的讨论(驼峰模型只是植物种群生态学的一个假说,不应当做精致证伪主义的硬核看待)。[5]-[8]
由此,本文所持的生态学进步模式的立场介于波普尔证伪主义与精致证伪主义之间——完全否定了精致证伪主义但部分否定了波普尔的观点。若将波普尔的证伪主义称之为强证伪主义,则本文的立场可称之为弱证伪主义。
五、结论与讨论
应对野外实验和NHST的质疑,生态学可通过公众参与的全球野外实验的异质性研究以及多轮的NHST实验予以消解并维持假说-演绎方法的有效。普拉特的强推理逻辑步骤应予以修正以为体现生态学特点和NHST的统计学要求。这符合艾莉森(M. A. Ellison) 对NHST适合大尺度生态学研究的观点——“当我们得出一个科学的概括时,我们并不声称这个概括以及它的结果是确定的;我们主张的是它们在我们当时已获得的知识中有高的概率程度,但这个概率可能被额外的知识所修正。”[23] 如此形成了不同精致证伪主义和波普尔证伪主义的生态学进步模式的证伪主义理解,即弱证伪主义。
但演化的持续使得任何原假说始终处于被证伪的风险,而统计学在生态学研究中仅为手段。“数字是科学讨论的起点,而非终点”,无论是生态学还是统计学的方法研究都还会和演化一样持续。[24] 对生态学发现一般性理论的努力而言,本文的研究可能只是一种西西弗斯式(sisyphusian)的努力。 ①罗夫加登(Roughgarden)曾质疑群落生态学存在一般性理论的可能——“我欣赏建构作为一般性理论的理论群落生态学的呼吁。如果谨慎的睁开眼睛寻找一般性理论,我们能避免(错误)投入一般性理论的危险。所以,今天群落生态学有一般性理论吗?没有。可能有吗?是的。应该有吗?我不知道。”[16] 若考虑演化导致的未来生态过程和事件的不确定,生态学的未来也是不确定性,他的结论迄今未变。