学术界对研究评估的争议几乎全部集中在SSH(人文社会科学)学科,而STEM(科学、技术、工程和数学)学科似乎已经接受了“研究评估成为常态”的事实。究其原因,我认为不可能仅与学术界的工作和交流方式有关,也不可能是由于政治或意识形态上的因素,必然存在着某种更深层次的因素。鉴于学者们通常是受内在驱动而非外部激励开展学术工作,因此我们可以在认知层面寻找深层原因。
本文中的“认知”是指学术界如何产生有效知识,或者如何通过特定程序、标准和实践相互认可他人知识的价值和有效性,进而遵循相同的学术规则。在这一视角下,主体间的沟通互动与知识的内在价值是密切联系的。
“认知”不同于“认识论”,后者需要对学术工作的规则进行更高层次的抽象。并非所有科学家都是科学哲学家,但所有优秀的科学家都掌握了一系列用于评价知识价值的学术规则。本文中的“认知”也不属于科学社会学的范畴,因为科学社会学的关注点是社群如何建立他们的共识(或分歧),而不关注知识内容,与与之相关的社会互动也是可分离的。
本文聚焦于认知层面,主要探讨以下问题:
·STEM与SSH之间有哪些认知差异,这是否可以解释它们在研究评估中的差异?
·SSH内不同学科的认知差异是怎样的,是否可以解释SSH内部的研究评估差异?
·SSH社区是否通用的研究质量标准?或者是否可以通过程序公正来缓和认知差异?
受逻辑实证主义的影响,许多研究认为,STEM与SSH之间的区别在于:前者是科学学科,后者不是。“科学学科”意味着至少在原则上可以建立具备因果命题的知识体系。在自然科学中可以开展控制变量研究,但在人文社会科学中未必可行。这种观点在二战后的几十年间影响了学术研究,但随着20世纪60年代科学哲学和科学社会学的发展,逐渐退出学术舞台。
在后实证主义关于现代科学的描述中,承认了更广泛类型议题的科学性和有效性。这为探究SSH学科在何种程度上也可被定义为科学铺平了道路。在社会科学中,对研究议题是否科学有效的争议有着悠久的历史,这种争议起源于18、19世纪的古典政治经济学和社会学。在韦伯和迪尔凯姆等古典作家的思想中,社会科学所产生的知识可以被定义为科学,但并非是在产生确定因果命题的角度上,而是这些知识通过作出解释,使社会行为者的行为变得可理解。
因此,SSH究竟在多大程度上可以被定义为“科学”?它们与STEM有什么区别?本文将对“SSH学科不是科学”的观点进行反驳,并论述二者的认知差异:
首先,STEM研究的目标是“发现”,而SSH研究只有偶尔的“发现”(例如一个新的遗址/文件/文本/手稿脚本…),SSH研究更多地致力于对现有文本作出新解释。STEM的竞争性则体现在研究人员争先发表“发现”以获得荣誉。
其次,STEM的研究是累积性的,学者们在他人贡献的基础上构建自己的成果,STEM更像是一项集体事业而非个人事业,合作与竞争并存。SSH领域的累积性则要低得多。
第三,由于对“发现”的竞争和“累积性”,在STEM中期刊论文是较为适宜的沟通渠道。学术期刊为世界各地的研究人员提供了定期更新“发现”的机会:论文的格式适用于交流“发现”,同行评议制度有效地解决了优先归属中的信息不对称问题。学术期刊的发展遵循着科学竞争的结构,并随着时间推移,产生了基于声誉的等级体系:经常发表重要“发现”的期刊阅读量更高,因此作者们竞相在这些期刊上发表论文;投稿数量的增加进一步提高了期刊论文的质量,从而吸引更多的读者。正是这种科学活动的结构使研究质量的定量计量成为可能。相反,期刊论文并不是SSH的适当媒介,因为在SSH中,新的论述通常宜使用图书这一出版物类型出版,以便进行长篇解释。
由于对优先权的竞争、累积性和学术期刊系统的运作,引文成为学术交流的基本要素。STEM中,对先前文献的引用是学术出版的必要组成部分。这种必要性既不是伦理上的,也不是实践上的,而只是功能上的。根据默顿的社会学方法,所谓“功能”是指个人被迫使用符合学术界集体规则的引文系统,而非出于个人的意愿。相反,在SSH中,研究人员常常引用很久以前的文献,产生的新作品不一定是累积性的,而是互补、承接甚至是相互替代的。在STEM中,学科领域和子领域的划分在很大程度上是一致的,且通常不是个人决定的结果。但在SSH中,大多数原创作者的研究之一是定义新领域或定义新细分领域。因此,有必要在SSH中建立与STEM不同的引用理论,将引用根据其服务的不同目的而进行相应地划分。
最后,STEM领域的范式多样性有限,而SSH中的范式多元化十分普遍,这影响了学科内部的竞争和合作模式。STEM通常有一个占主导地位的范式:一方面,在学科内部,所有的研究人员都在为抢占“发现”而激烈竞争;另一方面,由于同行评议(通常)是一个双盲的过程,作者的声誉和学术地位与论文的发表概率无关。在这种情况下,单一作者或集体作者不容易垄断引用或操纵声誉指标。但在SSH中,由于SSH内部存在诸多细分领域,范式多元化十分普遍。这不是由于学科差异,而是由于范式选择(植根于对象/方法/技术),且受价值取向(学术流派/意识形态/政治派别/文化取向)方面的影响。在SSH中,由于学科碎片化和范式多元化,单一作者或集体作者长期控制一个学科的可能性不容小觑。
我们还需要审视SSH学科内部的差异。一方面,SSH中的一些学科借鉴了STEM学科;另一方面,SSH内部的差异也影响了研究评估的导向向。
不同SSH学科在制度和认知上的发展方式存在显著差异。通过比较分析,我们可以总结这些有趣的内部差异。这些差异可以解释这些学科在研究评估方法上的不同导向。本文根据大量国际文献、欧洲及其他地区学术组织的官方文件,以及意大利近期的经验,总结了不同评估导向的主要论点,如表2所示。
本文将现有的研究评估导向总结为四类:
(1)文献计量导向:接受基于索引期刊和引文计量的定量评估;
(2)积极导向:就同行评议中使用的研究质量标准达成广泛共识;
(3)对研究质量标准存在争议的积极导向;
(4)消极导向。
经济学和心理学是SSH中为数不多的接受文献计量评价的学科,因为在这两个学科中,期刊是主要的交流渠道。笔者认为,当学科建立了强大的认知基础和共享的核心方法论时,其研究评估将会迈向积极导向。这一趋势可以在历史学、文献学、艺术史、考古学或人类学中看到。例如在历史学、文献学和艺术史等学科中,即使在方法上存在差异(例如不同政治取向的历史学家),但学者们对研究质量的许多标准也有统一的共识。
SSH学科之间巨大差异对研究评估提出了挑战。正如建筑历史学家Carlo Olmo所指出,我们需要的是一种考虑到各个学科认知差异的研究评估理论。
SSH学者有自己的质量标准。当他们阅读一本书时,能够形成关于研究质量的定性判断。挑战在于,这些定性判断是否能可靠地转化为定量度量,以及这些度量是否具有可比性?
科学社会学的最新研究结果支持了这一观点的可能性。一方面,Lamont的研究表明:SSH有自己的研究质量标准,以定性术语表达,学科成员共同持有。研究还指出,受学科分裂、意识形态冲突或方法论基础薄弱等因素的影响,那些未能建立这些标准的学科社区会在声誉、凝聚力和招生方面处于不利地位。另一方面,决策理论的最新发展表明:即使在不强加与理性选择理论相关的不切实际的假设下,定性判断也可以可靠地转化为测量。我们需要的不是可通用性(即存在一种共同的衡量标准),而是可比性。这种可比性是指学者在道德上和政治上愿意进行比较,以促进研究更好地服务于社会。
综上所述,从认知层面探讨研究评估是必要的。这一视角承认SSH学科在认知层面存在巨大差异,并为理解SSH学科如何应对研究评估开辟了方向。同时,本研究证实,SSH各学科可以聚焦如何建立一套特定的核心研究质量标准,而不违背知识多元主义、学术自由和异议权。一旦这些核心标准建立起来,学科内的研究人员就可以更好地对同行的研究做出定性判断,而非仅限于定量判断。决策理论的最新成果也证实,我们可以将这些定性判断转化为不违背评估主体偏好的排序(不一定是排名)。
程序公正是评价的关键。例如在专家选择方面保证透明度,建立自我候选、专家轮岗、短期负责等制度;保持学术界的开放对话;公开并定期更新质量标准;就同行评议所涉及问题开展详尽和持续的工作等。所有的这些以及其他解决方案对于获得被评估研究人员的信任至关重要。
这样以来,对SSH的研究评估就不会被视为“必要之恶”,而是成为重建或重新确立研究质量标准的契机。这不仅对SSH学科发展具有重要意义,而且对整个社会发展也会有所裨益。
(本文选自图书The Evaluation of Research in Social Sciences and Humanities: Lessons from the Italian Experience第1-29页,原文链接:https://link.springer.com/book/10.1007/978-3-319-68554-0?page=1#toc,本期推文为节选摘编,略有删减和编辑。)
本期策划 |复旦大学国家智能评价与治理实验基地
供稿 | 金潇苒 邓晨菲 王译晗
本期责编 | 金潇苒
基地官网:https://statevalbase.fudan.edu.cn