践评价

首页 > 评价前沿 > 践评价 > 正文

SSH研究影响力评估:以证据为导向

发布时间:2023-10-13 编辑:王译晗 来源:复旦智能评价与治理,复旦新学术

8F99

01



基本原理

研究评估的最终目的是提高研究质量。决策者希望从对科学的投资中获得最大收益,研究者们则希望做出有实质贡献的“好”研究。研究评估对于判断什么是“好”研究发挥着引导作用,在研究者之间产生协同效应,从而引导他们走向共同的目标。好的研究评估能够在两个层面发挥作用:一是通过对研究好坏的反馈来帮助被评估者更好地开展科学研究;二是向所有研究者发出什么是“好”研究的信号。因此,合理的研究评估应能够反映什么是“好”的成果,不合理的评估则可能会导致研究者不良的科学行为。

科学涵盖了广泛多样的领域和学科,每个领域和学科都有自己的独特实践。不同学科群体对于决策者的同一引导方式可能会有截然不同的反应。过去二十年来一直存在一个问题——最普遍的研究评估实践往往是基于STEM(科学、技术、工程和数学)学科开发的,并不适用于SSH(人文社会科学)学科合理的评估实践应符合学科的多样性:优秀的STEM研究可能会由大型、多作者团队共同撰写并以短论文的形式发表在英文期刊上,但优秀的SSH研究可能呈现在由不同出版社出版的、以本国语言撰写的、耗费多年时间编写的独著专著中

自20世纪末以来,研究资助者开始明确要求研究要在学科之外产生“影响力”,并且越来越重视研究影响力评估。

正如研究评估一直以基于STEM开发的模型为主导一样,影响力评估也一直以基于经济交易产生影响力的模型为主导,这会向SSH学界发出不良的引导信号。良好的影响力评估应该鼓励研究人员开展更多能够产生影响力的活动,从而引导整个学术系统创造更大的影响力。“好”的影响力评估应与研究者对“好”影响力的定义相匹配,将其具象化为一套被广泛接受的研究者优秀行为规范。

迄今为止,虽然研究者和评估者共同探索制定了诸多规范以开展更有影响力的研究,但这些规范尚未得到广泛应用。影响力评估在很大程度上仍然是流于表面的,常常被对“卓越”影响力的追逐所左右,而不重视研究者们为产生后续影响力奠定基础的许多活动。造成这种情况的主要原因之一是决策者没有建立明确的指导方针来解释评估是如何运作的

本政策文件旨在通过介绍欧洲人文社科研究评估网络(ENRESSH,一家致力于研究SSH研究评估协议和政策的协会)开展的工作来解决这一问题。

02



评估如何引导研究产生影响力?

决策者希望借助研究评估提高学术系统的整体性能。既然科学研究获得了公共资助,那么就有必要证明这些公共资助得到了充分利用。因此,科学决策者利用影响力评估来证明科学资助正在为整个国家创造效益,可以认为,影响力评估旨在全面提高学术系统的整体绩效

研究评估依赖于科学的高度互联互动的本质——研究者们不断交换信息,对彼此的工作做出判断,通过就什么是“好”研究达成共识来推动科学进步。“好”研究会蓬勃发展,而“坏”研究终究会走向衰落。将评估融入科学研究,是为了提高研究绩效、区分“好”与“坏”,并鼓励更多研究者做好科学研究。

研究评估通常只能评价在开展评估之前的成果,如研究提案、项目报告、期刊文章。研究者们在评估过程中建立对什么是“好”研究的共同普遍理解,然后其他研究者根据他们在评估过程中接收到的关于什么是“好”研究的信号来规划和塑造他们的研究活动。例如,撰写提案是为了获得积极的评价结果,因此研究者们会尽量明确在各个部分应该怎样写来获得积极的结果。

研究评估发出了什么是“好”研究的信号,研究的影响力评估同样如此——影响力评估发出了一系列关于什么构成“好”影响力的信号。只有当研究者遵守并将这些信号内化于心时,研究评估才能实现良好的引导效果。对学术期刊文章的评估是根据学术界对研究的认识来识别论文的好坏,论文被接受或拒绝的依据是其内容的严谨性、逻辑性和一致性。期刊文章定义“好研究”的方式塑造了研究者看待“好研究”的方式以及他们设计和开展“好研究”的方式。

这同样适用于研究影响力评估,改进学术系统性能的唯一方法是改变研究者对影响力价值的认知。影响力评估发出的导向信号需要符合研究者已经在做的事情,才能够被其认可,最终被其接受。好的影响力评估向所有研究者发出了什么是好的研究影响力的信号,但这些好的影响力是由已被研究者接受的良好影响力创造观念所驱动的

03



评估研究影响力的总体框架

评估的第一步是明确评估客体,即被评估的对象。评估的目的不是对提交的报告进行评估,而是对该报告中的研究(问题是否有意义?抽样是否适当?统计分析是否正确?)进行评估。“研究对象”会深刻影响研究评估效果,不良的研究对象会对整个评估过程造成破坏。

研究影响力评估存在一个基本问题——需要对“优秀”研究活动影响力的“产生路径”进行划分,需要识别优秀研究活动所创造的知识是如何导致社会发生明显变化的(即“影响力”)。这个框架很简洁:有开始和结束,有因果,一切都沿着一定的路径联系在一起。

目前我们还不太清楚影响力在实践中是如何产生的,但影响力评估框架并不是想当然的知识被创造出来,然后被转移给受众,然后产生了影响力。科学研究是一个持续的过程:研究者们不断交换发现,交流沟通,共同推动科学的发展;同时,研究者们定期与社会伙伴互动,随着时间的推移改变了社会的发展。社会和学界在一定时期内聚合在一起,共同创造出推动最先进技术发展的新知识,影响力的路径正是涵盖了这一过程。这一过程是双向的,社会的投入塑造着科学发展轨迹,就像科学的投入塑造着社会发展轨迹一样。

众所周知,好的/有影响力的研究通常是有影响力的研究者创造了一系列科学实践,然后被受众获取和共享,从而发挥广泛的影响力。对于研究评估者来说,通过寻找已经产生影响力的、极其成功的案例来创建循规蹈矩的研究评估是非常有诱惑力的,但这样做会为影响力的创造设置一条人为的“终点线”,但在实践中这条线很难被创造出来。学术系统中的影响力创造,需要更多的研究者在影响力路径上驻足更长时间

评估应考虑到影响力路径以外的活动和进展。这些与研究人员的日常活动密切相关,但并不引人注目。需要评估的是研究者在这一系列活动中表现出的承诺:受到社会问题启发的研究者选择通过研究解决社会问题而不是其他问题,承诺沿着“影响力路径”迈出“脚步”,他们的研究活动旨在加深对相关社会问题的理解。对于研究者所从事的各种不同类型的活动来说都是如此——从灵感出现、提出研究问题,到规划具体项目、实施研究项目以及向社会传播研究结果。在所有这些选择中都产生了可以用来评估的“证据”受到社会问题的启发意味着以社会看待问题的方式理解问题。“证据”可以体现在使用非政府组织、志愿团体或政府部门的报告,或使用报纸报告,与社会伙伴的会议和讨论,成为社区团体的成员等。这些活动带来的知识对后续的研究实践起到了约束作用。

良好的影响力研究实践可以使研究人员取得更长久的影响力。例如,与社会合作伙伴的一系列互动塑造了研究的整体轨迹,合作伙伴可能会继续参与研究,因为他们发现研究是有用的;同时合作伙伴获得了新的能力,随着时间的推移,这些能力可能会引起更广泛的社会变革。

04



研究影响力评估的原则

影响力的研究评估体系需要结合其所在国家的条件,包括学术文化、现有的研究评估文化、学术影响力创造的复杂性以及社会影响力创造的开放性,特别是在SSH方面。研究决策者可以参考以下原则,确保他们向研究者发出正确的导向信号:

· 研究者为主导:基于研究人员的科学行为制定新的评估规范,鼓励更多的研究者遵循这些规范。

· 论据导向:研究影响力评估体系应赋予研究者自由,让他们提出自己认为优质的研究,并用自己的证据来证明其研究活动符合科学规范。

· 公开透明:为了让研究者能够预测什么是“良好”的影响力实践,需要公开进行判断的过程。

· 成性:影响力评估应该是一个学习过程,被评估者通过该过程了解什么是良好的影响力,以及他们如何在研究中创造良好的影响力。

· 评估者不断学习:不断优化影响力的研究规范——将评估者聚集在一起,帮助他们理解什么是好的研究,并尝试在评估过程结束时对“好的研究影响力实践”作出定义。

· 符合学术规范:影响力评估应努力识别已经发生的并被认为是良好的实践,给予它们额外的认可,以便让良好的影响力成为进行良好研究的重要组成部分。

· 证据支持:影响力评估是一个使学术社区了解他们的研究如何造福社会的过程,提供适当的证据实例可以激发研究者对影响力的创新性思考。

· 富有成效的互动:共享的影响力路径会在研究者与社会之间产生富有成效的互动,这是一种影响科学研究方向的真正交流,评估应该注重这些影响。

· 共享的影响力路径:好的影响力来自于互动,其中研究者和社会伙伴相互影响,对科学技术和社会产生影响力,共同形成“共享的影响力路径”。

· 新路径促成新机遇:当新的社会能力被创造出来时影响力便会产生,社会参与者又会利用这些能力实现新的变革。开辟全新路径的研究活动需要耗费大量精力,最初可能并不引人注目,但最终会为社会发展创造巨大的新机遇。

· 以证据为驱动:研究者从社会伙伴那里获得知识并利用这些知识做出他们的选择,使他们的研究朝着特定的方向发展,在这一过程中可以观察到共享的影响力路径。这些活动可以通过相互作用、研究选择和方向变化方面的证据来证实。

· 影响力在整个研究周期中产生:影响力不只是在新知识被创造并被转移给用户时产生,影响力评估应涵盖整个研究周期中的互动和交流,包括从灵感出现到成果传播阶段。

· 给予影响力认可:影响力应与认可、尊重、权利相关联,应给予良好的影响力奖励和认可。

· 评估所有创造影响力的场所:要使影响力成为良好研究的一部分,需要在学术培训期就贯彻这一价值,要评估博士课程和导师在多大程度上培训其学生以创造共享的影响力路径。

· 对环境敏感:导致影响力实现的很多因素是研究者无法控制的。当研究者在一个不够包容、较为敌对的环境中工作时,小的变化可能会产生大的影响并创造新的路径。

· 类似“刑法”:评估体系偶尔给予不应得的荣誉,要比在应得的时候否定荣誉更好。

05



易产生不良导向的10种情况

· 照搬他人体系:好的研究影响力评估体系应反映它所在的学术系统,当前并不存在完美的研究评估体系。

· 影响力为“额外”:“影响力”的种子是在研究者日常研究实践中播下的。在这些实践中,研究社会问题的研究人员与社会中的现象和人互动,并受到社会现象和人的影响。

· 使卓越和影响力二元对立:影响力是通过研究实践创造的,没有卓越的研究就没有卓越的影响力。

· 避免不当的绩效认可(1):出色的表现应该获得积极的结果,并得到学术认可,研究具有良好的影响力是成为优秀研究者的一部分。

· 避免不当的绩效认可(2):另一方面,向那些能够产生影响力的研究者提供过多的奖励也是不合理的。

· 滥用指标:用单一的方法来评估,会导致某些方面的影响力显得比其他影响力更有价值(例如金融/经济),会对那些未在评估中展现出良好影响力的研究者产生负面影响。

· 考虑适用性:表明影响力的最简单方法是说服领导认识到你工作的价值。但这只适用于少数研究人员,其他没有引人注目的运气的研究者会望而却步。

· 时间窗口过长:如果你在评估20年前发生的事情,那么它更像一种奖励幸运者的彩票,不能帮助当代研究者调整他们的研究以使其更具影响力。

· 为了追求效率而“一致”:对不同的学科和社区进行统一比较可能会使某些学科显得比其他学科更具影响力,从而导致不良炒作,最终损害科学和社会的合法性。

· 评估规则极其教条:虽然制定“明确的定义”可能很有吸引力,但严苛的规则会损害他人的话语权,并且有人为操纵的风险。

(原文链接:https://enressh.eu/links_and_literature/enressh-deliverables/,本期推文为节选摘编,略有删减和编辑。)




本期策划 | 复旦大学国家智能评价与治理实验基地

供稿 | 邓晨菲 宋欣雨 王译晗

本期责编 | 金潇苒

基地官网:https://statevalbase.fudan.edu.cn/index.htm


·end·


下一篇

国外动态 | 多元的欧洲研究评估体系

版权所有:复旦大学
地址:上海市杨浦区邯郸路220号   邮编:200433