摘要:生成式人工智能(GenAI)已迅速成为科学研究中的重要工具。为探究其相对于其他人工智能技术的传播和影响,本研究基于OpenAlex文献计量数据库开展实证分析,检索了与GenAI及其他AI技术相关的文献。为区分实际采用AI技术的文献与仅提及AI技术而未实际应用的文献,本研究开发了一种基于GPT-4和SciBERT的二阶分类器,将AI相关出版物分为应用型与讨论型两大类。针对2017年至2023年间的文献,分析了GenAI在各科学领域中的增长趋势及地理分布特征,并考察了团队规模与国际合作的变化,以评估GenAI作为新兴研究领域是否呈现出与其他AI技术不同的协作模式。
研究结果表明,不仅GenAI相关文献数量快速增长,其应用范围也从计算机科学扩展至多学科领域。美国研究人员贡献了全球近五分之二的GenAI文献,而中国研究人员贡献了近三分之一。此外,多个中小型发达经济体在GenAI研究应用方面也表现出较高水平。GenAI应用与更大的团队规模及更高的国际合作率呈显著正相关。在GenAI讨论类文献中,与国际合作的正相关性同样显著。这表明,在科学研究中应用GenAI可能需要更多的协作努力,尤其是国际合作,这可能会强化知识生产地理格局中嵌入的全球协作网络。
关键词:GenAI;AI;科学合作;SciBERT;OpenAlex
人工智能(AI)有望深刻变革科学与技术体系,由此引发了学界对其多方面影响的广泛探讨,涉及伦理、可重复性、就业、生产力及创造力等关键维度。近年来,生成式人工智能(GenAI)作为一类依托机器学习从海量训练数据中动态生成新内容的技术迅速崛起,进一步促进了相关讨论。尽管GenAI应用扩展迅速,其应用过程仍面临伦理与认知层面的多重挑战。此外,专有GenAI系统的不透明性(例如ChatGPT的闭源架构)也引发了有关知识产权和科学研究中伦理责任的根本性问题。
随着科研界对GenAI潜力与风险的持续关注,新兴研究方向及文献计量分析应运而生,旨在系统评估GenAI在科学研究中的发展规模、学科分布与影响范围。现有研究大多通过文献计量方法识别相关GenAI,并从作者、机构、学科与地域等维度展开分析,但是这些研究并未深入揭示GenAI在具体文献中的实际应用方式,厘清“实际应用”与“纯粹讨论”之间的区别显得尤为关键。
本研究的创新之处在于对两类论文进行了明确区分:一类是在研究过程中应用GenAI的论文,另一类是将GenAI作为研究对象的论文。从概念和方法论的角度来看,这个至关重要的区别能够探究研究人员是否正在积极地将GenAI融入其方法和工作流程中,还是在尚未实际应用的情况下仅仅考虑其潜在影响、可能性或风险。基于上述讨论,为理解GenAI在科学领域的传播及其潜在影响,文章围绕三个关键问题展开研究:
(1)GenAI在科研领域的应用方式与领域分布;
(2)GenAI与科研合作模式之间的关联机制,并与其他AI技术进行横向对比;
(3)GenAI的应用与国际合作关系之间的关系。
为解决以上问题,本研究对“GenAI在科学研究中的崛起”进行了探索性文献计量分析,利用OpenAlex(提供了全面的科学出版物元数据)分析筛选出的文献样本,通过对比GenAI与其他AI的技术特征,并参照早期成熟的AI技术的应用进展,探究GenAI带来的延伸影响。针对文献计量学检索的局限性——虽能检索到相关文献,却无法判定AI技术是否被实际应用的情况——本研究采用了基于GPT与SciBERT的二阶分类方法。该方法不仅用于识别GenAI及其他AI技术相关的文献,还将论文区分为两类:聚焦于AI技术实践的“应用型论文”,以及主要探讨AI而未实际运用该技术的“讨论型论文”。此外,研究还分析了GenAI在学科维度与地理空间的传播路径及应用态势,并深入剖析了其与科研团队规模、国际合作模式之间的内在关联。这些研究成果有助于推动关于GenAI在科学领域作用的讨论,并为相关科研布局与科技政策制定提供了重要参考。
通过系统性文献计量方法探究GenAI在科研领域的发展态势:本研究基于OpenAlex数据库、时间范围为2017-2023年构建专用数据集。首先制定检索策略获取初始文献,并通过排除歧义术语和去重处理形成样本库;其次聚焦学科渗透广度指标、地域分散度开展数据预处理;而后在数据分类阶段创新性地开发了基于GPT-4o和SciBERT的二阶分类模型:先随机抽取有效样本使用GPT-4o进行零样本标注,再微调SciBERT模型实现大规模自动分类,将文献准确划分为“应用型”(88.8%)与“讨论型”(11.2%)两类;最后建立泊松回归模型来分析GenAI应用与团队规模、国际合作之间的关系。
GenAI在各学科中的发表趋势
GenAI和其他AI相关出版物的年度趋势,与AI应用的趋势高度吻合。然而,在一些社会科学领域(如政治学、社会学、哲学、商业和艺术),讨论型论文相对更多。AI与GenAI的讨论型论文虽在社科领域更为普遍,但在其他学科领域亦有分布。
2017年至2023年间,其他AI出版物数量稳步增长,而科学领域GenAI应用增长更为迅猛,2022年起出现显著激增。这一指数级增长模式反映了学界对GenAI的参与度飙升。在计算机科学领域,GenAI研究发展迅速,但其规模仍仅为其他AI研究的十分之一。医学领域也呈现类似态势,其他AI研究在体量上继续保持领先优势。值得注意的是,在艺术、社会学和心理学等人文社科领域,GenAI展现出更强的学科渗透力,其在所有AI相关出版物中的占比显著高于理工科领域。这一分布可能反映出GenAI在人文社科领域的技术应用门槛相对较低、社会影响引发持续争议、在教育认知等领域应用潜力受到学界的特别关注。总体而言,GenAI被不同科学领域的出版物广泛提及,这凸显了其跨学科属性,以及其在多个研究领域中改变研究方法、实践模式和技术手段的潜力。

GenAI的地理分布
美国和中国是AI相关研究的两大领先国家,也是AI技术的积极应用者,两国在GenAI和其他AI领域的全球出版物中均占据相当大的份额。美国在GenAI相关研究出版物方面位居榜首,而中国则在其他AI相关研究中占据主导地位。美国和中国在GenAI与其他AI的研究成果对比表明,尽管中国在其他AI领域处于领先地位,且在更广泛的AI研究方面有着大量的研究成果产出,但这并不意味着其在GenAI研究方面也能占据主导地位。在GenAI这一新兴领域,截至2023年,美国的出版物占比已显著超过其他国家,这一发现凸显了美国研究人员在推动GenAI技术快速发展中的关键作用。

紧随中美之后,对全球AI出版物有重要贡献的国家包括英国、德国、印度和加拿大,其中多个国家在全球GenAI出版物中的占比相对更高。从GenAI与其他AI的全球出版物占比的比值来看,中国香港和新加坡表现突出。美国与部分小型经济体在将AI研究转向GenAI方面,呈现出更高的转型幅度。中国内地和印度的转型幅度相对较小,在所有国家中排名靠后。此外,中国在全球GenAI讨论型论文中的占比远低于美国,仅略高于英国。这些结果不仅展现了AI研究的全球格局,也揭示了GenAI与其他AI领域之间不断演变的动态关系。
AI领域的大多数研究成果是由高校完成的,但产业界在AI研究中也发挥着重要作用。总体上看,约20%的GenAI研究成果是由产业界单独或联合撰写的,而其他AI出版物的这一比例为8%。AI技术(包括GenAI和其他AI)应用领域的顶尖企业均来自美国或中国,其AI技术应用出版物主要划分为三类:(a)产学研合作成果;(b)产业界研究人员单独撰写成果;(c)涉及产业界的所有应用出版物(后者不仅包括 a 类和 b 类,还涵盖产业界与非学术合作伙伴联合撰写的应用出版物)。相关数据显示,产业界早期引领GenAI发展后,高校的产出量出现了更大幅度的增长。

回归结果
本研究对GenAI使用与合作之间的相关性进行了探究。在所有AI出版物样本中,GenAI论文平均作者数为4.04人,涉及1.33个国家;其他AI相关论文平均作者数为4.15人,涉及1.30个国家。在AI应用型出版物中,团队规模和国际合作的差异更为显著:GenAI论文平均作者数为4.61人,涉及1.33个国家;其他AI相关论文平均作者数为4.25人,涉及1.30个国家。

相关结果显示,在AI应用型出版物样本中,GenAI应用与团队规模呈正相关关系,并且GenAI应用型出版物的团队规模通常大于其他AI应用型出版物。相比之下,在AI应用型出版物样本中,GenAI应用涉及更多国际合作。
在讨论型出版物样本中,与其他AI讨论型论文相比,GenAI 讨论型论文的团队规模略小,但该差异不具有统计显著性;GenAI讨论型论文涉及的作者所在国家数量也略多于其他AI讨论型论文,尽管团队规模和国际合作的差异程度较小,但这种分化仍值得进一步探究。


本研究对2017至2023年间AI相关出版物展开探索性分析,发现GenAI在科学研究中的应用已显著超越其起源地——计算机科学,广泛渗透至医学、化学、地理学、社会学等多个学科。研究人员正越来越多地借助GenAI完成数据生成、预测建模与假设检验等任务。本研究开发了一套分类模型,将出版物区分为“应用型”与“讨论型”。基于此,GenAI应用型出版物所呈现的跨学科增长态势表明,它正逐步演变为一种通用目的技术(GPT)——不仅在其起源领域发挥作用,更成为推动多学科研究方法创新与解决复杂科学问题的关键工具。
从地域分布来看,截至2023年,美国在GenAI科研应用方面进展快于中国,其优势建立在活跃的技术生态、高研发投入、充足的产业与资本支持以及积极的人工智能政策基础上。中国则在其他AI领域保持高产出,体现出广泛的研发投入与政策支持,但在GenAI应用上相对滞后。值得注意的是,中国在GenAI应用型论文中的占比显著高于讨论型论文,反映出其研究文化更注重技术落地与实施,对GenAI潜在效益持更乐观态度,而对其伦理与社会影响的批判性探讨相对有限。
回归分析显示,GenAI应用的科研项目通常由规模更大的团队承担,且国际合作范围更为广泛。这一结果对“人工智能必然导致科研团队精简”的普遍观点提出了有力挑战,表明GenAI在当前发展阶段主要扮演着科研人力“补充”而非“替代”的角色。由于GenAI应用引入了新的技术复杂性,研究过程更需要跨学科团队的紧密协作,从而进一步强化了集体研究模式的重要性。值得注意的是,虽然GenAI讨论型论文的团队规模相对较小,但其作者地域分布却呈现出更高的国际化程度,反映出全球学术界对GenAI影响的共同关注与探讨。
与早期机器学习研究中团队规模趋小的趋势不同,本研究揭示了GenAI发展与团队规模、国际合作之间的正向关联。尽管伴随GenAI兴起出现了一系列地缘政治紧张局势,其研究实践中的国际合作水平仍保持在较高程度,甚至略高于传统人工智能领域。
本研究仍存在一定局限,包括定义与数据层面的约束,以及未能完全捕捉GenAI在科研实践中的全部使用场景。然而,我们构建的二阶分类模型为辨析“工具应用”与“现象讨论”提供了可行路径。GenAI在科学中的进一步扩散将带来包括团队结构、国际合作、研究效率、可重复性与伦理在内的系列新课题,这些均为未来研究指明了重要方向。
(全文及参考文献见Scientometrics,原文链接:https://doi.org/10.1007/s11192-025-05413-z,本期推文为节选摘编,略有删减和编辑。)
本期策划 | 复旦大学国家智能评价与治理实验基地
供稿 | 王萱瑜 王译晗
本期编辑 | 王萱瑜
基地官网:https://statevalbase.fudan.edu.cn