摘要:基于对来自20个国家学者的调查发现,GenAI工具在学术界已被广泛熟知和采用,但其采用呈现明显的国际与学科差异,同时也存在一定的角色与性别差异。例如,女性在科研中频繁(每日或每周)使用GenAI的可能性比男性低约10%,可能加剧性别不平等。一些非西方国家的使用率最高,可能与其在翻译服务方面的更高需求有关。社会科学领域的认知度最高,或因其对文本分析的依赖更强。总体来看,GenAI工具主要用于学术写作,而非数据分析或批判性思维支持。尽管如此,个性化教学与问题解决被普遍视为其主要优势。在学术应用中,最受关注的问题包括:信息不准确、剽窃风险、削弱批判性思维、缺乏透明度与可解释性、侵犯知识产权及数据隐私风险。对政策制定者而言,这些结果提示,需关注可能落后的学科与国家,并持续监测GenAI对科研实践的长期影响。
关键词:GenAI;科研AI;教学AI;高等教育AI
近年来,人工智能(AI)工具迅速普及,尤其是以ChatGPT为代表的大型语言模型(LLMs),因其基于海量语料的生成能力而成为典型的GenAI。尽管已有多项调查揭示学界对GenAI的兴趣不断上升,但这些研究多局限于特定国家或特定问题。与此同时,全球范围内学者的AI使用情况及AI的影响呈现出显著的不均衡,例如AI在广告与技术领域的专业人士中使用率更高,而医学、法律与金融领域则相对较低。
在学术界,AI的采用已在研究、教学与管理等多个环节迅速扩展,但其采纳程度存在人口学和学科差异。虽然总体态度较为积极,但GenAI仍被视为不如人类可靠,其“幻觉”、剽窃与内嵌偏见等问题引发了持续关注。
迄今为止,针对单一国家或特定议题的分析较多,但科学本质上是全球性网络,亟需开展国际比较研究。尽管近期《自然》和牛津大学出版社发布了关于GenAI在科研实践中应用的报告,但系统的跨学科、国际性学术研究仍然缺乏。此外,关于GenAI在学术领域的挑战与收益也缺乏系统的量化研究,既有研究多为探索性描述,尚未形成数据驱动的分析框架。
本研究围绕GenAI在学术界采用的五个核心问题展开,聚焦学术角色、学科、性别与国家差异等维度。全面理解这些差异,对于准确评估GenAI如何重塑学术生态具有重要意义:
1.学术界采用GenAI的情况如何因学术角色、学科、性别和国家而异?
2.GenAI在科研中的主要应用如何因学术角色、学科、性别和国家而异?
3.GenAI在教学中的关键用途如何因学术角色、学科、性别和国家而异?
4.GenAI在学术环境中的主要益处如何因学术角色、学科、性别和国家而异?
5.关于采用GenAI的主要担忧如何因学术角色、学科、性别和国家而异?
研究团队通过回顾现有文献、政策文件与新闻报道,识别GenAI与高等教育融合发展的关键议题,并采用迭代法确定问卷主题。最终设计的问卷包含10个核心问题。研究采用概率抽样设计,在全球科研产出较高的20个国家中尽可能构建代表性样本,以2022年为研究活跃度基准年。通过Scopus API提取2022年发表的全部期刊论文记录,生成所有作者的唯一ID及其所属国家信息。随后利用随机数生成器在各国样本中进行概率抽样。调查于2024年1月至3月通过Qualtrics平台向47,321名潜在受访者发放问卷,剔除无效、重复与退信后,共计40,078名有效收件人。总体回复率为4.30%,参与率9.93%,完成率43.29%。数据分析采用计数与比例进行描述性统计,使用t检验比较两组均值差异,方差分析(ANOVA)用于检验组间差异,并通过分层随机化检验评估结果显著性。
在20个国家的样本中,学术作者对GenAI工具的认知度普遍较高:73.1%的受访者表示“非常了解”,仅3.4%表示“完全不熟悉”。方差分析显示,不同学科、性别与国家/地区间的使用频率存在显著差异,但国家/地区与职称间差异不显著。社会科学领域的认知度最高,其次为人文艺术、工程学与自然科学,而医学与健康科学最低。
从国家/地区层面看,瑞士、荷兰与印度的认知度位居前三,俄罗斯、土耳其与日本最低。略超过半数(54.7%)的学者表示每月至少使用一次GenAI工具用于学术目的,而从未使用者占28.2%。方差分析进一步表明,不同学科、性别、国家/地区及职称的使用频率存在显著差异。博士研究生使用最频繁,其次为助理教授与讲师;社会科学采纳率最高,工程学次之。在国家/地区层面,中国台湾、韩国、印度与伊朗的学者日常使用率最高,而美国、英国、中国大陆与俄罗斯最低。东亚、南亚与中东地区整体呈现较高使用频率,这可能与英语非通用语但科研成果需以英文发表的翻译需求有关。
科研活动中的GenAI工具使用频率明显高于教学活动与行政事务。62.5%的受访者每月至少在科研中使用一次AI工具,仅13.4%从未使用。方差检验显示,性别、国家/地区与职称间差异显著,但学科与国家国家/地区差异不显著。博士研究生与博士后研究员使用最频繁,教授群体相对中等。
在科研活动中,GenAI工具的主要用途包括外语文本翻译(13.5%)、文稿校对(13.0%)、将初稿整合为学术文本(12.5%)以及辅助文献综述(12.46%)。
较少见的应用包括支持数据分析(6.4%)和用于论证或反驳观点(4.9%)。翻译功能的使用在性别与学科间相对稳定,但在地理分布上存在差异。卡方检验结果显示,仅在性别层面上科研用途存在显著差异,而学科领域、国家/地区及职称层面均未发现显著差异。
在教学领域,GenAI工具的主要用途是创建教学内容与教学材料(30.3%),其次是用于学习和讲授新概念(21.6%)。此外,15.6%的受访者将其用于设计作业,12.6%用于起草教学大纲。相对较少的应用包括为学生提供反馈和批改作业。
分析结果显示,教学应用的差异仅在学科领域间具有统计学显著性,而在性别、国家/地区和职称层面差异不显著。医学与健康科学、社会科学及自然科学对整体差异的贡献度最高。具体而言,医学与健康科学领域更倾向于使用GenAI为学生提供反馈,而自然科学领域在此方面的应用相对较少。
职称层面,正教授与兼职教授在“创建教学内容与材料”以及“学习和讲授新概念与理论”两项用途上表现出显著更高的使用倾向。在国家层面,西班牙与意大利的受访者显著更倾向于创建教学内容与材料。欧洲整体呈现相同趋势,而东亚地区的前三大教学用途依次为创建教学内容与材料、学习和讲授新概念与理论以及设计作业。
GenAI工具被普遍认为最显著的益处是提供个性化辅导与教学支持,37.4%的受访者对此表示认同或强烈认同。其次为提升问题解决能力(35.2%)与促进高等教育中的学生学习(34.5%)。
对于GenAI在科研项目中激发创造力与构思能力的作用,受访者观点分歧较大:31.2%的受访者表示认同或强烈认同,而35.9%持反对或强烈反对态度。分歧最明显的部分在于对AI生成内容的准确性与可靠性的信任:仅20.6%的受访者表示信任,30.7%持中立态度,近半数(48.7%)表示反对或强烈反对。类似地,对于AI生成内容的一致性与稳定性,仅20.0%的受访者表示认同,而50.1%存在不同程度的质疑。在不同学科、职称、性别与国家/地区层面,受访者对GenAI益处的认知差异均未达到统计显著性。

在所有受访者中,信息准确性被认为是最主要的担忧问题(67.8%的参与者表示中度或高度担忧)。其他显著的担忧包括:剽窃风险(65.0%)、削弱批判性思维(61.7%)、AI生成内容缺乏透明度(59.2%)、AI决策过程缺乏可解释性(57.8%)、侵犯知识产权(52.2%)、数据隐私泄露(49.0%)以及生成内容存在偏见与不公(41.3%)。根据分层Bootstrap检验结果,最突出的担忧是信息不准确。总体而言,“信息不准确”“剽窃风险增加”与“削弱批判性思维”是受访者最普遍关注的三大问题,表现出显著更高的共识性。

图7 对学术与教育场景中使用GenAI工具的担忧程度分布
在地理层面,日本、中国台湾以及东亚与太平洋地区的受访者普遍将“信息不准确”视为最主要的担忧。在职位方面,科学家/研究员/博士后群体同样将“信息不准确”列为首要关注问题。
本研究结果表明,截至2024年1月至3月,全球学术界对GenAI工具已具有高度认知,但在学术角色、学科领域、性别和国家/地区层面仍存在显著差异。学科规范与研究重点可能影响学者对技术的接触与应用程度——人文社会科学及工程领域学者对GenAI的熟悉度高于纯科学领域,这一趋势与先前基于小样本的研究结果相一致。瑞士、荷兰和印度学者认知度较高,而俄罗斯、土耳其和日本较低,这一差异可能与各国学者在英语学术写作与翻译需求上的不同有关。
多数受访者表示每月至少使用一次GenAI工具,表明该技术已在全球范围内深度嵌入学术工作体系。然而,仍有相当一部分非使用者,其主要障碍源于缺乏认知、怀疑态度或技术不确定性。不同学术角色之间的使用差异尤为显著——早期职业研究者(如博士研究生和助理教授)更倾向于尝试并采用这些新技术。社会科学和工程学领域学者的较高使用率,可能反映了两种不同的应用路径:社会科学倾向于语言与文本处理类的非技术性任务,而工程领域则偏向技术创新和实验辅助。社会科学对语言加工的高度依赖和相对较低的技术壁垒,可能进一步强化了其对GenAI工具的需求。对资深学者而言,初级研究者较高的使用频率提示其有必要主动加强数字素养与新兴技术能力的培养。
尽管部分受访者不承担教学任务,但总体来看,学术界在教学环节中对GenAI的使用也较为普遍。助理教授与讲师群体的采纳率最高,可能是因为他们承担了更多教学任务;而科学家、研究员等科研导向型角色则更倾向于将AI工具用于科研活动(若其兼任教学工作)。这一差异反映出学术角色定位对工具使用场景的显著影响。值得注意的是,中国台湾与印度学者在教学中使用GenAI的频率显著高于西方国家,这可能与翻译需求及教学理念差异有关:前者更重视教学创新与时效性,而后者可能更关注学术诚信、版权与剽窃风险。
从性别维度来看,男性研究者在GenAI的认知度与使用率上普遍高于女性。数据显示,女性在科研中每日或每周使用GenAI的比例比男性低10%,在教学与行政活动中的使用率分别低4%与3%。这一差距揭示出潜在的性别鸿沟,也提示应采取措施确保女性研究者不会在GenAI应用浪潮中被边缘化。
本研究揭示的国际差异显示,GenAI在多数(但非全部)非西方国家中展现出更广泛的应用潜力与更显著的效益。这种在早期阶段形成的技术熟悉度优势,可能使这些国家在未来科研与高等教育竞争中占据相对领先地位。相反,采用率较低国家的政策制定者需正视其在这一关键技术领域的相对劣势,并评估其是否可能削弱本国研究人员的长期学术竞争力。因此,在低采用率地区推动GenAI的认知普及与规范应用具有重要战略意义。
值得注意的是,本研究发现社会科学与人文学科在本轮技术变革中并未表现出“滞后”特征,表明无需对这些领域采取额外的政策干预或特殊支持。相较之下,性别差异的持续存在更值得关注。研究结果提示,应通过针对性培训、资源支持和政策激励,促进女性研究者更积极地使用GenAI工具,从而实现学术创新机会的公平化与普惠化。
从国际视角来看,本研究揭示的差异具有重要政策启示意义。GenAI的普及速度和应用深度可能重塑全球学术资源与知识生产格局。部分非西方国家因翻译需求与开放态度,在早期阶段形成了更高的技术采纳水平,这可能在未来的科研竞争中转化为潜在优势。而采纳率较低的国家则需警惕由此产生的“AI能力鸿沟”。
未来研究应进一步拓展样本范围,涵盖更多学术体系和语言环境,深入分析GenAI对学术行为、知识产出质量及科研伦理的长期影响。同时,应探索如何在政策和制度层面建立动态监管与教育培训机制,确保GenAI在学术领域的负责任使用与公平普及。
(全文及参考文献见 Information Processing & Management Volume 63,Issue 1,January 2026,原文链接:https://doi.org/10.1016/j.ipm.2025.104350,本期推文为节选摘编,略有删减和编辑。)
本期策划 | 复旦大学国家智能评价与治理实验基地
供稿 | 金潇苒 王译晗
本期责编 | 金潇苒
基地官网:https://statevalbase.fudan.edu.cn