作者:车万翔4, 窦志成11, 冯岩松1, 桂韬3, 韩先培10, 户保田5, 黄民烈6, 黄萱菁2*, 刘康9, 刘挺4, 刘知远6*, 秦兵4, 邱锡鹏2, 万小军1, 王宇轩8, 文继荣11, 严睿11, 张家俊9, 张民5,7*, 张奇2, 赵军9, 赵鑫11, 赵妍妍4
作者单位:1. 北京大学王选计算机研究所, 北京 100080 2. 复旦大学计算机科学技术学院, 上海 200438 3. 复旦大学现代语言学研究院, 上海 200433 4. 哈尔滨工业大学计算学部, 哈尔滨 150001 5. 哈尔滨工业大学 (深圳) 计算机科学与技术学院, 深圳 518055 6. 清华大学计算机科学与技术系, 北京 100084 7. 苏州大学计算机科学与技术学院, 苏州 215006 8. 之江实验室, 杭州 311121 9. 中国科学院自动化研究所, 北京 100190 10. 中国科学院软件研究所, 北京 100190 11. 中国人民大学高瓴人工智能学院, 北京 100872
摘要:近期发布的ChatGPT和GPT-4等大型语言模型, 不仅能高质量完成自然语言生成任务, 生成流畅通顺, 贴合人类需求的语言, 而且具备以生成式框架完成各种开放域自然语言理解任务的能力. 在少样本、零样本场景下, 大模型可取得接近乃至达到传统监督学习方法的性能, 且具有较强的领域泛化性, 从而对传统自然语言核心任务产生了巨大的冲击和影响. 本文就大模型对自然语言处理的影 响进行了详细的调研和分析, 试图探究大模型对自然语言处理核心任务带来哪些挑战和机遇, 探讨大模型将加强哪些自然语言处理共性问题的研究热度, 展望大模型和自然语言处理技术的未来发展趋势和应用. 分析结果表明, 大模型时代的自然语言处理依然大有可为. 我们不仅可以将大模型作为研究方法和手段, 学习、借鉴大型语言模型的特点和优势, 变革自然语言处理的主流研究范式, 对分散独立的自然语言处理任务进行整合, 进一步提升自然语言核心任务的能力; 还可就可解释性、公平性、安全性、信息准确性等共性问题开展深入研究, 促进大模型能力和服务质量的提升.未来,以大模型作为基座, 拓展其感知、计算、推理、交互和控制能力, 自然语言处理技术将进一步助力通用人工智能的发展, 促进各行各业的生产力进步, 更好地为人类社会服务。
关键词:ChatGPT, 对话式大模型, 大型语言模型, 自然语言处理, 通用人工智能
来源期刊:中国科学 : 信息科学
出版时间:2023-09-09
专辑:信息科技
专题:计算机软件及计算机应用; 自动化技术
分类号:TP391.1;TP18
收录数据库:CNKI