从语言学发展及社会影响浅谈NLP发展历程及意义

    胡惟仪 郭心宇 周子奇 安冠华 孙睿

    【摘要】自然语言处理(NLP)作为人工智能(AI)的子领域,近年来发展势头迅猛,而自然语言处理在语言学发展和社会发展层面也功不可没,本文旨在研究NLP在上述两个层面发展历程极其意义。

    【关键词】自然语言处理;语言学;发展影响

    【作者简介】胡惟仪(1998.08.09-),女,东北林业大学外国语学院,本科;郭心宇,周子奇,安冠华,孙睿,东北林业大学大学外国语学院。

    【基金项目】本论文为东北林业大学大学生创新训练项目成果(项目编号:201910255275)。

    一、NLP定义

    NLP(Natural Language Processing),即自然语言处理,是人工智能领域以及计算机科学领域的一个重要研究与运用对象。自然语言处理的主要研究目标和内容为人类与计算机之间如何运用自然语言进行真实而有效的沟通。

    二、NLP发展历程

    众所周知,语言行为是人类区别其他动物的本质特性,语言承载着人类的逻辑思维方式,是交流沟通的重要渠道。从语言的发生与目的角度来看,语言行为也可看成是一项施动行为。在该层面下,从严格意义上来讲,语言等同于人类沟通过程中所使用的指令,即自然语言。而随着科学技术的日益发展与壮大,人类与计算机之间进行真实有效沟通的目的、仅凭计算机语言的应用已无法全面达成与满足。因此,无论是从计算机科学发展的角度,还是从人类更好地掌握与操控计算机的角度去思考,利用自然语言实现计算机的运行需求亟待满足,这也就是将自然语言跨界运用到计算机科学领域这一重大突破的伊始。这一将人类日常生活中所使用的自然语言融合到计算机科学中、从而达到人与机器自由交流的过程即为NLP,自然语言处理。自然语言处理作为一个多边缘的交叉学科,其研究以语言学为主,涉及计算机科学、数学、心理学、哲学、逻辑学、统计学、电子工程学、生物学等各个领域。其所涉及学科的多样性造就了研究自然语言处理的复杂性与特殊性,也注定了实现人与机器交流的过程必将是困难重重的。从现已掌握的理论和技术方面来看,研究出高效的、优质的自然语言处理系统,仍然是科学界需要长期努力达成的目标。但是针对一些较低需求的应用,具备基本自然语言处理能力的实用性系统已经成功研制出,有些甚至已经商品化、普遍化,甚至开始产业化。人类日常生活中典型的运用自然语言处理系统的例子有:各种机器翻译系统、手机语音助手、自动文摘系统等。这些产品的普遍应用便是自然语言处理在计算机科学下所达成成就的见证。

    迄今为止,自然语言处理的发展已历经了四个重要时期,分别为萌芽期、快速发展期、低谷发展期以及复苏融合期。1956年以前可看作是自然语言处理的初生萌芽期,一方面,人类文明经过几千年的发展,在语言学、数学、物理学等方面积累了大量的原始材料,夯实了自然语言处理的基础理论知识。另一方面,第一代电子计算机的诞生不仅为自然语言处理的应用提供了物质基础,还引发了社会层面对机器翻译的需求,推动了自然语言处理的基础研究。另外,1952年贝尔实验室对语音识别系统的研究以及1956年人工智能的诞生等该时期内的相关研究的发展也为自然语言处理提供了技术铺垫。第二个阶段为1957年至1970年的快速发展时期,在这一时期内自然语言处理以极快的发展趋势迅速融入了人工智能领域。其主要研究人员也因研究方法的不同而被分为两派,一派是基于规则方法的符号派;一派是采用概率方法的随机派。符号派学者着重于形式语言理论以及生成句法的研究,于60年代末期又进行了形式逻辑系统的研究。而随机派学者采用基于贝叶斯方法的统计学研究方法,在这一时期也取得了很大的进步。在随后的1971年至1993年间,自然语言处理的研究因人们逐渐发觉自然语言处理的应用难以实现而到达了低速发展时期,难以取得重大研究成果。90年代中期之后,受计算机飞速发展以及网络技术日益完备的刺激,自然语言处理的研究得到了复苏与发展。至今已取得了诸如NLP的神经网络、注意力机制、预训练语言模型等多项具有里程碑意义的研究成果。

    三、NLP四方面影响

    自然语言处理,作为人工智能(AI)的子领域,是一种高科技新兴技术。而自然语言处理的意义在于深度学习,快速应用,提供就业岗位,对语言学发展的反馈。1.从自然语言处理这个研究领域发展出一批极具增长潜力的有用的应用程序。以下是其中几个:拼写检查,关键字搜索,查找同义词,从网站提取信息,分析机器翻译口语对话系统,复杂的问答系统。事实上,这些应用程序已经在工业中得到了广泛应用,例如,从搜索(书面和口头)到在线广告匹配。2.具有先进功能和改进性能的新模型和算法:其能够灵活地表示算法本身,更有效地端到端联合系统学习,更有效地在各项任务之间的转移学习方法,以及更好地正则化和优化方法。大多数机器学习方法都能很好的工作。深度学习提供了一个非常灵活,通用且可学习的框架,用于呈现视觉和语言信息的世界。3.人工智能的发展是大势所趋,当前从事互联网的人们已经制造出了海量的数据,未来还将继续持续,其中包括结构化数据、半结构化和非结构化数据。大数据、云计算技术共同整合使得结构化数据技术基本趋向成熟和稳定,而半结构化、非结构化的数据,因其自身的复杂性,在当前和未来更多领域应用都具有很大的困难和挑战。而当前市场对于 NLP 技术人才的需求又非常急切,而且这种状态将持续5-10年,大部分企业需要懂NLP技术的人来处理海量非结构数据。在这个市场缺口下,这种技术将会催生很多人才。这不仅是对自己的肯定,也是对自己未来的规划的认同。这种人才无疑是抢手的、待遇好的、发展潜力大的。在BOSS直聘上,对 NLP 技术人员的待遇需求中,仅仅是NLP开发工程师的薪资在30-60k。4.一般认为,自然语言处理是人工智能和语言学的交叉学科。但是,从其发展历程上来看,基本上还是由计算机科学家主导的一个研究领域,語言学家往往是起到辅助性的作用。甚至于,在其发展历史的许多阶段都没有语言学家的直接参与。然而,无论从其发展历程、现状和发展策略上来看,似乎都可以看到语言学理论的影子。目前,计算机学习和使用自然语言的研究成果会对语言习得、语言学习和语言使用的研究提供新的启发。

    四、结语

    由此可以看到,在人工智能发展得如火如荼的今天,自然语言处理似乎被人们揭开了神秘的面纱,本文只是列举了很少的一部分,但相信也会有待查明的理论问世,到那时自然语言处理就更会为我们的生活增添上浓墨重彩的一笔!

    参考文献:

    [1]冯志伟.自然语言处理的学科定位[J].解放军外国语学院学报, 28,3,2005,5.

    [2]Byte猫.自然语言处理的发展历程[J].简书,2019,3.

    [3]百度百科NLP词条[OL].

    [4]易水寒.NLP的介绍和如何利用机器学习进行NLP以及三种NLP技术的详细介绍,2018,6.

    [5]Boss直聘NLP相关数据[OL].

    [6]徐大明.语言学理论对自然语言处理的影响和作用[J].云南师范大学学报,2017,5.

    [7]张一凡,徐蔚然.基于文档频率的分级主题模型[D].北京邮电大学,2011.