汉字古今音变查询系统的设计与构建

    王亚芳

    

    

    

    内容摘要:本文的研究对象是以《广韵》音系为代表的中古汉语语音系统到现代普通话语音系统的演变规律,结合传统汉语音韵学理论概括总结中古汉语到现代普通话的声、韵、调演变规律,在转写汉字音变公式的基础上引入数据库处理技术,采用关系型数据库模式对选取的材料进行分析处理,以Microsoft Access 2016为系统运行平台,构建汉字古今音变查询数据库。使用者输入所查汉字的音韵地位即可得出从中古语音演变到现代普通话的具体规律。主要价值有五方面,一是探究总结汉字古今音变规律,为以后的汉字研究提供了依据和参考;二是该数据库为汉字从中古语音系统到现代普通话语音系统的音变规律提供了系统的归纳和查询;三是该数据库有利于满足音韵学课程教学的需要;四是该数据库把音变规律的纸质文献转换成电子文献,提高了文献的利用价值和效率;五是有利于汉语音韵研究的信息化发展,为传统语文学科研究方式的革新提供探索的经验。

    关键词:音变规律 《广韵》 数据库 建模设计

    在当今理论创建和技术应用互补的时代,把计算机信息处理技术运用到传统汉语音韵学研究将成为一种趋势,对传统音韵学研究进行信息化处理是提升学科现代化水平的重要途径。本文研究的对象是以数据库技术为支撑的汉字古今音变查询系统。该数据库旨在为汉字音变规律的查询提供便捷的服务,从而提高传统汉语音韵学研究的现代化水平。

    一.基于数据库方法的汉语音韵研究现状

    随着信息处理数字化和网络化的全面实现和深入应用,将汉语音韵学与数据库结合在一起的研究越来越多。

    在结合数据库技术的传统音韵学研究方面,杨小卫(2010)的《计算机技术在古代文献整理和学术研究中的应用——〈集韵〉的XML建模和处理》以古代重要音韵学典籍《集韵》的XML建模和处理为例,展示了如何利用新的标注技术辅助古代文献整理和学术研究;[1]王娟(2016)在《〈广韵〉又音字的数字化研究》一文中,使用SQL结构化查询语言编辑查询代码,辅助使用Access数据库,统计得到3746个《广韵》[2]又音,又使用C#和Microsoft Visual Studio语言,制作并优化《广韵》又音检索系统。[3]上海师范大学汉语言文字学系教授潘悟云2006年主持的国家社会科学基金重点项目《汉语方言计算机处理系统》研究,在国内外首次把计算机技术全面应用于汉语方言的调查与分析。[4]此外,潘悟云教授还开发了“广韵查询系统”,该系统查询的内容主要是所查汉字在《广韵》中的音韵地位,包括中古声母、中古声调、中古韵母、中古韵摄、中古开合、中古等,以及该字的反切注音和该字在《广韵》原文中的页码、注释和开发者对它的校勘,同时还提供了高本汉、李方桂、王力、潘悟云等学者对所查汉字的中古音构拟。

    《广韵》又音检索系统能对《广韵》又音部分进行检索,但是缺乏对以《广韵》音系为代表的中古汉语声韵调系统的深入分析。“汉语方言计算机处理系统”功能齐全,几乎涵盖了汉语方言学的所有研究内容,系统还建有最大的上古音、中古音、近古音查询系统,与各方言数据库相结合,形成一个涵盖古今南北的汉语字音大字典,但是“汉语方言计算机处理系统”和“广韵查询系统”都未能提供汉语语音演变的具体规律。针对以上数据库缺少音变规律检索的不足,我们将结合Access数据库,设计建立以《广韵》为代表的中古语音系统到现代普通话语音系统的汉字音变规律的查询系统。使用者输入具体的汉字音韵地位,可以清晰地看到发生该音变的具体条件,弥补了目前相关数据库中缺少音变规律检索的不足。

    二.汉字音变规律查询数据库的构建意义

    数据库技术是目前使用计算机进行数据处理的主要方式,在以大批量数据的存储、组织和使用为基本特征的领域里,数据库有着广泛的应用。数据库把纸质文献转换成电子文献,载体介质的革命将文献由静态变为动态,提高了文献的利用价值和效率。[5]在研究从以《广韵》音系为代表的中古语音系统到现代普通话的汉字音变规律中引入数据库处理技术,其价值主要体现在以下几个方面:

    (一)汉字音变规律分析的需要

    构建的“汉字古今音变查询系统”能对汉字从中古音到现代普通话的声、韵、调演变情况进行穷尽性查询、统计、分析,为汉字从中古语音系统到现代普通话语音系统的音变规律提供了系统的归纳和查询。

    (二)音韵学教学的需要

    在汉语音韵学课程的教学中,数据库的使用为教师备课提供准确的材料支持,也满足了学生在课下学习的需求。通过使用汉字音变规律查询数据库,可以帮助学习者获得全面准确的信息。

    (三)有利于汉语音韵研究的信息现代化发展

    构建的“汉字古今音变查询系统”,对《广韵》的韵类、声类、声调进行整理分析,有益于汉字音变规律研究朝着信息化、现代化方向发展。这也符合当下文献数据化的发展趋势,为传统语文学科研究方式的革新提供探索的经验。

    三.漢字古今音变数据库的设计

    构建“汉字古今音变查询系统”,首先必须选定录入数据的依据和实现数据库的数据库管理系统。为了达到最优化的系统设计,我们以陈复华先生《汉语音韵学基础(修订本)》(2002)中的“《广韵》声母与普通话声母的比较”“《广韵》韵母与普通话韵母的比较”“《广韵》声母清浊与古四声演变为普通话四声的关系”这三部分作为归纳音变公式的依据。[6]《广韵》是中国现存的一部重要韵书,最能够代表中古汉语的语音系统,而《汉语音韵学基础》对《广韵》等内容作了详细的阐述,对《广韵》音系与汉语普通话系统的内容及发音规律等进行了比较,且它对从中古语音系统到现代汉语普通话演变规律的归纳和分析较为科学、清晰,能够满足研究需要。所以我们选择《汉语音韵学基础》作为参考依据。在数据库管理系统的选择上,本项目采用的是目前占据主流地位的关系型数据库(Microsoft Access 2016)。该系统安装简单,使用方便,容易开发,适用于小规模的数据处理。

    (三)中古声调演变为普通话声调的条件大致有3种:中古平声普通话演变为阴平和阳平,清音字读成阴平,浊音字读成阳平;中古上声普通话演变为去声和上声,全浊声母字演变为去声,次浊声母字不变,为上声;现代普通话没有入声字,中古入声,在普通话里分别演变为阴平、阳平、上声、去声,因此中古入声演变为普通话的规律不明确。[10]

    综上,用数据库方法处理中古语音系统到现代汉语普通话音变规律,不仅使检索音变规律更加方便快捷,而且有利于汉字古今音变规律的数据共享,推动汉字古今音变规律研究朝着信息化、现代化方向发展。

    在传统音韵学研究中引入数据库技术,不仅能在文献语料的统计上更为方便准确,而且能通过建模设计过程与量化分析,充分展现出研究对象内在的本质特征和外在表现特点,真正实现了研究手段的科学化和表达形式的精准化。

    参考文献

    [1]杨小卫.计算机技术在古代文献整理和学术研究中的应用——《集韵》的XML建模和处理[J].科技信息,2010,(10).

    [2]周祖谟.广韵校本[M].北京:中华书局,2011.

    [3]王娟.《广韵》又音字的數字化研究[D].华中科技大学,2016.

    [4]上海师范大学国家社科基金优秀成果简介[J].上海师范大学学报(哲学社会科学版),2009,38(02):2+133.

    [5]王平.基于数据库的中日韩传世汉字字典的整理与研究[J].上海:中国文字研究,2014(1).

    [6]陈复华.汉语音韵学基础(修订本)[M].北京:中国人民大学出版社,2002:89-175.

    [7]李俊山,胡双演.数据库技术及应用(原理+Access+ADO+VB)[M].北京:中国铁道出版社,2011:43-71.

    [8]左荣欣.AccessVBA活用范例手册[M].北京:中国铁道出版社,2017:123-141.

    [9]唐作藩.音韵学教程[M].北京:北京大学出版社,2015.

    [10]邢晓.常用汉字语音演变与语音规范化研究[D].新疆师范大学,2017.

    备注:本文是国家级大创项目阶段性成果 项目名称:汉字古今音变查询系统的设计与构建——从《广韵》到普通话 项目编号:S201910656004

    参与本文写作的还有:罗融、尹彦乔、何恩婷、王嘉豪

    (作者单位:西南民族大学文学与新闻传播学院)