中国少数民族语言档案双语著录规范研究

    赵生辉 胡莹

    摘 要:少数民族语言档案的科学管理是我国民族地区档案管理工作面临的特殊性任务。本文在介绍我国民族地区语言文字多样性特征的基础上,提出并界定了少数民族语言档案双语著录的概念,分析其现实意义,探讨了少数民族语言档案双语著录的内容与过程、质量控制、多语言主题标引支持等问题。本文的结论对我国少数民族语言档案管理水平的提升和多语种档案信息资源的共享具有重要的参考价值。

    关键词:档案著录;双语主题词表;多语言信息管理

    Abstract: The Scientific management of archives in minority languages is the specially task of archival organizations in minority residences regions of China. Based on introduction of language diversity characters of China, the conception of bilingual description is suggested and its practical meaning is analyzed. Then, the issues such as content, procedures, quality control, multilingual subject indexing are discussed. The conclusion of this paper is significant to management standard enhancing on archives in minority languages as well as multilingual archival information sharing.

    Keywords: Archive description; bilingual thesauri; multilingual information access

    1 中国少数民族语言档案双语著录概念与意义

    著录(Description)是档案整理和编目工作的基本环节,其成果构成档案检索和利用的基础。在绝大多数情况下,我国档案工作者需要进行著录的档案是以国家通用的汉语和汉字作为记录符号的,著录用文字也是汉字。然而,我国绝大多数民族地区的档案管理工作是在多语言环境下进行的,管理的对象除了国家通用语言文字档案之外,还涉及为数众多的少数民族语言档案。由于语言文字的差异性,少数民族语言档案的著录工作所面临的管理需求要更加复杂。例如,档案著录要尽可能保证著录信息的“原始性”,对题名、责任者等关键信息原则上要进行“照录”,而不是将其翻译为另外一种语言文字,因此少数民族语言档案最好采用对应语种的文字进行著录。然而,民族地区档案管理工作最终是要为所在地区的社会大众提供服务的,在绝大多数当地公民并不能识读少数民族语言文字的情况下,将其翻译为国家通用语言文字版本以便更多的人可以理解又是一种现实的需求。因此,对少数民族语言档案同时采用对应语种的少数民族文字和国家通用语言文字进行著录就是一种可以兼顾上述两种需求的解决方案,即本文所述的“双语著录(Bilingual Description)”。中国少数民族语言档案的双语著录也符合行业标准的要求,《DA/T 18-1999 档案著录规则》规定:著录用文字必须规范化,汉字应使用规范化的简化汉字,外文与少数民族文字应依照其文字规则书写。由此可见,汉字、少数民族语言文字、外文都是可以作为档案著录用文字的。

    综上所述,少数民族语言档案双语著录是指民族地区档案管理人员遵照国家档案著录规则,在各类受控检索语言的支持下,采用特定语种少数民族文字和国家通用文字分析记录少数民族语言档案内容和形式特征并生成两种文字版本档案目录数据的过程。需要说明的是,本文所述双语著录主要限于当前在民族地区社会生活中具有较强社会影响力,文字信息处理技术相对成熟的蒙古文、藏文、维吾尔文、哈萨克文、柯尔克孜文、壮文、彝文、傣文、朝鲜文等少数民族语言文字形成的档案,我国历史上曾经存在过但目前已经完全退出社会生活的西夏文、契丹文、女真文等古文字的历史档案不在双语著录工作的范畴当中。

    少数民族语言档案的双语著录最大限度保障了档案目录信息的“本真性”特征,又考虑到绝大多数档案利用者的服务需求,对于提升民族地区少数民族语言档案管理工作的水平具有非常重要的意义。更为重要的是,如果全国各少数民族地区都基于统一的受控语言进行当地少数民族语言档案的双语著录,则可以通过国家通用语言文字为中介,将各少数民族语言档案信息联结为统一的整体,为更大范围内的跨语言档案检索与利用提供支持。因此,中国少数民族语言档案双语著录是民族地区档案管理工作科学化的客观需求,也是推动我国多民族语言档案资源共享的重要举措。

    2 中国少数民族语言档案双语著录内容与过程

    中国少数民族语言档案双语著录需要遵循《DA/T 18-1999 档案著录规则》要求,对题名与责任说明项、稿本与文种项、密级与保管期限项、时间项、载体形态项、附注与提要项、排检与编号项等著录项目进行全面著录。与单一语种档案著录有所不同的是,双语著录是将一种语言文字档案的语义信息通过两种语言文字进行描述和记录的过程,需要尽最大可能保障两种语言文字版本档案目录数据的语义对等性。为此,需要在著录之前确立以下原则:第一,双语著录只需要对语言文字进行转换,所有涉及编号的著录项目不需要进行翻译,照录原有著录结果。例如,排检与编号项、档案馆代码、档号、电子文档號、缩微号等著录项两种文字版本的著录结果保持一致。第二,分类号、主题词等涉及档案标引的著录项目可以留到最后进行著录,例如,在国家通用语言文字版本的绝大多数著录项完成的情况下,可以通过查阅《中国档案分类法》和《中国档案主题词表》确定国家通用语言文字版本的标引结果,分类号可以保持不变,主题词需要翻译成为与其内容最接近的少数民族语言词汇。第三,原则上双语著录过程中著录项目的排列顺序和格式保持不变,个别语种少数民族语言文字除外。例如,蒙古文的书写规则是自上而下竖行排列,维吾尔文的书写规则是自右到左,这部分少数民族语言文字的著录需要在保持著录项目内容和顺序不变的情况下遵从其原有书写规范,设计不同形式的著录目录格式。第四,著录过程中尽可能使用与档案本身内容信息较为接近的词语,如果少数民族语言档案中使用的某个词汇在国家通用语言文字当中找不到对应的词汇,也可以采用音译方式表示,例如,我国民族地区的地名、人名等信息都是采用音译方式产生的特定词汇。第五,针对古代文字和现代文字差异性较大的少数民族古文字历史档案,可以在题名照录的情况下,对其他著录项目采用现代文字进行著录。在对少数民族语言古文字无法识读和理解的情况下,可以向相关领域专家学者寻求帮助。例如,回鹘蒙古文与目前我国内蒙古自治区正在使用的现代蒙古文有着非常大的差异,如果要对这些古文字历史档案进行著录,需要可以识读这种文字的专家参与才可以完成。第六,当同一档案当中包含有两种或两种以上少数民族语言文字时,对其著录可以根据需要灵活安排,可以选择当地通用的少数民族文字和国家通用语言文字双语进行著录,也可以采用每一种少数民族语言文字进行单独著录,档案著录结果有可能出现三种文字甚至更多的文字。例如,西藏自治区档案馆所收藏的一些历史档案就是同时采用藏文和蒙古文两种少数民族文字,此时可以分别采用三种文字进行著录。第七,为保障著录结果不出现乱码,著录用文字处理软件最好使用Unicode作为底层代码方案。如果个别词汇无法通过计算机进行录入,也无法通过符号组合生成新字词,可以在系统中采用特点代码进行标注。

    少数民族语言档案的双语著录通常可以通过以下模式来实现:第一,直接双语著录模式。由同时掌握国家通用语言文字和少数民族语言文字的著录工作人员对同一档案采用两种语言文字分别进行著录。这种方式对著录人员的语言能力和专业素质有着非常高的要求,实践中符合这一条件的工作人员数量较少。第二,阶段双语著录模式。阶段双语著录分两个阶段进行:首先由精通少数民族语言的档案著录人员先采用少数民族语言文字进行著录,之后由另外一名同时掌握两种语言文字的工作人员将著录结果翻译为国家通用语言文字。第三,并行双语著录模式。所谓并行双语著录,是指针对已有国家通用语言文字版本的少数民族档案,由两名工作人员按照统一要求分别进行少数民族语言文字的著录和国家通用语言文字两种文字的著录。这种模式对翻译人员要求较低,但两种版本分别进行著录,可能会出现部分著录项目不完全一致的情况。第四,反馈双语著录模式。反馈双语著录主要针对国家通用语言文字档案少数民族语言文字译本的著录需要,首先根据国家通用语言文字版本内容,采用国家通用语言文字进行档案著录,之后将著录结果再翻译为对应语种的少数民族语言。这种模式主要针对汉语档案的译本,不能直接针对少数民族语言档案进行著录。在实践中,民族地区档案管理机构究竟采用哪种模式著录,需要综合考虑著录对象类型、双语版本是否存在、机构双语工作人员的数量和语言能力等多方面的因素,选择最适合的双语著录模式。

    3 中国少数民族语言档案双语著录控制与优化

    民族地区档案管理机构无论采用哪种模式进行少数民族语言档案的双语著录,都需要至少在其中一个环节对整篇档案或者档案目录数据进行翻译,翻译工作的质量直接决定了档案著录数据的质量。因此,双语著录的核心矛盾就是如何将源语言档案信息准确无误地转换成为另外一种语言文字的等价语素。为了确保双语著录工作成果的数据质量,民族地区档案管理机构通常需要对著录过程中可能影响翻译质量的因素入手,逐一采取措施,尽可能减少这些因素可能造成的著录结果的偏差。第一,人才是从事档案管理和服务工作最为关键的要素。民族地区档案管理机构应该配备精通少数民族语言文字和国家通用语言文字的双语翻译人才,同时加强档案管理相关知识的培训,使其能够准确把握档案著录工作中对著录成果翻译的规则与要求,满足高质量完成少数民族语言档案双语著录工作的需要。为此,民族地区档案管理机构需要把高素质双语档案管理人才的培育纳入工作规划,通过与相关高校联合培养方式,使其同时在语言能力和专业能力方面得到全面提升。第二,建立科学规范的双语著录工作流程,通过多重校核降低出现语言文字失误的概率。例如,双语著录结果通常需要不少于两名工作人员的相互审核,以便发现翻译过程可能存在的问题。对于部分内容非常重要的少数民族语言档案,除本机构内部校核之外,还应该寻求中国民族语文翻译局、地方政府下属的民族语言文字翻译机构的支持,进一步确认双语著录结果的质量。对于部分内容相对专业的少数民族语言档案,如果工作人员难以准确把握档案的内容,则双语著录的结果除了要由至少两名从事少数民族语言档案管理的工作人员相互审校之外,还应该由对应领域的专家学者进行把关,以确保著录结果的准确性。第三,开发专门的少数民族语言档案双语著录计算机辅助系统,内置少数民族语言文字和国家通用语言文字的机器翻译程序模块,为工作人员选择对应的词汇提供自动化支持。例如,中国民族语文翻译局目前可以提供汉文、蒙古文、藏文、拉丁维吾尔文、现代维吾尔文、哈萨克文、朝鲜文、彝文、壮文等文字信息的计算机在线翻译和智能校对等服务。总之,民族地区档案管理机构在进行少数民族语言档案双语著录时应该从人、流程和技术等多个方面采取措施,使双语著录工作始终处于可控状态。

    主题标引是档案著录工作的核心任务,通常需要根据统一的逻辑参照体系,对著录对象的主题信息进行描述和记录。由于语言文字的复杂性,“一词多义”“多词近义”“歧义”等现象在各类语言当中普遍存在,完全依靠人工翻译费时费力且著录成果的一致性得不到保障。因此,如果民族地区档案管理机构可以为其著录人员提供双语自动关联支持,使其在进行档案著录时可以较为熟悉的语言文字进行著录,著录结果一旦选定则自动与另外一种语言对应的语言要素建立联系,自动组成生成另外一种语言文字的档案目录数据,而上述构想可以使用“受控语言”来实现。受控语言是为保证信息组织和检索的一致性而设计开发的一种人工语言,在档案管理领域通常是以档案分类表和档案主题词表的形式来体现。主题词表即叙词表,是一种以经过规范化处理的自然语言词或词组作为检索标识来表达文献主题概念的人工检索语言,是进行文献主题标引、建立主题索引和开发目录数据库的重要工具。在档案管理领域,我国政府所编制和颁布的《中国档案主题词表》属于单语种主题词表。随着我国主要语种少数民族语言文字信息处理技术的逐步成熟和应用范围的逐步扩大,在《中国档案主题词表》的基础上开发可以融合国家通用语言文字和少数民族语言文字的多语言版本档案主题词表,为少数民族语言档案的高精度主题标引和高水平多语种档案信息管理系统的建设提供逻辑参照体系就成为亟待研究和解决的问题。“多民族语言档案主题词表”是以国家通用语言文字为核心,可以实现国家通用语言文字主题词和各少数民族语言文字主题词之间语义映射和关联关系的多语种档案主题词表,是实现跨语言档案主题信息检索的基础性工具。根据我国语言文字工作的实际,“多民族语言档案主题词表”由若干个双语子表构成,各个子表可以独立运行,也可以按照总表模式统一运行。按照子表独立模式运行时,参照各子表进行少数民族语言文字主题标引的结果主要用来支持当地少数民族语言文字与国家通用语言文字档案信息的跨语言检索。例如,内蒙古自治区档案管理部门可以参照《中国档案主题词表M-ZH(蒙汉版)》进行蒙古文档案的精准主题标引,标引的结果是用蒙古文來标注的,但是逻辑上与用汉语的等价主题词进行标注是一致的,档案信息检索系统可以根据词表的逻辑关联将其作一体化处理,用户无论是通过汉字还是蒙古文主题词进行档案信息检索,都可以得到蒙汉两种语言文字的档案信息。“多民族语言档案主题词表”可以使档案管理人员摆脱繁重的少数民族语言档案翻译工作,直接使用少数民族语言文字进行主题词标引,通过词表映射与国家通用语言文字、其他语种少数民族语言档案主题词建立隐含的逻辑关联。

    参考文献:

    [1]中华人民共和国档案局官网. DA/T 18-1999 档案著录规则[EB/OL].http://www.saac.gov.cn/xxgk/2015-05/28/content_100320.htm.[2018-05-16].

    [2]中国民族语文翻译局官网.智能翻译系统[EB/OL].http://www.mzywfy.org.cn/translate.jsp.[2018-05-16].

    [3]洪漪.档案信息组织与检索[M].武汉:武汉大学出版社,1999.11:45-47.

    [4]肖秋会.档案信息检索[M].武汉:武汉大学出版社,2011.8:58-61.

    [5]冯惠玲.档案文献检索[M].北京:高等教育出版社,1999.6:33-35.

    [6]赵生辉.中国少数民族语言数字档案管理协同管理的战略构想[J].档案学通讯,2016(3):88-92.

    [7]赵生辉.中国少数民族语言数字档案馆的建设构想[J].档案学通讯,2012(3):52-57.

    [8]赵生辉.中国少数民族语言电子文件双语著录研究[J].兰台世界,2012(2):39-41.

    [9]尚姗,高文静.国内外档案著录准则比较研究[J].档案学通讯,2014(2):100-104.

    (作者单位:赵生辉:西藏民族大学管理学院;胡莹:云南大学历史与档案学院 来稿日期:2018-12-13)