档案统计调查研究中的时间段选取现象透视及反思

    李宗富 袁丽娜 冯少华

    摘 要:统计调查法在我国档案学界已经得到普遍运用且相关文章数量逐年增加,但也存在着调查样本数量少、调查范围窄、统计时间跨度短等问题与不足。本文对1978-2017年我国8种档案学核心期刊所载的统计调查类研究文章的调查周期进行统计分析。调查结果显示,档案统计调查类研究文献普遍存在着调查周期短、统计周期“互轧”或“重叠”甚至“滥选”时间段等现象以及文献命名不规范等问题。据此,笔者从研究者和期刊审稿及编辑人员两个方面提出建议和对策。

    关键词:档案统计调查;调查周期;调查时间

    1 引言

    档案统计调查就是运用一系列专门的统计技术和方法,对档案工作领域中的种种现象、状态、趋势等进行量的描述与分析研究,为档案工作科学决策提供坚实可靠的数据支持[1]。统计调查研究能为研究者把握学科的发展现状,提供热点、冷门领域信息,为后来研究者的研究选择提供情报参考价值。统计调查法在我国档案学界已经得到比较普遍的运用,其中计量法在档案学研究中的运用有成为热点的迹象,已呈现出“运用范围广、研究主题多”的特点[2];档案统计调查类文章数量逐年增加,部分档案专业期刊如《档案管理》还专门开设有“调查报告”等栏目并成为期刊的一大特色,这对提高档案学研究的准确性、严密性和科学预见性等有着明显的现实意义和深远的理论意义,也发展和完善了我国档案学研究的方法论体系。科学合理地选择时间周期、准确完整地测量各个调查单元是统计调查类研究最基本也是最重要的内容之一。然而,由于我国档案学者接触定量分析方法的时间较短,加之定量分析方法本身具有一定的局限性[3],因此目前在档案学统计调查类研究中还存在着调查样本数量少、调查范围窄、时间跨度短、调查时间周期重叠甚至有跟风或滥选统计调查时间周期等诸多问题和现象。鑒于此,本文拟以1978-2017年国内8种档案学核心期刊(北京大学《中文核心期刊要目总览(2017 年版)》)中的档案统计调查研究类文章为研究对象,对其统计调查周期的选取情况及其特点进行归纳总结,分析问题与不足,反思并寻求解决路径,以期能为进一步研究提供参考。

    2 数据获取与处理

    截至2018年5月31日,笔者以中国学术期刊网络出版总库CNKI为检索工具,文献来源限定为档案学专业现有的8种核心期刊。为获得更全面的数据,笔者从以下两个路径进行检索:以检索式为“篇名=调查or篇名=统计or篇名=计量”进行精确检索;以“年”为检索词对篇名进行精确检索。检索时间限定为1978年1月1日至2017年12月31日。检索后,把非时间段和非档案统计调查类的文章排除在外,将两个路径检索到的文献相加合并后再进行筛查去重,最后得到294篇有效文献。然后建立1978-2017年档案统计调查类文献数据库,并利用SPSS.22软件进行统计分析。

    3 数据统计与分析

    3.1 档案统计调查类文献基本情况分析

    3.1.1 发表时间分布。发表时间分布可以反映档案统计调查类文章的发展态势,其分布结果见图1所示。国内最早涉及调查周期的档案统计调查类文章可以追溯到1988年。从曲线走向来看,其分布规律大致可分为三个阶段:1988年-2001年,各年文献的数量分布较为均匀,且论文总体数量较少,只有22篇,年平均发文量1.6篇;2002年-2009年,此类文章的发文量逐渐增加,达到77篇,年平均发文量9.6篇;2010年以来,论文数量急剧增长,合计195篇,占总样本的66%,年平均发文量24.4篇。尤其在2013年达到峰值,其一年的发文量约等于1988-2002年的发文总量。整体来看,涉及调查周期的档案统计调查类文章数量随时间的推进呈现出波动式上升的趋势。

    3.1.2 期刊来源分布。研究文献的期刊来源既可以了解该研究领域的空间分布特点,也可以看出学术期刊的学术取向以及其在某一研究领域重要性[4]。档案统计调查类文章发表期刊分布结果见表1所示,在8种核心期刊中,《档案管理》登载的论文样本最多,达到133篇,占总样本的45%,《档案学通讯》与《档案学研究》分别位列第二、第三。总体来看,排名前3的核心期刊占有样本总量的70%,其余的5种核心期刊则不到30%,这说明档案统计调查类文章的期刊来源分布较为集中。

    3.1.3 文献作者分布。294篇文献中有293篇署有作者姓名,署名频次454,共涉及353名作者。其中,发表3篇以上的有18位作者,占全部作者的5%。18位作者共发表文献81篇,占署名文献的27.6%。根据普莱斯定律的相关内容,可以认为这 18位作者构成档案学统计调查报告类研究领域的核心作者。核心作者及发表个人频次,见表2所示。此外,发文只有1篇的作者有300人,占了作者总量的85%,这说明这类文章的发文作者相对分散。这其中有近七成的第一作者第一单位是高等院校和科学研究机构。

    3.2 文献统计调查时间周期分析

    3.2.1 统计调查周期的时间跨度分布。40年来,档案统计调查类研究文献的时间跨度周期分布见图2所示。可以看出,文献调查周期时间跨度分布整体呈现出调查周期越长,文献数量越少的趋势。横向来看,已有样本调查周期的时间跨度主要分布在30年以内,时间跨度为30年及以内的样本总数达到271篇,占总样本的92%;纵向来看,时间跨度基本在5的倍数年时达到极值。时间跨度为5的倍数年的样本数合计147篇,占总样本的50%。其中,时间跨度为10年的样本量最多,达到65篇,占总样本的22%。这说明此类文章的调查周期具有局部集中的特点。

    3.2.2 调查周期选取原因分布。笔者通过查看每个样本的摘要与正文,统计出作者在文献中对调查周期是否阐释原因的情况,发现有96个样本中提到了其调查周期的选取原因,占全部样本数的32.5%;而在198个样本中没有出现关于调查周期选取依据的文字,占全部样本数的67.5%。

    3.2.3 发表时间与调查时间的间隔分布。档案统计调查类文章具有一定的时效性,发表时间与调查时间的间隔越大,则档案调查类文章的有效性越低。为此笔者统计了此类论文发表时间与调查时间(以调查结束时间为准)的间隔分布,见表3所示,调查结束次年发表的样本数最多,第二年发表的样本次之。调查发表时间与调查结束时间超过3年及以上的文章占到11%。整体来看,此类档案统计调查类文章的发表时间与调查时间的间隔整体上较为合理,但仍有一部分样本的发表时间与调查时间间隔较长。

    3.3 相近或相同主题的文献调查周期选取情况分析。笔者通过分析文献题录中出现的高频关键词,结合部分档案学研究者在已发表的研究成果中[5]所列举的档案学研究主题与热点,统计同一研究主题下2个及以上样本的时间段选取情况,将某一研究主题下只有一篇文献与为同一研究主题但研究对象不同的情况排除在外,具体统计结果见表 4所示。

    在294个样本中,共涉及23个主题、96个样本,约占总样本的32.7%。其中关于研究图书馆与档案馆比较的文献最多,有8篇。相同主题下的文献关于调查周期涉及三种情况:一是调查周期完全相同,涉及6个主题;二是调查周期存在包含关系,共涉及17个主题;三是调查周期相互交叉,共涉及12个主题。不涉及此三种情况仅占所有相同主题文献的26%。

    3.4 文献命名情况分析。笔者根据统计情况归纳出档案统计调查类文章命名的四种形式。第一种是题目中明确指出调查始末时间,如《1979-2013年档案学领域评价研究》,采用此种方式命名的文章共计144篇,占总样本的49.0%;第二种是只提及调查起始时间或结束时间,如《从档案学会议看档案学发展——1981年来我国档案学会议的历史梳理与主题分析》或《1966年以前中华人民共和国档案宣传工作评述》,采用此种方式命名的文章共计16篇,占总样本的5.4%;第三种是以调查周期的时间跨度为题目,如《近10年我国网曝违规公文乱象研究——基于对36个典型违规公文的分析》,采用此种方式命名的文章共计56篇,占总样本的19.0%;第四种是题目中不体现时间信息,如《濮阳县档案馆馆藏婚姻登记档案利用情况统计与思考》,采用此种方式命名的文章共计78篇,占总样本的26.5%。

    4 问题与建议

    4.1 存在问题

    4.1.1 档案统计调查短周期现象突出。从调查周期的时间跨度分布来看,档案统计调查类文章的短周期现象逐渐显现。调查周期的时间跨度在五年及以下的文章共计55篇,约占总量的20%,且集中分布于2002年后。统计调查时间跨度小、周期过短,不仅难以把握相关主题的全貌及发展趋势,难免有以偏概全、盲人摸象之嫌,缺乏对研究主题的宏观总体把握,对后来研究的情报参考价值有限;同时,调查时间过短也不利于学术研究,会对调查结果的准确性与科学性造成一定的不利影响。笔者通过访谈部分作者,总结出短周期出现的可能原因:一是为了减少调查工作量,加快调查完成速度;二是受客观情况与调查素材限制,难以获取更长周期的调查资料或数据;三是迫于职称晋升、学业要求等外界压力有意分割调查周期以形成多份调查成果。

    4.1.2 相近甚至相同主题文章调查周期 “互轧”或“重叠”现象普遍。从相近或相同主题下调查周期选取情况分析可以看出,76%的研究主题都存在时间周期“互轧”或“重叠”现象。这种相近或相同主题文章调查周期交叉重叠的现象将会导致三个不良后果:一是重复归纳和总结前人工作与科研成果,不利于学术进步。二是发文泛滥,占用有限的档案文献出版资源。三是容易出现重复发表、抄袭等学术不端行为。

    4.1.3 统计调查周期“滥选”现象较为普遍。整体来看,档案统计调查类文章存在着较为普遍的调查周期“滥选”现象。首先,调查周期的选取缺乏科学依据。67.5%的样本没有其调查周期的选取依据,选取存在主观随意性。其次,统计调查周期“取整”现象普遍。50%的样本调查周期的时间跨度选取了5的倍数年,这种过度追求“取整”可能会造成重复归纳与相同主题时间段交叉重合的现象。

    4.1.4 文献命名不规范。任何研究成果都会随着时间的推移成为历史,档案统计调查类文章也不例外。“近五年”“××年以来”此类采取相对时间的命名方式缺乏参照时间,尤其是当调查时间与发表时间存在一定时间间隔时,但这类命名方式占到总样本的24.4%。同时,还有26.5%的档案统计调查类文章在篇名中不体现时间信息。这并不利于后人的学术研究,同时也容易造成一些学术乱象。命名方式的不规范业已出现以下两种情况:一是使用不同的命名方式重复发文,如《着眼社会需求提高利用效率——江苏射阳县档案馆1986-2005年档案利用工作的分析报告》与《着眼社会需求提高利用效率——射阳县档案馆近来20年档案利用工作调查分析》题目命名不同,但作者均为戴泳江,分别发表于2006年第11期的《中国档案》和2006年第12期的《档案与建设》,而这则是典型的论文重复发表。二是主题相近甚至相同并且调查周期相近的文章频现,如《近十年我国数字档案馆研究的统计与可视化分析》和《基于文献计量法的国内数字档案馆研究分析》,这两篇文章的主题完全相同,前者调查周期是2003-2012年,发表于2014年第2期的《档案管理》,后者调查周期是2000至2016年,发表于2017年第4期的《档案学研究》,其实造成了一种学术浪费与重复研究。以上两种情况在档案统计调查类研究中并不少见。

    4.2 改进建议

    档案统计调查研究应遵循一定的原则和程序。在运用计量法研究之前,至少应有三道论证程序,一是“Why”,即为什么要计量研究,主题是否适合运用计量法;二是“What”,即计量单元有哪些,计量分析的预期结果是什么;三是“How”,怎么运用计量法,现有的条件与能力是否能保证计量研究的科学性及学科代表性。这三道程序并不是孤立的,而是在前者的基础上反复地论证研究的科学性、合理性[6]。

    4.2.1 科学合理地选取统计调查时间周期。档案统计调查类研究的时间周期选取应做到有理有据。统计调查周期应根据研究主题而定,具体问题具体分析,不应盲目追求省时省力而缩短或随意设定研究时间跨度和周期。档案统计调查类研究文章时间段选取可以依据以下三种情况:一是全周期研究,从所要研究主题的起点入手,作为调查起始时间,直至研究当前截止时间,从而进行全周期的统计调查研究分析。二是选择重要的时间节点作为统计调查的时间起点。选择与研究主题相关的重要时间节点或重要历史时间,如1949年建国、1978年改革开放、1981年中国档案学会成立时间、1988年《中华人民共和国档案法》实施时间、2001年我国加入WTO等时间为起点。三是衔接已有研究文献。为避免重复归纳和统计遗漏,作者可以将调查起始时间与同一研究主题下已有调查成果的调查结束时间相衔接。

    4.2.2 统一、规范统计调查类研究文章题目名称、命名等。一方面作者在撰写文章时应当体现调查时间,并应采取规范的命名格式。首先,应当使用明确时间段而非相对时间段进行命名;如调查周期具有特殊意义或题目带有一定深意不宜用明确时间命名方式时可采用副标题的形式加以说明。另一方面,档案期刊界内应建立一套规范、统一、科学的统计调查类文章命名标准,或在现有的学术论文编写标准如《科学技术报告、学位论文和学术论文的编写格式》(GB/T 7713-1987)等中制定相关格式标准。

    4.2.3 期刊审稿及编辑人员应严格把关,提高审稿标准。审稿人是期刊论文质量的重要把关人,审稿人的严格把关可以一定程度上减少低水平档案统计调查类文章的发表。首先,可建立一套针对档案统计调查类研究时间周期选取的审核标准,将不符合标准或低水平重复的调查报告退回处理。此外,审稿人应在保证质量的同时,尽量减少审稿周期,缩短档案调查报告的调查时间与发表时间间隔,以保证调查研究的时效性。

    档案统计调查类研究等定量研究方法对档案学科的发展完善十分重要,未来的档案学研究在运用计量方法等进行统计调查研究时,不仅需要逐渐扩大统计调查样本与时间跨度,更应该科学合理选取统计调查时间周期,同时端正档案学术研究行为,更多地关注有价值的档案统计调查主题,进而推动档案学术研究和学科发展。

    参考文献:

    [1]王德中.档案统计工作应注意的几个问题[J].档案管理,2001(2):33-34.

    [2][6]王新才,文振兴.档案学研究中计量法运用的计量分析[J].檔案管理,2014(3):59-62.

    [3]李财富.关于档案学定量分析研究的反思[J].山西档案,1997(5):11-13.

    [4]李财富,张锦云.2000年以来我国档案利用研究的文献计量学分析[J].档案学通讯,2012(3):51-55.

    [5]陈忠海,董一超.定量研究方法在档案学研究中的应用状况、问题及建议——基于2004-2015年《档案学通讯》《档案学研究》所载文献的统计分析[J].档案学通讯,2016(2):41-47.

    (作者单位:郑州大学信息管理学院 来稿日期:2018-06-20)