我国高水平科技期刊HTML出版的实践探索与发展进路

    【摘 要】 HTML出版是科技期刊实现内容延伸、知识关联与知识重组的有效途径,基于HTML结构化制作的特点和优势,打造充分集成采编、结构化校排与信息服务等功能的数字出版平台,有助于满足读者碎片化阅读需求,显著提高科技期刊刊文的显示度与传播力。近年来,我国高水平科技期刊不断探索HTML出版的新思路,在全媒体资源管理、优化出版流程、发挥期刊学术价值、加快内容资源国际化传播等方面积累了宝贵的实践经验。

    【关 键 词】科技期刊;HTML出版;中国科技期刊卓越行动计划领军期刊

    【作者单位】程海涛,广东财经大学华商学院。

    【基金项目】2018年广东省普通高校青年创新人才项目(2018WQNCX309)。

    【中图分类号】G237.5 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2020.07.013

    随着网络技术的快速发展与智能移动终端设备的大范围普及,科技期刊的出版流程与出版方式已发生颠覆式变革。一方面,出版单位持续利用先进数字技术开发在线出版平台,结合新媒体的资源整合与信息传播优势,为期刊多元化出版与精准化服务提供有力支撑。另一方面,出版单位不断提高内容资源的数字化程度,致力于打造我国科技期刊数字出版的核心竞争优势[1]。但当前,用户对科技期刊的信息质量、传播时效性与渠道多样性提出更高要求,传统的数字出版技术显然难以为科技期刊数据碎片化处理、多格式数据文件兼容、跨平台传播提供坚实保障。

    超文本标记语言(Hyper Text Mark-up Language,HTML)出版作为一类可并行实现内容资源结构化生产与多版本发布的新兴数字出版技术,不仅对期刊的数据版本管理、出版周期缩短、内容成产成本降低具有不可小觑的作用,而且可促进期刊内容与样式分离,真正实现元数据一次加工、多元发布、重复利用[2]。当前,世界顶级科技期刊纷纷加快了基于HTML的数字出版建设进程,自2010年开始,Cell、Nature、Science、PNAS均利用HTML出版技术构建了涵盖智能化投审稿、排版、内容生产与发布营销的出版管理云平台,并对期刊论文进行面向结构化标引、知识关联挖掘、视听化改造的富媒体出版[3]。我国亦在不遗余力地探索借助HTML出版的流程与技术优势来提供数字出版增值服务,入选2019年度分领域发布高质量科技期刊分级目录试点的大部分科技期刊都开通了HTML出版业务,提供术语语义关联、作者身份标识、参考文献链接等特色增值服务。文章选取在HTML出版起步较早且在服务理念、服务方式、服务内容等方面较为领先的入选中国科技期刊卓越行动计划领军期刊类的科技期刊为研究对象,对其HTML出版的先进做法进行实证考察。

    一、研究对象、研究方法与研究过程

    2019年9月,中国科协、财政部等七部门联合启动实施“中国科技期刊卓越行动计划”,该计划以五年为周期,面向全国科技期刊,采用财政专项资助方式支持建设一批具有国际学术影响力、科技成果传播力与原始创新引导力的高水平期刊。同年11月,中国科技期刊卓越行动计划办公室发布《关于下达中国科技期刊卓越行动计划入选项目的通知》,从领军期刊类、重点期刊类、梯队期刊类、高起点新刊类四个方面遴选了285本刊物作为首批资助对象[4]。中国出版协会发布的《2019年度中国出版业发展报告》显示,以中国科技期刊卓越行动计划领军期刊为代表的高水平期刊数字出版平台很早就推出了HTML全文阅读服务, 在HTML出版技术支撑下,构建了集同行评议、HTML结构化生产管理和网络发布为一体的数字出版可持续运营体系[5]。因此,本文以中国科技期刊卓越行动计划领军期刊为研究对象,主要采用电子问卷、案头调研、邮件核查等实证方法,对HTML出版的工作流程与功能类型进行实证考察。首先,本文采用电子问卷法获取样本在HTML出版的方式方法、关键路径等方面的显性数据,而后借助邮件核查法析出难以直接获取的隐性信息,最后利用案头调研法收集后续实证分析所需要的关键数据。

    二、我国高水平科技期刊HTML出版的实践分析

    1.建立一体化全流程的HTML出版平台

    实证发现,样本期刊均利用HTML出版平台或自主开发集排版校对、信息服务于一体的HTML出版系统,实现了基于HTML出版技术的生产流程再造。如《细胞研究》便依托SciEngine(engine.scichina.com)全流程数字出版平台进行智能化投审稿、结构化排版等高质量内容生产管理。一方面,其利用SciEngine平台中的“作者投稿”“编辑办公”“专家审稿”“系统管理”“统计分析”等模块,对读者、同行评议专家、读者数据进行分层分类处理,作者在注册实名ORCID(开放研究者与贡献者身份)标识码的同时,平台会以HTML超链接形式向期刊部和审稿人推送该作者学习工作经历、科研论文DOI等方面的基本学术信息。另一方面,其利用HTML语言标记文章内容并形成规范化的元数据HTML文件,根据预出版、网络在线出版和正式出版的差异化要求,输出具有较高规范性、准确性与完整性的结构化数据。《光:科学与应用》高度重視排版前端和后端环节的衔接,利用HTML结构化排版技术延伸原有采编系统的功能,采用“所见即所得”的交互式排版方式,让编辑与专业排版人员在HTML系统中对结构化处理的稿件进行协同校对修改。

    2.持续拓展期刊HTML出版的功能边界

    第一,利用页面知识语义化关联方式增强和丰富文章内容。即利用HTML技术对期刊网络平台发布的各学科文章中的专业术语进行语义化组织,用户轻点鼠标便可获取与专业术语直接相关的参考文献、图表图例及其他高价值资源。如《岩石力学与岩土工程学报》(英文版)的HTML出版不仅提供章节跳转、图表独立呈现、文章信息外部链接等基础功能,还在HTML页面设置了语义化链接方式,为用户带来跳跃式关联阅读体验。

    第二,在HTML文章页面中提供基于单篇论文的多维评价指标数据,便于读者一站式了解文章的关注度与影响力。《国际口腔科学杂志》(英文版)和《中华医学杂志》(英文版)的做法最具代表性。《国际口腔科学杂志》(英文版)在HTML页面嵌入社交网络和索引数据库的分享量、被引频次等多维评价数据,并且允许读者直接下载高被引文章中的表格数据。《中华医学杂志》(英文版)通过在HTML文章页面添加ORCID个人主页链接,主动为读者推送论文浏览量、下载量、分享量等大数据统计报告。

    第三,提供与文章直接相关的数据集、音视频等重要辅助资料。如《分子植物》在每篇HTML文章末尾处都链接了作者采集的原始数据与音视频资料,并与第三方数据仓储、机构数据库等知识共享平台建立合作,为注册用户开放获取支撑性数据。

    3.积极对接用户与主流知识资源数据库

    积极与国际权威知识资源数据库相对接,利用自媒体让用户深度参与HTML出版全周期,是我国高水平科技期刊HTML出版的实践特色。

    第一,实现与国际主流学术出版平台间的数据实时交换,增强HTML文章传播力。实证发现,全部调研样本均与PubMed、Web of Science、Engineering Village、CrossRef引文链接系统等国际主流数据库建立了战略伙伴关系,确保用户可跨平台采集数据。如《国家科学评论》(英文版)和《科学通报》(英文版)在获得SAGE Journals平台的HTML出版权后,Scopus和ESCI两大国际数据库立刻对其近五年内的刊文进行HTML网页发布,科睿唯安(Clarivate Analytics)仅用了15天便完成对HTML文章的元数据提取工作,并实时展示在Web of Science数据库中。

    第二,利用微信公众平台、微博开放平台提高用户参与HTML出版的深度和广度。《摩擦》(英文版)的实践做法较具代表性。作者完成投稿后,HTML系统默认为作者设置为关注微信公众平台,此后公众号将会以“模板消息”“公众号订单提醒”“消息主动推送”等方式为用户推送稿件处理进度、与作者科研领域相适配的最新研究文献、稿件录用后的转载被引情况等定制化信息,方便用户动态跟踪HTML文章的出版阶段与学术影响力。为缩短HTML出版周期,刊物在微信公众号中开辟 “预印本服务专区”,以HTML链接形式快速刊发简报类学术文章,此举大大激发了用户参与HTML出版的内生性动力。

    三、我国高水平科技期刊HTML出版的发展进路

    1.提高出版效率:打造基于HTML的全流程智能化出版平台

    实证结果表明,建立一体化全流程的HTML出版平台,促使数字出版过程中的网络采编、在线排版、网络发布与信息服务等环节协同运行,可极大提高科技期刊的出版效率与市场竞争力。因此,我国应打造基于HTML技术的全流程智能化出版平台,为科研数据的持久保存与再利用、个性化信息服务、多元立体出版提供基础支撑。

    第一,建立健全基于HTML的一体化数字出版功能模块。当前,我国高水平科技期刊均利用HTML技术来最大化挖掘采编、校对、发布等数字出版各个环节的价值,实现作者、编辑部、排版公司与数据信息之间的功能整合。借鉴这一做法,科技期刊可依托HTML技术优化现行出版系统中的采编、校排、数据库等功能模块,如发挥HTML智能解析优势,实现投审稿工作流引擎、表单、邮件服务和功能参数等组件式定制;借助HTML结构化排版系统将word和LaTex格式的文档结构化分解为图表、音视频、网络版文档等多元文件,为数字出版提供丰富的底层数据;在HTML平台上集成用户数据库、文献数据库与元数据库,通过存储与分析,对期刊资源进行深度挖掘与有效管理[6]。

    第二,优化基于HTML的智能化出版流程。即促进HTML出版平台不同功能模块间的高级别交互,实现从稿件审理流程、生产流程到传播流程的无缝对接。借鉴《光:科学与应用》所采用的交互式HTML出版流程,科技期刊可进一步整合期刊原有的数字出版流程,让编辑、作者和排版人员通過HTML结构化校排系统进行协同编辑交互校对,在对期刊全文内容按语义含义和属性进行聚类存储、深度索引的基础上,确保优先出版的时效性与价值性。

    2.丰富出版功能:利用HTML技术让用户一键获取关联知识

    当前,我国高水平科技期刊HTML出版没有止步于网络版HTML发布,而是充分发挥HTML出版技术的结构化制作价值,不断拓展HTML出版的功能边界,提供文章结构化标引与知识关联等增值出版服务。一方面,可借助HTML结构化生产与多版本发布功能充分挖掘刊文的学术价值。实证发现,我国高水平科技期刊不仅采用国际主流的HTML优先数字出版实时发布数字资源,而且对单篇文献中的摘要、关键词、章节标题、单个图表等碎片化知识点进行高效聚合,确保用户可一次性检索到具有最优价值的学术内容。鉴于此,我国科技期刊可凭借HTML搜索引擎技术在碎片化知识关联、文献资源链接、图表独立呈现等方面的特色优势,创建支持出版商、出版物、资源相关性等多维条件的碎片化内容查询功能。为提高检索结果的可靠性,科技期刊还应提供HTML表单分级、HTML时间戳索引等精细化服务,让用户能够快速准确地发现关联知识[7]。另一方面,探索单篇论文评价数据推送、视听化科研数据推送等衍生数据服务,提高用户的获得感和满意度。鉴于科技期刊自主研发此类功能需要耗费高昂的成本费用,我国科技期刊可以效仿调研样本依托第三方权威的HTML数字出版平台来提供在线评价分享、主题订阅、兴趣关联阅读、视听资料智能推送等定制化服务。如与ScienceDirect、RSC、PLoS、Science等国际知名的数字出版平台合作,将与文章相关的原始数据以AVI、MP4、MKV、JPG、TIFF等附件形式链接在HTML页面上,为注册ORCID的用户提供论文在线浏览量、下载量、Altmetric得分等学术评价数据并支持在线评论,使用户能够便捷获取碎片化关联知识,并让编辑充分了解期刊HTML出版情况和读者的阅读倾向。

    3.强化出版协同:促进HTML出版充分兼容对接主流数据库

    实证发现,我国高水平科技期刊HTML出版的跨数据库资源链接服务十分完善,这得益于这些期刊均致力于放开出版资源数据库的开放接口限制,并寻求与国际主流数据库间的战略合作,通过文献跨库链接与资源共享来增加学术成果的辐射力和影响力。因此,我国应促进科技期刊HTML出版充分兼容对接国际主流数据库,确保科技期刊能够直接跨平台采集第三方数据库和学术机构网络优先出版文章中的元数据。

    第一,通过建立符合国际标准的HTML结构化数据和符合国际学术出版规范的内容管理系统,降低科技期刊HTML出版平台共享国际主流数据库文献资源的门槛。如为所有HTML出版的文章注册DOI号并通过DOI system(http://www.doi.org/index.html)与世界知名科技期刊出版商、数据库建立文献动态链接,形成一个开放式的学术信息门户[8]。另外,为避免出现HTML出版链接版权争议问题,我们可借鉴《微系统与纳米工程》(英文版)与

    Nature Nanotechnology、Journal of the American Chemical? Society、Angewandte Chemie等世界顶级期刊签订HTML引文链接协议的做法,獲取对相关期刊网站、数据库中文献进行HTML引文链接的合法性授权。

    第二,增强科技期刊HTML出版数据共享服务的针对性与实效性。我国高水平科技期刊HTML出版不仅要积极对接国内外知名学术出版平台,还要持续提高HTML出版数据共享服务的人性化程度,为用户带来丰富的跨平台阅读和信息搜索体验。科技期刊可参考《中国科学:数学》采用嵌入式HTML呈现手段增加共享文章链接集中度与显示度的做法,确保在HTML出版平台上被WOS数据库收录的文章均外挂IF影响因子、CiteScore(引用分)、SNIP(单篇论文的源规范化影响)等学术贡献评价链接,并对所有引用自第三方数据库的文献进行全文嵌入式HTML标记,让读者能够凭借语义相似度、本体术语类型等检索类目快速、全面、精准地锁定目标信息。

    四、结语

    HTML出版是数字出版转型升级的主要方向。对科技期刊而言,构建一体化全流程数字HTML出版平台,能够提高期刊出版效率与传播效果;对用户而言,HTML出版有助于迎合读者碎片化阅读习惯,从文献资源的可复用性、呈现页面的简洁性与多链接等维度实现碎片化条件下的深阅读。当前,我国高水平科技期刊HTML出版已经在工作流程模式、内容发布营销等方面形成了差异化竞争优势,未来若能够建立基于HTML的智能化出版系统,推动HTML出版内容生产向实时生产、数据化生产、用户参与生产转变,并持续深耕用户知识服务、优质资源合作等领域,将加快提高我国科技期刊的学术声誉与国际竞争力。

    |参考文献|

    [1]杨郁霞. 基于PC端调查HTML在高校科技期刊中的应用[J]. 编辑学报,2019 (3):316-319.

    [2]杨臻峥,郑晓南. 利用HTML5页面制作工具打造科技期刊编辑全新工作方式——以《药学进展》编辑部的办刊实践为例[J]. 科技与出版,2015(11):78-81.

    [3]黄延红,侯修洲. 科技期刊全流程数字出版平台的构建[J]. 中国科技期刊研究,2020 (1):51-55.

    [4] 王炳炎. 285个项目入选中国科技期刊卓越行动计划[N]. 中国新闻出版广电报,2019-11-25.

    [5] 中国出版协会. 2019年度中国出版业发展报告 [R]. 2020-01-19.

    [6]蒋晓,谢暄,叶芳,等. 基于XML的科技期刊一体化数字出版流程[J]. 传播与版权,2018(1):104-107.

    [7]翁彦琴,李苑,彭希珺. 英国皇家化学会(RSC)——科技期刊语义出版模式的研究[J]. 中国科技期刊研究,2013(5):825-829.

    [8]苏磊,张玉,蔡斐. 科技期刊全文阅读模式PDF和HTML的对比与分析[J]. 编辑学报,2015 (S1):17-19.