精品学术资源数字化建设的探索和实践

    王静

    

    摘 要:本文以科学出版社开发的专业知识服务数字产品“中国生物志库”为例,围绕精品资源数字化建设的几个重要要素——资源集聚、需求分析、产品设计、盈利模式,探讨分析了如何在精品意识的引领下,对数字产品进行开发和建设,以期对同行起到借鉴作用。

    关键词:精品出版 资源集聚 需求分析 产品设计 盈利模式

    党的十八大以来,随着贯彻落实习近平总书记关于媒体融合发展的总体要求,我国数字出版取得了丰硕的成果,已经成为出版工作中的重要板块和出版业可持续发展的重要增长点。为了促进出版与科技深度融合,实施精品发展战略,推动数字出版高质量发展,自2019年起,国家新闻出版署每年举办“数字出版精品遴选推荐计划”,在主题、大众、专业、教育、少儿五个类别中,评选出一批精品数字出版产品和服务。2019年10月,国家新闻出版署公布了第一批入围产品名单,科学出版社开发的“中国生物志库”成功入围,成为专业知识服务数字出版领域的精品典范。

    所谓“精品”体现在产品导向正确、内容优质、功能创新、双效俱佳,能够在行业内树立标杆,起到推动引领的示范作用。在数字产品的建设过程中,要时刻树立精品意识,始终将内容质量作为发展的生命线,将用户需求放在首位,创新技术做好产品设计,进而通过适合产品的盈利模式达到自我造血、持续经营。本文将围绕产品建设的这四个重要要素:资源集聚、需求分析、产品设计、盈利模式,以“中国生物志库”为例,探讨如何在融合发展总体战略的指引下,在高质量发展的要求下,通过数字化建设将精品的内容资源转化为专业知识服务数字产品。

    一、资源集聚是基础

    内容资源是数字产品的核心,集聚优质的内容资源是数字产品建设的基础。优质资源要具备权威性、系统性、当量大、多样化的特点。在开发数字产品之前,要仔细思考,有没有自主版权的内容资源,是否具备优质的特性?对于专业知识服务类的数字产品,资源的权威性是首要条件,其内容要代表专业领域内的最高水平,作者要为学科顶尖科学家,这样才能保证产品的专业性。资源的系统性要求内容应有知识体系,关联度强,能够在特定学科领域全覆盖,有深度。资源的当量要大,在数字时代,互联网技术要搭载大数据,只有当量大、有规模的内容资源,才能给用户提供丰富的信息。多样化为数字产品的形态和表达提供了条件,例如除了文字,图片展现更能满足用户对视觉丰富度的要求。

    科学出版社具有高水平、高质量、高层次和严肃、严密、严格的优良传统,始终将精品内容建设作为编辑出版的核心工作,具备持久的优质内容资源集聚能力和强大的外部资源整合能力。“中国生物志库”的内容资源就是科学出版社半个世纪以来,在生物多样性和物种研究领域出版的数百本高质量大型志书基本资料。中国是世界上生物多样性最为丰富的国家之一,中国科学家在物种调查、志书编研所取得的成果世界瞩目,水平位于国际前沿。其中以编研45余年,126分册的《中国植物志》为典型代表,该书是目前世界上规模最大的植物志。其编研获得了2009年自然科学奖一等奖,其出版获得2009年首届出版政府奖,具备权威的学术地位和出版地位。随后,随着科学的发展,Flora of China(中国植物志英文修订版)、《中国高等植物彩色图鉴》《中国生物物种名录》《泛喜马拉雅植物志(英文版)》《中国维管束植物科属辞典》这些领域内的权威大型出版著作,均不断在更新中国植物分类学知识。除了这些已经厘清的中国植物资源,还有动物、微生物、藻类等其他生物类群在不断地被科学家一一梳理,160余卷的《中国动物志》、100余卷的《中国孢子植物志》近50年来还在持续编研。这数百本高水平、高质量、系列化的学术精品著作,是国家级的科研成果,既具备权威性、系统性,又具有足够的当量,既有中文又有英文,既有文字又有图片,已经达到了覆盖全植物类群、大部分動物类群和部分菌物类群的近15万条物种信息,10万张图片和上亿的文字量,这是我国生物学领域的知识财富,是科学出版社宝贵的优质资源。

    二、需求分析是前提

    现阶段,数字产品的开发,已经不再是解决“有没有”,而是要解决“好不好”的问题。用户是产品的使用者,只有以用户为中心,满足用户需求、解决用户问题、给用户提供优质增值服务的产品才是“好”产品。用户需求分析是在产品开发设计之前,对用户需求所做的调查与分析,是产品设计的依据。需求分析是一项专业的工作,有必要成立专业的用户研究团队,通过市场调研、竞品分析,对用户使用目的、需求痛点、情景状态、喜好偏好做精准调研。通过问题收集、需求理解和挖掘、需求的评估和分析,形成需求文档,反复修改,不断测试体验,不断优化。

    “中国生物志库”是一个提供生物物种权威信息,服务于科研,服务于学科发展的专业知识库。近十年以前,市场上就有很多开放的公益性网站,如国内的中科院植物研究所的“植物智”、中科院动物研究所的“动物主题数据库”、中科院上海植物园的“植物标本馆”,等,均以《中国植物志》中英文版、《中国动物志》的数据为基础,供用户查询物种信息,已经成为该领域内专家甚至大众普遍使用的数据平台,此外,国际上也有大量免费生物物种平台。这就对“中国生物志库”的设计开发提出了更严峻的挑战。然而,经过调研,我们发现,一方面,这些免费网站为我们积累了大量用户,培养了用户在网上搜索物种信息的习惯;另一方面,网站的开发者不是专业的产品经理和互联网技术公司,开发依托于科研项目,仅仅是为了免费共享数据,网站一旦完成,更新资源、功能优化、运营维护都难以跟上。用户在使用过程中,存在很多痛点,如内容资源陈旧,中国植物志出版之后,随着科学技术的进步,经典的植物分类学已经发生了很大的变化,如出现了大批新记录种、新种,如借助分子生物学新技术,植物的分类地位,系统树发生变化,等等,用户亟需获取最新的科研成果;搜索方式单一,大多网站仅限搜索物种名称,如果不知道物种的准确名字,无法实现搜索;搜索结果信息量有限,仅展示单一出版物来源的物种描述,无法查询该物种在更多其他出版物中的权威描述;无法实现特定条件的查询,如无法通过特征、生境、分布来查询,难以帮助用户解决科学问题,等等。

    科学出版社拥有一支懂专业、懂技术的团队,在初步了解用户需求的基础上,形成了能让被调研者直观感受和了解的产品原型,然后为他们讲解和演示,这样他们在充分理解产品的意图后提出建设性的意见。因为“中国生物志库”是服务于科研的专业数据库平台,科学家学者是最大的用户群体,经过与学术专家的深入交流,了解他们是怎样做科研、怎样使用内容资源、怎样解决问题的,在哪些方面存在痛点,都有哪些科研场景,等等。这样在深入理解、分析用户需求的基础上,反复讨论,总结归纳出“中国生物志库”用户的五大需求:①内容权威系统,紧跟科学前沿;②数据信息量大,准确、规范、专业;③基本搜索功能便捷高效;④增值服务实用;⑤能够提供特定场景解决方案。

    三、产品设计是关键

    在确定了用户需求之后,就进入关键的产品设计阶段。产品设计要做到与需求精准匹配,借助互联网技术,以创新性和智能化的手段,做好功能设计,开发出符合用户需求的产品,除了为用户提供解决方案之外,还要给予用户良好的使用体验,这样才能持久保有用户黏性。

    “中国生物志库”紧密围绕上述五个需求点,首先在入库资源做好把关,保证内容权威性和前沿性。其次,作为出版机构所开发的数字产品,其内容均来源于正式出版物,均经过专业编校人员多次编校并正式发布,能够保证数据准确、规范、专业。这是与非出版机构开发的数字产品相比最大的优势。再次,就是在功能设计方面,为了优于同类网站,“中国生物志库”从基本功能提升、增值服务以及提供特定场景的解决方案三个方面入手,逐步实现用户需求。

    首先是解决用户“搜索效率低下”的痛点,生物志库开发了强大的智能检索功能,解决了以下几个用户需求的问题:①全文检索:不再局限名称检索,扩大搜索范围,提供更多搜索可能。②基于数据挖掘的物种特征检索:对于无法确定准确的物种名称的用户,提供了多重勾选其形态特征,如花色、叶形、果实等,从而定位到符合条件的物种,逐渐缩小检索范围。③批量检索:解决用户一次实现多物种查询的需求。④多次筛选:搜索结果实现按照图书来源、分类地位、分布地等多条件筛选进一步精确结果。

    其次是建立基于知识关联和知识图谱的增值功能。以物种特有的既带有唯一标识性又有分类关系的符号——拉丁学名(属名称+种名称)进行知识关联,可以为用户提供精准、丰富的数据信息。同时开展文本和数据挖掘,辅以人工审核和整理,建立知识图谱。例如,生物物种是实体,属性可以是其生物学特征(生活型、叶形、花形、花序、果实等),也可以是分布地或海拔等,将其应用于多维筛选条件,即可经过多次筛选,逐渐缩小检索结果范围,精确定位目标。

    最后就是在特定场景下为用户解决问题。如中国生物志库是一个强大的拉丁学名数据库,通过分词技术和自然语言处理技术,可以在用户撰写论文的特定场景下,提供全文物种拉丁学名纠错,帮助科研人员快速解决问题。

    “中国生物志库”最终形成了在知识更新和功能服务上均优于市场同类网站的特点,其竞争力、专业性以及良好的用户体验均得到了很好的体现。详见表1。

    四、盈利模式是保障

    一个优质的数字产品,不仅要有显著的社会效益,还要有较强的盈利能力。产品不能依靠财政扶持,要深入市场,在市场中锻炼和造就自主经营发展的本领,自我造血,这样才能保障产品有足够的资金持续迭代升级,持续盈利。目前市场上不同类型的数字产品盈利模式不同。其中专业学术类的知识服务产品大多都是toB,即面向机构用户付费,其内部的个人用户免费使用。“中国生物志库”也采用这种模式,基于以下几点原因。

    (1)toB模式实现公共科研成果按需共享。这里的B(机构)主要是指中央和各级政府为了发展科研和教育设立的各类机构,其财政资金主要用于人才培养和科研成果产出以促进整体社会发展。专业机构根据自身需要利用财政资金进行采购,使得公共科研成果以多样化形式实现按需共享。

    (2)toB模式符合生物专业领域知识循环的主流规律。生物学科基础性强于应用性,用户获取、使用、积累和更新知识资源并非服务于个人自身,而是依托其所在机构创造的条件,为国家创造知识,因此由机构支付成本更加合理。

    (3)toB模式符合大规模数据型产品的消费特征。“中国生物志库”是对已有海量知识内容做精细化加工、关联和高质量运营的大规模数据型产品,针对个人用户很难形成科学合理并可持续的消费模式,而机构用户则能汇总形成其内部所有相关个人用户的总体需求,在此基础上实现对于大规模数据型产品的消费模式。

    经过几年的实践,“中国生物志库”已经获得了较好的收益。200余家高效图书馆开通试用,数十家科研机构购买,已经形成了稳定的收入。

    参考文献:

    [1]李婷婷.数字出版常见类型及盈利模式[J].西部广播电视,2016(2):20.

    [2]郭向晖.传统出版单位如何推进传统媒体与新媒体融合发展——以人卫社数字出版转型升级实践为例[J].科技与出版,2015(5):22-24.

    [3]刘一鸣,谢凤麟.专业出版知识服务盈利模式探究[J].科技与出版,2018(6):32-36.

    [4]聂静.学术出版数字化知识服务实证研究建设[J].出版发行研究,2018(2):19-24.

    [5]邱俊明.探索数字出版盈利的全新模式[J].出版广角,2019(8):56-59.

    [6]石荻.数字产品设计中的同质化分析[J].艺术教育, 2016(02):239.

    [7]唐亮,罗轩,王颖.两类知识图谱差异辨析及其在科技出版中的应用[J].出版参考,2019,791(1):74-76.

    [8]谢炜.学术出版在数字学术发展中的定位与作用[J]. 科技与出版,2019(4)22-28.

    (作者單位系中国科技出版传媒股份有限公司)