新闻传播中数据使用的价值、问题与规约

    许向东 郑雪婧

    【摘要】数据在新闻中的使用日益常态化,在新冠肺炎疫情期间尤为显著。媒体在新闻中使用数据的价值和意义,可以归纳为通过数据直接呈现信息、利用数据增强内容的说服力、通过挖掘数据来揭示深层含义三个方面。而媒体在新闻中引用数据时,由于对数据认识不到位或专业性不足,则容易出现数据使用不当的情况。因此,有必要对新闻传播中的数据使用制定相应的规约。

    【关键词】数据;规范;新闻传播

    2020年2月20日早晨,湖北省卫健委公布19日湖北全省病例数据后,相关内容被多家媒体转发。这些媒体在转发数据时,对各地方新增病例、核减病例数据采用简单罗列的办法呈现,并在标题中直接使用经过计算的确诊数据。由于数据类别表述不清晰、数据间关系模糊,出现了全省总确诊病例数少于武汉市确诊病例数的现象,引起了广泛的争论与质疑。几个小时后,《环球时报》等媒体对最终确诊数据的计算方法进行了补充说明,《人民日报》、澎湃新闻等媒体对核减病例的判断方式也进行了解释。媒体及时发现公众的疑惑,并进行补充说明是媒体的职责所在,但是,此次“补充说明”也暴露出媒体在新闻中使用数据时存在的问题。

    一、数据在新闻传播中的价值与意义

    数据出现在新闻报道中由来已久,但是在近几年,随着数据新闻及数据可视化的发展,数据已经不再是传统媒体时代信息传播中的点缀,而是被挖掘出了更大的价值与意义。

    (一)数据可以直接呈现信息

    传统意义上的数据是指“有根据的数字”。所谓的“有根据”则是指数据是对客观世界测量结果的记录,而不是随意产生的,它是信息的载体。[1]而信息本身就具备了消除事物不确定性的特质。因此,数据本身就是很有说服力的一手资料,可以较为直接地传达信息。从这个角度而言,数据本身也富含了构成新闻信息的要素。尤其是在新冠肺炎疫情期间,媒体每天跟进最新的确诊病例、疑似病例、治愈病例和死亡病例等数据,这些数据发布的时间段较为固定,更新时间间隔较短,受众可以根据新闻中的数据直观地感受到全国或某地区的疫情控制情况及变动趋势。此时的数据就是新闻,而且是新闻价值和时效性很强的新闻。可以说,疫情新闻的传播离不开数据的支撑,某些情境下,数据可以呈现出语言、文字或图片所无法描述的内容,甚至描述得更加精准。

    (二)数据可以增强内容的说服力

    “用事实说话”是新闻媒体的基本行为准则,尤其是在呈现重要的观点和结论性信息时,离不开事实的支撑。当下,不仅要“用事实说话”,有时候也需要“用数据说话”,真实、客观的数据可以使新闻更加可信可靠,相比单纯的叙述或宣传活动,有数据支撑的内容能获得更多的認同与支持。2020年2月26日,公众号“平安湖北”对防疫期间湖北省公安机关的民警和辅警感染新冠肺炎、因新冠肺炎去世、新冠肺炎治愈和一线防疫中殉职的人数进行了统计,在致敬身处防疫一线的公安民警的同时,也让广大受众充分感受到了湖北防疫战的艰难和疫情的残酷。另外,病毒的传染力和疫情的发展情况也是通过新闻传播中的数据体现出来的,受众可以通过变动的数字对新型冠状病毒产生更为清晰的认知,树立起防疫意识和重视疫情、积极配合防疫工作的态度。

    (三)挖掘数据可以揭示深层含义

    数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分则隐藏在表面之下。[2]孤立的数据价值可能不大,但是,挖掘大体量数据内部蕴含的关系,则像是在开发资源丰富的矿藏。可以说,对数据进行挖掘是新闻报道(讲故事)的组成部分,挖掘数据的过程就是发现新闻点、剖析数据背后新闻意义的过程。新闻工作者通过分析对比数据,找出其背后错综复杂的关联性,进而揭示现象背后的深层原因,可以为受众提供新的认知视角,达到更清晰地呈现新闻故事的目的。对多维数据的挖掘与呈现,推动着新闻报道从追求时效性的外在特征,向揭示事件背后的深层含义为核心转变。这种变化有助于发挥专业媒体的资源优势,引领受众进行深入思考,探寻新闻事件的真相。

    二、新闻传播中数据使用不当的表现

    无论何时,新闻从业者一旦缺乏与数据相关的职业素养,势必造成数据所传达的信息与实际情况存在偏差,导致受众对媒体和数据来源主体产生质疑。在新闻传播中,数据使用不当主要有以下几种表现。

    (一)对数据内涵和计算科学性的认知不足

    数据本身可以较为直观地反映现实情况,但是这种反映要建立在对数据内涵的清晰认识和对计算方式科学性的认知上,否则通过数据得到的结论就可能有悖于现实情况。一方面,媒体和公众要充分认识到“数据”是存在欺骗性的,一组原始数据会因为计量方式和运算法则的不同,得到不同的结果,产生不同的结论。另一方面,由于原始数据体量过于庞大,难以通过直接观察数据就得到结论。在这种情况下,数据源主体如政府部门或社会组织,有时会选择对数据进行梳理或二次运算,把得出的较为明确的结论呈现给受众。这就导致了一种可能:在不违背原始数据真实性的情况下,选择最具有说服力的数据运算和计量方式来呈现工作成果,比如平均数、众数等统计学指标虽然可以传达一定的信息,但是无法全面反映实际情况。仅对这样的数据进行公布,可能会遮蔽数据本可以反映的其他方面的事实。因此,新闻媒体通过呈现由数据得出的结论时,需要充分考虑数据本身的科学合理性和反映事实的有限性,以规避对数据缺乏全面认知或计算不科学带来的重要信息缺失和受众对数据的曲解。

    (二)对冗杂数据提炼不够淹没了重要信息

    新闻传播活动中使用数据的意义就在于数据中包含着与公众切身利益相关的重要信息。因此,就像采集和呈现事实的原生态是新闻媒体的追求一样,获取和发布原始数据,确保真实性也是媒体力图实现的目标。但是,对受众而言,信息消费只是业余生活中的一部分,他们不可能全天候地跟踪世界的发展与变化,并对这些变化做出合理的解释。这样一种跟踪与解读数据信息的工作,应该是由媒体来完成的。[3]在新闻传播中罗列数据看似是在呈现原始状态的信息,实则会造成受众心智成本的升高,导致新闻文本的可读性降低。毕竟受众的注意力、对数据的理解力,以及对数据的兴趣与敏感性都是因人而异的。单纯将冗杂的原始数据呈现在受众面前,将提炼信息的任务全权交给受众,某种程度上是媒体缺乏对数据的审慎态度和失职的表现。对数据的过于简单化处理,既说明传播者对数据的本质缺乏认识,也反映出媒体对数据资源的开发不足。根据报道选题、数据类型来选择适当的数据分析方法,对数据进行有效而不破坏信息完整性的处理,才能提炼出符合新闻价值判断的信息,便于受众的理解和把握。

    (三)数据解读不足影响受众把握数据的意义

    数据是具有超越数字本身意义的信息,在不同的专业领域,数据所包含的价值有着不同的解读方式。来自各行各业、具有不同教育背景的普通受众,对专业数据所蕴含的意义自然会有不同的理解。因此,媒体在使用专业数据时,要对专业领域的数据或者相关专业名词进行必要的解释。2020年2月20日,新闻媒体在通报湖北省新冠肺炎病例确诊数字时,不仅出现了全省总确诊病例数低于武汉市确诊病例数的情况,而且在所呈现的数据中存在意义模糊的“核减”一项,尽管事后湖北省卫健委和各媒体对“核减”的标准与数据进行了解释,但还是引发了关于疫情数据真实性和计算合理性的质疑。因为“核减”数目的定义和计算原则由卫健委制定,并随着治疗方案的修改而变动。在缺乏广泛告知和征求意见的情况下使用“核减”这一概念,加上在疫情通报中仅简单罗列数据而缺乏解读,使疫情数据的通报像是在玩“数字谜”。即使后来宣布取消“核减”数字项,由此引发的对疫情数据真实性与科学性的质疑也未能立刻消除。

    三、新闻传播中使用数据的规约与要点

    在消费信息的时间和注意力都碎片化的环境里,期待受众对数据进行深度思考甚至通过主动的演算来得到信息显然是不现实的。如果数据传达的信息模糊晦涩,就很难被受众理解,更难以产生说服力。因此,为了让受众能够高效率地获取有价值的信息,就要为新闻中的数据使用设立一定的规约。

    (一)公开数据的来源,并对数据属性进行详细说明

    高质量的数据源不仅是新闻品质的保障,也是判断信息可信度的主要依据。交待数据源不仅说明所报道的事实、揭示的关系是言之有据的,而且可以帮助受众根据数据源来判断新闻的价值和实用性,并为受众提供产生质疑时进行自主核验的机会。公开数据来源及获取方式保证了受众的知情权,新闻媒体坚持在引用数据的新闻中公开数据来源,彰显了媒体和数据源双方的信息公开和透明化。因此,在公布数据源时不能泛泛而谈,要清晰、明确,更不能含糊不清甚至不加描述。但是,我们还要认识到,公布数据来源并不能说明数据是否真实、准确。附加数据库链接和数据来源,只能说明报道所依赖的数据不是自己编造的。数据的可靠性与公布数据来源、数据链接之间并不是正相关的关系。为了使所标注、交待的数据来源真正发挥作用,帮助受众更好地判断数据中包含的信息价值,还需要对数据的其他属性进行详细说明,包括媒体获取数据的时间和范围、数据产生的时间、选取的数据是否完整以及数据采集的方法、数据的适用范围等。此外,对理解数据所包含信息有帮助的对比性数据,也应一并附后,为受众提供参考。

    (二)提炼数据并公开数据处理方法

    当前,媒体在通过数据来反映事物的变动时,经常采用罗列数据的方式,这种方式有直觀简洁的优势,在数据更新时间跨度较短时还可以接受。但是,一旦数据更新时间跨度较长,且呈现方式过于冗杂、堆砌,受众就难以从数据中发现有价值的信息,更难以从变动的各项数据中发现差异。因此,新闻媒体在使用数据时,要考虑到受众对数据的观感和信息接收的效率,要为受众提炼出数据中最重要的信息。媒体在此基础上对原数据进行整合梳理后,再采用附件、信息图表等方式完整呈现。尤其是对体量庞大、缺乏对比的数据,需要通过一定的加工和处理,将数据中隐藏的重要信息显化。即便是面对同一组数据,由于处理方式和选择标准不同,可能会得到不同的结论。媒体要警惕二次处理数据时所采用的筛选数据、进行运算的方法是否带有倾向性,通过数据处理得到的结论是否与数据来源主体的利益存在相关性。公开数据处理的方法有利于避免或削弱数据处理结果包含的倾向性,使对信息有疑问的受众可以对数据处理的依据进行独立判断。对媒体而言,新闻生产过程的透明化也具有一定的“免责”性,表示媒体仅承担了呈现信息的责任,而不带有媒体自身的立场与倾向性。

    (三)对专业数据和专业词语进行必要的说明与科普

    专业领域的数据在体量和单位上都可能与普通人的日常生活距离较远。由于受众对其缺乏了解,在理解数据所传达的信息时容易产生偏差,这就要求新闻媒体对引用数据的专业性和普通人对此的理解能力进行预判,超出常识范围的专业数据要辅以必要的补充说明,并对能促进数据理解的相关知识进行科普。例如,“拐点”原本是数学上的用词,又称反曲点,指改变曲线向上或向下方向的点。而2020年2月初在抗击新冠肺炎疫情期间,医疗专家首次提出了疫情“拐点”时间的预测之后,许多自觉在家隔离的老百姓都期待着拐点的到来。由于缺乏关于拐点意义的专业解读,许多受众将此理解为疫情结束的前奏,并迷信拐点日期对疫情结束的决定性意义。实际上,拐点是疫情发展曲线中表明疫情扩散速度放缓的转折点,与疫情的控制情况密切相关,难以准确预测。即使拐点到来,也并非表明疫情得到了完全的控制,只能说明目前防疫措施起到了一定的效果。“拐点”一词释放出乐观的信号,很容易降低公众的防疫意识。为了避免公众对疫情报道的不解与误读,媒体有必要在报道疫情防控和疫苗研发时,针对高频出现的专业内容进行以科学为前提的知识普及。毕竟新闻传播既是一种信息生产和传播,也是一种知识生产和传播。在一个社会的知识系统中,媒体知识的生产和传播扮演着极为重要的角色。[4]

    没有规矩不成方圆。生产规范不仅仅是约束和限制,更是为专业化生产提供的指南和标准。由于数据存在解读和运算的空间,并关系到新闻媒体与数据来源主体的公信力,使用数据时必须持谨慎的态度,将新闻传播所秉持的公正、平衡的原则引入到数据的使用中,在尊重原始数据和进行数据的有效处理之间找到平衡点,并在实践和探索中不断完善相关经验。同时,媒体应该认识到,当下的公众不再是单向的被动接受者,他们不仅会积极接收信息,更能够对新闻内容进行主动的思考和质疑,并在各类交流平台上展开讨论。这既是民众媒介素养提升的表现,也是对媒体在报道方式改进和信息透明化方面的挑战。

    [本文为中国人民大学持续支持类科研基金项目“大数据时代计算传播学的理论与实践”(批准号:17XNL003)的阶段性成果)]

    参考文献:

    [1]涂子沛.数据之巅:大数据革命,历史、现实与未来[M].北京:中信出版社,2014:255-256.

    [2]维克托迈尔舍恩伯格,肯尼思库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:134.

    [3]彭兰.中国网络新闻的六大发展[J].杭州师范学院学报(社会科学版),2004(5):14-20.

    [4]刘宏.“东方之星”号客船翻沉事件报道中的知识传播[N].光明日报,2015-06-10.

    (许向东为中国人民大学新闻学院教授、博士生导师,中国人民大学新闻与社会发展研究中心研究员;郑雪婧为中国人民大学新闻学院新闻学硕士生)

    编校:董方晓