开放数据的概念及其发展现状

    弓序

    

    

    摘要:大数据时代,数据正成为驱动经济增长和社会进步的重要基础和战略资源。如何将掌握在政府手中,占比高达80%的,高价值的数据资源进行有效利用,成为了国际政府机构在数据与信息分享时的重要议题。政府数据开放成为了数据创新战略和开放政府建设的主要组成部分,成为了促进经济发展和科技进步的重要阶段,开放数据的能力也成为了评估开放政府的重要指标。因此,笔者在本文中对开放数据的概念及主要发达经济体的开放数据发展状况进介绍总结,展现大数据时代背景下,开放数据的无限经济价值与社会价值。

    关键词:开放数据;开放政府数据

    政府数据是由政府或政府所属机构产生的或委托产生的数据与信息,开放则意味着任何人可实现对其数据的使用和重新分配。2009年开始,各国与地方政府陆续将政府数据放到其门户网站,并逐渐演变为一场全球运动,使开放政府数据计划在世界各地迅速展开。在今年两会期间,全国人大代表,浪潮集团董事长孙丕恕也强调“政府数据开放数据”势在必行。

    1 开放数据的概念

    到现阶段为止,关于开放数据还没有一个确定统一的定义存在,主要由各大主要研究团体机构组织针对开放数据给出了不同的定义。

    通过上表,虽然各个研究团队和组织对开放数据给出了不同的定义,但是,从以上的定义可以为开放数据总结出以下三个特点:

    一是无关使用对象,无差别的非歧视性的自由开放使用。

    二是免费访问,获取,使用,加值,拷贝,再利用,重新分配的可能性。

    三是信息数据的格式统一性及机器的便捷可读性。

    随着近些年,大数据的发展兴盛,开放数据也随之被各国政府及自治体重视,并纷纷纳入政府重点工作议程。例如,欧盟的开放数据战略,开放数据的内容涉及地理信息数据,统计资料,气象资料等,开放这些数据保证其可以随时访问和咨询,并重新加以利用。日本总务省发布的开放数据推进战略中,将推进由电脑可以自动识别,促进开放数据的再利用进程作为主要丁作重点。不仅如此,很多的大数据公司、组织或个人也逐渐意识到开放数据的重要性和价值,并开始致力于利用海量的官方数据进行分析和研究,以求创造出更多的社会和商业价值。据英国2015年的开放数据使用企业的调查结果显示,已有270家企业将开放数据应用于工作领域,尽管目前使用开放数据来作为工作领域一部分的企业以小微企业为主,但其中已经有一部分成长飞快,成为显著经济价值的企业。

    保证开放数据的有效利用和普及,必须保证其机器的便捷可读性。数据可读性也是各大开放数据研究团体和机构研究过程中主要的问题之一。例如,现阶段,大到各个政府,自治体的官网上公开的信息公告,小到某企业团体的官网上公开的议事日程,主要的数据信息的公开形式都是以PDF或Excel等文件形式所呈现。以这种的形式公开的信息数据并不能完全地被称为开放数据。因为,以PDF或Excel等文件形式所呈现的信息數据主要是有某一种特定的只读程序所编辑完成,主要用于信息公开后完成人们阅读功能的信息数据。若想进行二次的加工利用,需要花费巨大的时间和精力,无法满足开放数据轻而易举,快速便捷利用的可能性。因此,对原始数据进行集合的可读性操作,是开放数据运动中必不可少的一个重要环节。例如美国所公开的进出口货物和服务数据,美国每小时降雨量数据,美国社区调查数据等,这些数据都是经过加工,组织以后的集合数据集,通常以CSV,XML,RDF等格式出现,保证数据的机器可读性和原始性。

    2 开放数据的发展现状评估体系

    针对各国的开放数据发展情况,对各国开放数据的发展状况进行给出权威评估的主要有以下两个:

    2.1 万维网基金会(World Wide Web Foundation)的“开放数据晴雨表”

    万维网基金会主要致力于,建立开放的网络环境,并将其作为一个全球性的公共利益和基本权利,确保每个人都有访问和使用它的自由,提倡自由和开放的网络和开放民主。万维网基金会从2013年首次推出,至今已推出四份的“开放数据晴雨表”,对各国的开放数据情况进行评分,旨在展现全球范围内开放数据行动及其影响,分析开放数据的全球趋势,并提供国家和地区之间的比较数据。主要对15个不同领域的开放数据程度进行比较,评估其在政策准备度、执行度和在政治、经济和文化影响力这三个方面的维度的状况。

    2.2 开放知识基金会( Open Knowledge Foundation)的“全球开放数据指数”

    自2013年开始,国际开放知识基金会开始发布“全球开放数据指数”,旨在搜集和反映当前世界范围内国家层面的开放数据状况。开放数据指数中,立足于使用者角度,站在帮助政府改善开放数据水平的立场,针对各国政府和地区在政府支出、选举结果、交通时刻表、环境污染程度等主要的十个领域,对13类关键数据进行集中细化,通过评估标准给予相应分数,最后加权平均算出每个国家地区的开放数据指数。

    3 国外政府数据开放现状

    2011年9月,由英,美等八国首脑签署《开放政府宣言》,并建立开放政府合作项目,截至2016年,已有66个参加国成为其成员,主要致力于实现各国开放政府数据发展和政府与公民协调发展的协同合作。其中欧盟和美国的开放政府数据的表现,使其成为了这场开放数据运动中的优秀领跑者。

    3.1 欧盟

    欧盟委员会通过“开放数据战略”确立了逐步开放的政府数据开放模式。于2003年制定的《公共部门信息再利用指令》,在公共部门信息上进行修订,让开发者、企业和公民以较低或免费的成本得到公共数据,并自由使用博物馆、图书馆和档案馆的数据。实际操作中,也意味着提供的绝大部分数据是免费或几乎免费的。其次,强制所公开的数据必须是社会流行的格式和计算机可读的形式,从而保证数据的有效再利用。随后,2010年发布欧盟2020战略(Europe 2020)。2012年,欧盟委员会推出公开数据门户网站测试版,为外界提供了大量来自欧盟委员会、欧盟组织和机构的数据信息,任何人均可以自由下载相关数据。这一门户网站目前拥有5811个数据集,其中大部分数据来自于欧盟的数据部门Eurostat。欧盟在2014年7月公开发布建设政府数据开放平台的招标书,目标是建立泛欧盟地区统一的正式数据门户网站,而该网站建成后将超过美国的data.gov和英国的data.uk成为目前世界上最大的政府数据网站。此外,英国除了全国统一的数据门户网站外,伦敦、曼彻斯特等地以及索尔福德市议会等16个地方和部门还建立了独立的开放数据门户。在英国的数据开放门户网站上,共开放了13670个公开的数据集以及4170个非公开的数据集。就数据开放种类而言,欧盟目前开放了的数据主要集中于科研,环境和医疗数据方面。已有许多企业开发出基于政府数据的民生类应用,市场反响也相当不俗。欧盟有较多的数据开放应用是基于环保类数据的公开,如欧盟森林火灾信息系统免费提供在欧洲范围内的野外森林火灾信息。用户可以通过应用获取关于火灾的最新可视化信息,包括气象火灾风险地图及6天之内的预报、每日卫星图像信息,最新热点地图以及火灾范围等。

    3.2 美国

    2009年,美国奥巴马政府颁布了《透明与开放政府备忘录》与《信息自由法案备忘录》。并于同年5月,启动了Data.gov项目作为开放争睹计划的一部分。Data.gov项目不仅致力于透明与开放政府的建设,还将提高国民生活水平、经济活性化改革、产业整合发展作为主要目标,向公众提供原始数据( Raw Data)、分析数据( Tool Data)、地理数据(Geo Data)三大类数据信息。截至2014年9月,从设立之初的47件提供数据发展到由国内36个州,20个都市,180个行政机关参加的超过15万件的数据提供系统。美国作为开放政府数据进程中的先进国,顺利完成了从数据公开到数据活用的华丽转变,并完成了很多基于开放数据所衍生的便民的购物、交通类应用,社会环境问题监督等各类应用程序。例如基于纽约市餐饮营业指南数据和食品环境地图数据的结合,开发出名为安全饮食(Safe Eats)移动端应用程序。利用该程序,消费者可以随时随地掌握纽约市内超过2万所以上的餐饮店的地址,等级,评价等信息。

    4 结束语

    开放数据作为一种理念已得到广泛的认同和应用,并在政府行政公开,企业管理等多个领域实现了良好的实践成果。本文首先对开放数据的概念进行了阐述,并对欧盟和美国的开放数据发展现状进行了总结介绍,力求为大数据时代背景下,开放数据运动的普及及未来我国制定政府开放数据战略提供参考。