论档案信息利用的人工智能服务模式

    赵湘渝

    2016年被誉为人工智能技术“爆发”的元年,人工智能科学家李开复预言在未来10年,中国有47%的就业岗位将被人工智能技术所替代。人工智能技术中的神经网络深度学习技术的突破,使人工智能技术从实验室研究走向产业化应用,人工智能技术应用不但改变着每一个人的命运,同时也正在颠覆适应传统社会生活和工作的旧模式。

    1 现在人工智能技术达到了什么样的水平

    事例1:从阿尔法狗(AlphaGo)和人类的围棋高手李世石的对弈中,我们看到了机器被人类赋予了“感知、思考、决策”的特征,具备了人工智能的“自我深度学习”功能的AlphaGo Zero已经无人企及。总结一:围棋有10172次方的变化,AlphaGo凭借自身强大的解析能力,克服了计算机只能执行精确指令的不足,具备了通过机器自身感知、思考、逻辑推演、深度思维、判断后自主决定与执行的能力。总结二:计算机运算速度和能力已经远超了人类。

    事例2:2011年2月17日IBM的人工智能选手“沃森”(Watson),在《危险边缘》人机对抗节目中战胜了人类冠军选手布拉德·拉特和肯·詹宁斯。IBM公司设计“超级电脑沃森”的初心,是为了建造一个能与人对话的机器,即智慧能力匹敌人类的计算机系统,让机器更好地理解人情世故和社会风俗。让机器能够理解更加深奥的词句、自然语言和复杂的人类知识。“超级电脑沃森” 顺应主持人的提问思考并及时抢答,让人类看到了一个能够听懂人类语言,并能应用人类语言准确表达反映人类活动、社会生活、自然知识和人类智慧为内容的竞赛问题。总结一:“超级电脑沃森”表现出能够通过学习、掌握和思考人类活动的各种社会问题,并在人类知识的汪洋大海中搜索出合适的信息进行比对分析,从而给出正确的精准的答案。总结二:“超级电脑沃森”能够从社会常识或细小线索中,从语言的细微差异和微妙变化中正确理解主持人意思,并能即时寻找出正确的答案。

    事例3:“能听会说+翻译”的机器让人震撼。2016年10月26日在天津召开的微软21世纪计算机大会上,微软研究院瑞克·拉希德博士演示了即时语言翻译系统,该系统把语言识别、语音合成表达和机器翻译三项人工智能技术融合为一体。当瑞克·拉希德博士用英语表达“数年后,我们希望能够打破人们之间的语言障碍,就我个人认为这将导致更好的世界”时,在大屏幕上即时显示出了中文字幕,并在广播里传来了用本人声音合成的、翻译成汉语的普通话。这让台下的观众激动得热泪盈眶,因为他们被科学家们取得的巨大成就深深地震撼了,这让他们看到了人工智能技术的未来。总结一:在深度学习的驱动下,人工智能机器像一个勤奋的孩子,不知疲倦地从人类知识的海量数据中学习,不断带给我们一个接一个的惊喜。总结二:人把人工智能机器变得“能听会说+翻译”的目的,是为了让人工智能机器协助人类把自己变得更加聪明,人类借助人工智能机器的力量把人类社会的工作和生活变得更加便利。

    2 什么领域适合人工智能技术的应用

    发展人工智能技术的目的不能简单理解为做出机器来“模仿”“替代”人类,而是把人工智能技术置入机器后对机器赋能,让被赋能机器在某些功能上所具备的能力“远超”人类,从而帮助人类完成依靠人自身难以完成或者根本就不能完成的工作任务。人类与人工智能机器的相互关系是:相伴而行,人机互动、不断提高人工智能技术水平。人工智能发展的方向是:让人工智能机器帮助人类更好地去感知、思考、判断、协助人决策,帮助人把“事情”做得更好。那么什么领域适合人工智能技术的应用呢?人工智能科学家李开复认为:现阶段人工智能只能在某一个专一的领域里成事,只要具备以下五个要素人工智能绝对可以做出特别有价值的产品。这五个要素:一是拥有海量数据,数据基础需达千万级别。二是拥有顶尖科学家,而非程序員、工程师等。三是有非常清晰的领域边界。四是具备有效标注数据,如百度上每一次点击、淘宝上每一次购买、滴滴上每一次下单,成功与否都需要反馈给系统,形成有价值数据。五是需要基于互联网或大数据形成的超大规模计算量。人工智能技术需要通过深度学习来达到人类无法企及的高度。人工智能技术应用的优势:一是“办事”的速度、效率、精准率都远超人类精英的水平;二是它不需要休息,全天候为人服务,而且还不闹情绪,不会出错。

    3 为什么要利用人工智能服务模式来查阅档案信息

    因为目前的人工智能机器能做人所做不到的事情。例如IBM公司研发的“沃森”(Watson)系统就是一个强大的认知系统。认知系统必须具备以下四个能力:①Understanding(理解):机器能听懂人的自然语言,并能正确理解人所表达的真实意思;②Reasoning(推理):机器了解社会的“基本面貌”、洞悉人类“人情世故”,具备人类世界的知识后台支持,能对人提出的问题进行思考、推理并作出正确的回答;③Learning(深度学习):机器能够自我学习、深度学习,从而不断提高机器的认知能力;④Interactive(交互):机器能像人一样用人的自然语言与人进行正常的人机交互[1]。

    事例1:日本东京大学医学院收住了一名66岁白血病女患者,医生们使出浑身解数挽救这位患者,但是,在这么短的时间内谁也拿不出切实可行的救治方案,因为只有找到了白血病女患者病变的病灶位置,才能出台有针对性的治疗方案,而要找到白血病女患者病变的病灶位置,必须先读完2000万份医学文献资料,这2000万份医学文献资料摞起来有4000多米高,要医生读完这2000万份医学文献资料再出台治疗方案病人的时间已经来不及了,最后他们把人工智能机器“沃森”请来协助工作,“沃森”用了10分钟就读完了这2000万份医学文献资料,找出了白血病女患者发生病变的病灶位置,为医生抢救病人赢得了时间,现在这位患者正在康复中[2]。

    事例2:智融集团CEO焦可集结了一个创业团队,应用百度的产品技术+民生银行的业务运营,开发出了小额短期个人信贷业务——“用钱宝”贷款系统。2015年7月,基于人工智能技术的小额周转金融服务APP“用钱宝”正式上线,截至2017年3月,用钱宝单月交易笔数突破150万单放贷,已经超过了所有银行同类业务的总和。

    事例3:旷视科技Face++人脸识别技术可以同时识别300万张人脸,也就是说可以在几秒钟内完成将数据库中所有通缉犯的人脸,与世界各地所有的机场、港口、车站、码头监控摄像头视频中出现的人脸进行实时比对识别,并精准识别出通缉犯是谁,并及时通知所在点的执勤警务人员完成抓捕罪犯任务。

    以上人工智能技术应用场景的实现,是“深度学习”促成了人工智能技术“突破”的结果。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样[3]。今天触手可及的人工智能技术,已经在某些领域达到人类无法企及的高度,作为普通人的你还能与这样的智能机器竞争“岗位”吗?所以,让人工智能服务模式进入档案信息查阅、利用服务领域将是必然趋势。

    4 怎样利用人工智能服务模式查阅档案信息

    4.1 建立国家《档案信息资源共享服务协议》,协议规定档案信息提供者必须使用真实合法身份,必须说明提供档案信息的原件存放在什么位置(出处),谁对该条档案信息负法律责任。利用者只管放心利用,政府档案机构负责执法检查、整改和“打假”处罚。通过建立国家《档案信息资源共享服务协议》,明确相关方面的义务、权利、责任及具体处罚规定等。

    4.2 各级档案机构要把有限的人力和财力,投放到建设档案信息资源这个核心上来。在国家政策层面不搞“一刀切”,不搞“大跃进”,不能搞“小而全、大而全”的重复性建设。全国搞3至5个档案信息资源人工智能发布、管理、咨询、利用服务中心(平台)就够了,负责建设档案信息中心的(平台)机构可以不管实物档案,只管共享、利用和管理电子档案信息数据资源,平台机构的主要任务是集中精力做好面向利用者的信息技术应用开发。开发各具特色的平台机构可以由政府投资建设(政务公开信息查阅中心),也可以由大数据公司投资建设(如百度搜索有大数据处理能力),还可以由社会公益事业投资建设(如维基百科可以动员社会力量和档案从业人员来编撰完成档案信息词条的编撰工作),总要求是提供的公共服务是免费的、便利的、快捷的。

    4.3 要充分利用百姓掌握的移动终端手机的强大功能,充分利用短信、微信、微博及时获取所需档案信息。要充分利用现代信息技术提供的“万物互联”“万物智能”“无時不在”“无处不联”的强大功能,为用户提供“无所不有”的智能服务。要充分发挥大数据、云计算、人工智能的技术优势,让用户及时获取所需的档案信息。要充分发挥档案信息数据处理中心处理“海量”数据的能力,通过档案信息平台发布各类主题活动方案,让百姓参与到民间档案收集、提供某主题档案信息互动、丰富相关档案信息资源,还原历史、人物、事件的档案真相等主题档案活动中来,在活动中提高大众利用和保护档案的意识。

    回顾60多年人工智能的发展过程,是云计算和大数据成就了今天的人工智能技术,是“深度学习”把停滞在实验室的人工智能技术助推到了社会应用领域。我们相信档案信息利用的人工智能服务模式,不但能让你可以随时随地便利地获取档案信息,而且人工智能技术还可以从你查阅利用档案信息的“痕迹”中感知你的个人喜好,从而为你主动推送出你希望关注的档案信息。

    参考文献:

    [1][2]吴晓波频道2016-12-07:《人工智能不止是“下棋”》http://www.iqiyi.com/v_19rra8m5zg.html#vfrm=2-3-0-1&curid;=580567200_5edf606d61a97dcb143ae6c2fe823ab6.

    [3]深度学习:《经理人分享百科》http://www.managershare.com/wiki/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0.

    (作者单位:成都理工大学档案馆 来稿日期:2018-08-12)