会议速递|第十届“中国电子文件管理论坛”圆满结束!12篇报告、所有报道悉数在此!各路大咖带你畅游知识海洋!
点击蓝字关注我们
本文看点
1.如何让大数据变成可视化、易理解的“小数据”,艺术家如何魔幻展示?
2. 互联网法院的概念、管辖范围?法学专家如何使用区块链管理档案?
3. 最擅长科普区块链知识的专家张如何深入浅出带你走进区块链世界?
4. 京东、神龙、华能、商飞、苏宁等各类实践先锋如何管理电子文件?
5. 航天航空,理论实践,交织出怎样宏伟、绚烂而又脚踏实地的篇章?
6. 勇敢冲上潮头的小鲜肉,如何将知识图谱技术运用于电子文件管理?
7. 演讲专家主持人同与会者有哪些精彩互动?线下提问获怎样的反馈?
精彩回顾
会议速递|第十届“中国电子文件管理论坛”超隆重开场!开幕式、十周年庆典、主报告!火速呈现!
【会议速递·14号全天】2019第十届“中国电子文件管理论坛”
2019年12月14日下午14时,第十届中国电子文件管理论坛的下半场在中国人民大学国学院116报告厅爆满开讲。精彩连绵!小编看花眼、记到手软!听众大呼过瘾!
主持人 黄新荣,西北大学公共管理学院公共信息资源管理系系主任、教授
Chairman:Prof. HUANG Xinrong ,Dean of School of Public Information Resource Management, Northwest University
精彩的主持,引出六场精彩的专题报告,且一一看将过来!
12.14下午 专题报告
01
以历史数据视觉化理解现实世界
Understanding the Reality from Historical Data Visualization
清华大学美术学院视觉传达设计系副教授 向帆
XIANG Fan, Associate Professor , Visual Communication Design Department ,Academy of Arts&Design,Tsinghua University
向帆副教授,来自清华大学美术学视觉传达设计系,一直致力于数字视觉化设计研究。她从如何接触并开始研究档案学相关成果讲起。N年前飞往洛杉矶时,在飞机上看到有关洛杉矶的资料,便充满了偶遇好莱坞明星的憧憬,然而到了洛杉矶,实际与之前的期待相差甚远。由此引出她所做的一系列非常有趣的研究项目。
项目一:“音乐地图”
“音乐地图”(Prototype),开车穿越西雅图的历史空间,让人们更深刻地感受西雅图,享受历史穿越感。歌曲的长短,可以定义它在空间的大小,就成为了一个混响的音乐空间。走在西雅图的街道上,就可以听到与这个对应地点有相关性的音乐。它可以把那些与电影相关的或与娱乐相关的城市历史信息呈现出来,不仅给人一种穿越之感,还可以亲近历史,感受历史。
项目二:获奖美术作品的“秘密”
对美术界获奖情况的进行量化研究并且进行可视化表达。她通过对大量获奖作品信息的统计,经过计算去探究其中的范式,发现了很多有趣的规律。例如,画的人多就能获奖等等。通过她的方式去寻找获奖作品当中的“秘密”。
项目三:我从哪来(Family-tree)
通过技术和三维可视化专利将家谱可视化。在可视化的过程中,遇到很多问题,不仅仅体现出可视性而且也尽最大的可能体现人们血脉渊源的可理解性。用立体造型的方式去展现家谱的结果是,视图具有十足的美感,而且具有可理解性。
她们所做的,就是为了让大家能更好的理解档案里面有什么,让档案可见可用,并且可以实现新的发现。
向帆副教授的演讲结束时,主持人黄新荣教授也点评到目前中国仅有42万人的家谱档案,对家谱档案方面的可视化研究是具有十分重大意义的。
02
区块链技术在互联网法院电子卷宗全生命周期管理中国的创新应用
Innovative Application of Blockchain Technology in the Life-Cycle Management of Electronic Files in Internet Court
广州互联网法院副院长 田绘
TIAN Hui, Deputy dean of GUANGZHOU COURT OF THE INTERNET
【先考考大家,你怎么理解互联网法院?英文翻译是?】
田绘副院长,首先阐述了面临的新挑战,即所有诉讼活动全流程在线上完成,涉诉资料从生成到最后归档,均以数字形式存在,如何实现电子数据的可溯源及防篡改?
广州互联网法院的审判模式集中审理互联网案件。管辖范围包括:
1. 网络购物合同纠纷;
2. 网络服务合同纠纷;
3. 金融借款合同纠纷、小额借款合同纠纷;
4. 互联网著作权、邻接权权属纠纷;
5. 互联网著作权、邻接权纠纷;
6. 互联网域名权属、侵权及合同纠纷;
7. 互联网侵害他人人身权、财产权纠纷;
8. 互联网产品责任纠纷;
9. 检查机关提起的互联网公益诉讼案件;
10. 涉互联网行政纠纷;
11. 其他互联网民事、行政案件。
广州互联网法院已经初步实现了从调解、立案、庭审到最终判决的全诉讼环节的全程网络化。“网通法链”包括:可信电子证据平台,司法信用共治平台,司法区块链。系统运行至今,已有30余家平台接入,存证各类电子数据35825439条,处理诉讼案件300余例。虽说处理比例比较小,但是与之前必须要与公证机关的公正流程进行对比的话,那么现在已经为法官节省了许多取证环节,也就是说可以通过区块链提供的证据,可以节省对事实的取证,而直接进入到之后的其他环节。
诉讼电子卷宗全生命周期管理流程采用的是“单轨制”,区块链技术为整个电子卷宗数据保全流程提供技术支持。还介绍了广州互联网法院诉讼电子卷宗归档管理体系方案等等。
在对区块链技术在电子档案管理中的深度应用介绍环节,田绘副院长讲解了他们应用的主要思路:在区块链上保存电子档案文件的哈希值及检索必要的档案属性元数据,将区块链作为一个标准服务为各类电子文件进行存证保护,并向各相关业务系统提供API接口,实现业务对接上链以及查询核对。在一系列的区块链应用模块的流程介绍之后,田绘副院长也提出了她对区块链与档案管理关系的理解,即区块链技术是档案管理的新技术革命。
03
区块链技术与文件档案治理
Blockchain Technology and Records Governance
中钞信用卡产业发展有限公司杭州区块链技术研究院院长 张一峰
ZhANG Yifeng, Dean of Hangzhou Blockchain Technology Research Institute, Zhongchao CreditCard Industry Development Co., Ltd.
【小编忍不住手动赞!简直是区块链知识科普大师!】
张一峰院长的演讲主要分为三部分:区块链是什么,区块链能做什么和区块链在电子档案管理应用中的思考。
首先,张一峰院长以区块链发展历程为主线阐释了对区块链技术的思考。并且通过银行汇款的具体案例从金融的视角帮助大家理解区块链。在一次看似简单的货币交易过程中,会有两个问题:1. 这些账目的安全如何保证;2. 谁去做刚刚这笔交易的记账工作。然后逐步深入展开,分别讲解了密码学领域的摘要算法、链式数据结构与密码学、共识机制、智能合约,并且更为详细的剖析了区块链的深层含义,即多方共同参与记账的账本技术和多方通过共识来记账的协作模式。其中,共识模式和智能合约都是基一种基于的记账方式。在此之后,他也用各位通俗的方式对区块链进行了进一步解释,即区块链就像是会计账簿里的骑缝章。
目前,区块链还没有统一的定义,但是对于区块链技术与信任问题密切相关一直是共识。他把区块链形容成会计账簿里的骑缝章,如果把每一个区块当做一页账簿的话,那么就在每两页账簿之间都盖了一个骑缝章,使得任何一页账簿都不可能被单独抽取出来,不止如此,每一页账簿上的任何一位的数据都不可能被修改,这些数据一旦被修改,区块链的校验机制就会发现。这就回答了之前提出的第一个问题:这些账目的安全怎么去保证。之后,他用比特币的例子解释了谁才是交易的记账者。从比特币特殊算法的例子中,他提到区块链的应用可以理解成是一种类似于民主投票的机制,以此来进行所谓的记账权争夺。
最后,张一峰院长提出了对区块链应用的4点思考及远景展望。
思考:
1. 如何应用区块链技术降低电子档案的真实性、完整性的管理成本?
2. 如何应用智能合约技术解决电子档案的自动接收归档管理?
3. 如何应用区块链提供电子档案面向开发环境的可信共享?
4. 如何对区块链上的数据进行电子档案归档管理?
远景:
如何实现全网络的分布式电子档案管理?
这些问题都非常值得研究和思考。
04
文档智能化助推华龙腾飞
Records Intelligence Boosts Hualong’s Rapid Development
福建福清核电有限公司副总监 邱杰锋
QIU Jiefeng, Deputy director of Fujian Fuqing Nuclear Power Co., Ltd.
邱杰锋副总监从四方面展开介绍文档智能化给华龙集团带来的推动和助力之处。分别是:一,国家名片是如何打造的;二,工业互联网时代的核电发展;三,数字化、智能化文档管理;四,文档智能化助推华龙腾飞。
邱副总监逐一介绍了“华龙一号”树起中国核工业品牌,我国核电中长期发展展望等内容。他提出大数据是核电实现工业互联网转型的基础,并从核电厂大数据体系上给大家做出了详尽讲解。
研究项目的重点在于三维数据的开发及应用,在其工作中,三维数据为核电智能检修提供了很大支持,提供设备和厂房的可视化应用,为员工提供虚拟的可视化体验内容。与此同时,核电大数据还为工业互联网提供了很好的支撑,例如集团成员单位业务协调、核电产业链相关方协作、客户与公众服务化信息、政府监管的信息化支持、数字核电大数据发挥价值等等。
邱副总监还提出配置管理数据库应该是数字化文档管理的核心,数字化移交是数字化文档管理的基础,而数字化信息是数字化文档服务的基础,智能化则是数字化文档管理方向。最终,他还通过生动的图示展现出了“华龙一号”文档智能化图谱,使大家深刻感受到智能化的实际应用情况及其强大的发展前景。
05
企业非结构化数据治理与防护研究
Research on Enterprise Unstructured Data Governance and Protection
华能集团办公厅文档处处长 冷秀斌
LENG Xiubin, Director of Records Department, General Office, China Huaneng Group CO.,LTD.
【小编提示,事儿读者的留言提问,冷处长在演讲中做了热处理哈!】
冷秀斌处长介绍了中国华能企业,特别是近年来展开的信息化建设项目,在这些项目当中,华能发现了很多项目内部的痛点,例如条块分割,业务系统问题缺乏数据共享机制;各业务系统电子文件格式和元数据不统一,归档数据迁移难度大;业务系统升级后,一些业务数据丢失甚至无法恢复,存在数据安全隐患;信息系统过多,用户检索利用不方便等等。
非结构数据管理是华能近期开展的重要项目之一。对信息化的用户需求进行了细致调研化调研,提出了非结构化数据管理要求并对其非结构化数据管理系统的现状进行了评估,提出设想,打算建设一个可以贯通华能系统的非结构化数据管理平台,并为这一平台提出了长期建设目标。
除此之外,他还概述了华能集团在该方面的科研成果及预期效果。还有精彩互动在后面哦!
06
工业互联网与企业档案工作
Industrial Internet and Enterprise Records Work
中国商飞上海飞机设计研究院飞机设计支持工程技术所副所长兼科技情报档案部部长 蒋君仁
JIANG Junren, Deputy Director of Aircraft Design Support Engineering Technology and Director of Science and Technology Information Archives Department, China COMAC Shanghai Aircraft Design and Research Institute
【小编提示,C919诞生地哦!】
蒋君仁部长首先简介中国商飞。指出工业互联网在大飞机研发领域的应用是数字化协同,从中国商飞数字化协同设计研发现状,到辐射至四个方面展开讨论:即全新工业范式与企业核心战略,统一协同环境或单一解决方案,面向端到端业务的协同以及基于哪些模型展开协同。
他在讲解中国商飞上海飞机设计研究院的建设时,指出三维数据如何处理是研究的主要问题。在研究中进行三维数模归档,对结构之间的关系进行规整,以备不时之需。在三维数模的长期保存问题上,开展STEP格式研究项目,认为除了在技术和理论方面进一步完善之外,还需要在管理制度方面升级改进。
未来的发展方向,即由传统档案馆、数字档案馆,发展为智慧档案馆。指出“知识工程师”为知识管理领域引入了一个较为新颖的工作角色:“档案工作者应紧跟社会需求实现角色转变,由从档案实体管理员转变为文件流程与业务系统的设计的重要参与方,转变为企业文件管理的审计员,转变为企业知识资产管理者,成为知识工程师,转变为企业文化的传播者,企业记忆的构建人。”
专家组问答环节
Q1:周文泓副教授对中钞区块链技术研究院院长张一峰提出了两个问题:
1. 我看了您介绍的区块链,自己也去学习过区块链,也看了一些案例及会场上提及到的案例,我能否这样理解,现在的区块链的应用,更多的是技术原理方面的应用,而区块链真正想做到的给全世界一个万事万物的区块,然后让它进入自己,链接信息,达到信息的互联互通,这个场景在目前的应用当中还没有实现?
2. 我做了档案信息空间的构建设想,但是遇到很多难题,例如区块链的原理能否解决互相融合和信任的问题,请问您有没有更深的想法,或者如果要实现这些设想的话,应该从哪些方面着手或思考?
A:张一峰:可以将这两个问题合二为一进行回答。我们不能将区块链技术割裂来看,不能把区块链和其他技术区分开,这一波科学技术其实是一个整体,它们用来解决的是整个社会越来越深度的数字化问题。下一波的物联网技术,5G技术解决传输问题,云技术大数据AI解决存储,在这个过程中,区块链最主要解决在传输生产存储过程中的数据的关系。如果这样的话,我们就可能在整个社会的进程里更好的找到区块链存在的角色。
Q2:Paul向华能集团的冷秀斌处长提出问题:
华能在不同部门提出信息共享,而加拿大的情况是,在不同部门使用同一文件时,他们会认为这改变了文件及其功能,华能是如何实现的呢?通过多功能分类,还是通过标签?
A:冷秀斌:目前华能的现状是建设了全集团系统的数字档案馆,在这个数字档案馆里,我们对文件的数字利用分为四个层面,我们认为档案工作的最终目的就是为了文档利用,所以我们将数字档案馆里80%以上的数字文档都列为公开内容,也就是说我们对数字档案馆里文档的权限设置,分四种类型:第一种类型是完全公开;第二种类型是标题公开,也可以叫条目公开;第三种类型是连条目都不公开;第四种类型是针对某一些特定部门而设置的公开。所以我们在档案利用方面设置了四个权限,对绝大多数是完全公开的,但是你只能看,下载和打印是要审批的,同时你在看的时候,我们会在背景上现实您所从事部门的水印。所以,目前我们采用的是这样的策略。
Q3:一位学者(可文后留言自报家门哈)向商飞的蒋君仁副所长提问一连串问题:商飞形成了全三维的设计与执照,我看到了设计工具是卡缇娅,咱们还有PM以及档案系统,我想问以下三个问题:
1.每个数据包如何进行技术状态的控制,做哪些控制,如何进行数字的审签;问题2,归档的档案数据包该如何组织,是和PM一样也要去做一个产品结构树,还是另有其他的产品结构组织方式;问题3,档案人员在归档时如何检查数据包,技术人员如何在档案系统里利用这些数据包,如何可视化?
A: 蒋君仁:这些问题戳到了我们的痛点。首先我们数据归档是按一个模型一个条目,我们三个型号也是逐个演进的,包括一个工程指令,三维数模,二维数模,到C919恐怕就只有三维数模了,我们都是以一个图号为一个单位进行档案管理,这是第一个问题。
第二个问题,三维数模的产品结构树确实是一个难题,我们现在只是归档了当前的图号的上下级关系,我们计划通过上下级的关系推导出结构树的关系,希望在后一步档案系统里实现这个功能,以此与产品结构树保持一致。
第三个问题,在我们PDF系统里也是可以看数模的,档案系统有一个优势,就是我们现在三个型号用了三个不同的平台,如果你要看某一个部件或某一个位置的装配关系,在档案系统里可跨型号检索,三个系统都能同时看到,但是如果你只想看某一个型号,只能再PDF里看。
Q4:请问广州互联网法院是个什么级别和类型的机构?互联网法院这个名词如何有更恰当的理解?该怎样翻译为英文才能更为贴切地体现本意?
A: 田绘 :广州互联网法院比较特别,它是一个管辖广州市11类涉网纠纷的基层法院,但又由广州市委管理,对广州市人大负责,院长是正局级。
互联网法院,目前的英语翻译有两种,一个是Internet Court, 一个就是Court of Internet,很多人会因为这种翻译形式仅将互联网法院理解成为法院开通的在线办理案件服务,但它的实际意义不这么简单,互联网法院有很多职责,除了在线处理一些和互联网有关的案件之外,我们在线处理的是与互联网本身相关的纠纷或案件,也就是涉及网际空间的案子,所以呢,Linda给我们提了个建议,觉得互联网法院应该翻译为Internet Court in Cyberspace Crime更为合适。
Q5: 一位学者(可文后留言自报家门哈)向国家档案局副局长付华提出有关“电子签名第一个坎儿”及“去除第三方”的问题。
A: 付华:我不是专家,尝试回答你这个问题。首先,我没有说去除第三方,但是档案工作中不能被第三方绑架。电子签名虽然根在工信部,但是中国最多的时候有一百多个公司,现在有四十几个公司可以发放CA证书,每个公司在发放CA证书时都加入了公司专有的技术,赋予证书3到5年的有效期,那么在办公领域,哪一个文件也不可能办3到5年,一般很短时间就办完了,一般不产生问题。但是如果我把这个文件送到我们的档案馆,将来十年或二十年以后,期限过了怎么办?私有的技术,别人打不开,一旦公司出问题或不存在了怎么办?在永久保管的过程中,需要对带有电子签名的电子档案进行迁移,载体和环境变迁后,如何验证?档案工作者不能把自己的命运跟别人捆绑。(这个问题也引发了线上线下的热烈讨论,见仁见智,各抒己见。)
茶歇时间场外互动
12月15日上午,中国人民大学信息资源管理学院马林青副教授以风趣幽默的方式开启了第二天的会议。6位来自业界和学界的发言人,展开了一场精彩的理论与实践的交会、文件管理与信息技术的碰撞。
中国人民大学信息资源管理学院 马林青副教授
Chairman:MA Linqing, associate professor, School of Information Resources Management, Renmin University of China
12.15上午 专题报告
01
从电子发票电子化应用到财务管理数据化
From Electronic Invoices to Data of Financial Management
京东集团税务管理部总监 高淑娟
GAO Shujuan, Director of Tax Management Department, JD Group
【主持人、大家、小编,都有京东购物经历哈】
高淑娟总监首先以一个小小的调研开启演讲,询问在场的与会人员“是否接触过电子发票?是否直接使用电子版的发票报销过?”场内只有几位代表举手。接着以普票和专票两个方面,讲述数字经济给税务管理带来的挑战,以及目前电子发票的数量,京东开具的电子发票量占全国34.4%。高总监还谈到电子发票电子化应用所存在的两大问题“财务软件提升”和“财务合规审核流程变更”,认为目前实践只涉及电子发票的“开具”但却没有“使用”。
京东在电子发票应用的探索:2018年5月京东自营全部切换电子发票;2016年6月30日,京东pop电子发票上线,次年5月9日,京东商家电子发票服务平正式上线运行;实现电子发票的无纸化报销入账,电子发票的归档和业务系统归档接口;实现收集功能、整理功能、保管功能、统计及利用功能、传统载体档案辅助管理功能。高总监表示电子发票的开具与应用实现生产要素的精细化,承担要素和数据、实现精准风控、优化税务管理流程、使合规企业实现个性定制服务,为管理者的经济决策提供更高效的支持,且更有可能从智能服务部门,上升为战略决策和神经中枢。
高总监对进一步推动电子发票电子化应用及财务管理数字化提出了四点思考:第一,对电子发票开具接受、应用等实行通用标准、规范;第二,加强政府宣传和引导;第三,积极探索电子发票的应用场景;第四,鼓励电子发票个环节涉及的行业企业共生协同。最后,高淑娟总监以彼得·德鲁克的一句话结束了今天的发言,“在动荡的时代,最大的威胁不是动荡本身,而是沿用过去的逻辑”为在场的参会人员带来很多思考。
02
航空产品三维数模归档与长期保存
Digital Archiving and Long-Term Preservation of 3D Aviation Products
郑州航空工业管理学院信息管理学院院长
李泽锋
LI Zefeng, Dean of School of Information Management, Zhengzhou University of Aeronautics
李教授就目前三维数模的归档保管困境,尤其是涉及涉密方面的要求,向学界和业界提出问题:我们该如何满足实践上的需求?目前随着CAD技术的不断发展变化,航空工业生成了大量集成PMI的3D CAD数据,数据管理出现很多问题。李教授提出以中立标准格式作为航空产品三维数据归档与长期保存的格式,依据国家标准《开放档案信息系统模型》,探寻三维数据归档的方法、过程与数据模型,同时建立十数万级航空产品零部件的三维数据间有效的关联,才能实现其长期保存。
李教授认为还有很多后期问题值得关注,如档案管理软件和可视化工具的选择,数据通过验证还原图形的理念方法,以及未来我们需要的是文档专家和计算机专家的复合人才,给人们带来了无限的思考。
茶歇 热烈交流
展区 甜美的纪念
03
自主控制的三维数模归档及长周期存储策略研究与实践
Research and Practice of Self-Controllable 3D Archiving and Long-Period Storage Strategy
山东山大华天软件有限公司首席技术官&技术研究院院长 梅敬成
MEI Jingcheng, Chief Technology Officer & Dean of Shandong Hoteam Software Co.,Ltd(abbr. Hoteamsoft)
请注意视频的镜头,专为“事儿”的留言提问读者呈现近距离采访哈!
科大讯飞 会议现场语音翻译
本演讲首先介绍了三维数模归档及长周期存储的问题背景,梅博士提出目前三维模型的长期存档存在软硬件升级难以保存、硬件无法读取和数据安全无法保证等问题,提出我们需要设计出自主研发的软件。其次梅博士介绍国内外在这个领域的研究进展,提出一个自主可控的归档和长期存储的方案,给出了几点建议:第一,要实现一个基于存档系统的协同设计平台;第二,STEP是目前最为先进的标准体系,呼吁人们关注模型对比工具、数据交换、三维模型规范检查技术和三维模型比对验证技术;第三,注重超大规模三维模型量化转换和浏览可视化。报告的最后,梅博士展示了一个航天院所在这个方面的具体实践,证明了中性文本格式STEP在三维数模长期存档方面应用的合理性和可行性。
04
苏宁电子文件管理实践与思考
Practice and Thoughts on Electronic Records Management of Suning
苏宁易购集团股份有限公司行政总监 葛旭
GE Xu, Director of Administration Department, SUNING.COM GROUP CO., LTD.
葛旭总监从苏宁印象、苏宁信息一体化管理模式、苏宁实践基础及成果、实践案例、工作思考五大方面展开了讲解。首先介绍苏宁是一家以全品类、全渠道、零售为核心,金融、置业等产业生态协同发展的企业,苏宁档案信息一体化管理模式SUNING SAM系统是他们的主打系统。他们的电子文件管理实践以业务驱动、系统支持、电子文件归档接口开发规范流程、电子文件归档工作标准和电子文件元数据方案为核心基础,在覆盖业务系统和电子文件归档量方面都有很大成果。
葛旭总监通过人事人员档案、电子银行回单、综合电子合同三个实践案例向与会人员详细讲解了电子文件管理的实践情况。此外还为在场的专家学者提出了三点工作思考:第一,需要持续推进电子文件管理,构建管理制度规范体系;第二,以知识管理为目标,打造深度电子档案服务;第三,实现数据管理现状,凸显档案工作价值,为在场的观众带来了很多启发。
05
从电子文件到知识图谱:电子文件知识服务新路径
From Electronic Records to Knowledge Mapping: a New Path to Electronic Records Knowledge Services
中国人民大学信息资源管理学院博士生
杨建梁、祁天娇
YANG Jianliang, QITianjiao, Doctoral students of School of Information Resource Management, Renmin University of China
两位博士生,作为电子文件领域的新兴力量,为大家带来满满干货和满满的希望!他们认为随着电子文件数据规模、类型的不断扩展,迅速增长的电子文件规模和传统的电子文件组织方式之间的矛盾愈发明显,而由此矛盾产生的电子文件利用需求与知识服务能力之间的不匹配,愈发影响电子文件知识价值的发挥。如何利用机器学习等新性技术对电子文件进行处理、灵活、系统、自动化地为信息需求者提供有效的信息反馈,并辅助对反馈信息进行编排和提炼,从而获得知识,是充分发挥电子文件管理战略价值的重要环节,也是当前电子文件管理者的重要使命。
祁天娇介绍了电子文件知识服务的时代意义,认为现阶段电子文件知识服务将聚焦数据驱动背景下的、面向网络化、智能化的电子政务公共服务、企业产业增值服务、机构业务决策支持、以及公共文化信息服务等。她认为电子文件的管理和服务目前还是文件级服务,需要转变到知识级服务,而知识图谱正给出了这样的知识级服务的解决方案。知识图谱也经历了从知识地图、科学知识图谱到大规模知识图谱的发展过程。人工智能视角下的知识图谱是由三元组关联构成的知识网络。电子文件顶层知识图谱可以由组织、业务、标准、系统四个知识单元构成,具体领域的电子文件知识图谱构建则要结合背景信息、业务和机构信息、内容信息等多方面信息。
杨建梁介绍了电子文件知识图谱自底向上的构建过程,包括知识建模、知识抽取、知识存储和知识服务。其中,知识建模是指预定义关系和属性,知识抽取包括将电子文件数据和元数据抽取为实体与实体关系,知识存储包括实体清洗与映射、知识图谱存储,知识服务则是根据场景需求,实现对不同任务的支撑。杨建梁还介绍了中国平安医疗知识图谱与智慧医疗这样一个具体的应用案例,通过电子病历结构化和知识抽取等,构建医疗知识图谱,辅助问诊、分诊和诊断等环节。
两位博士生认为,从电子文件到知识图谱的转变,是电子文件业务背景、组织架构和文件内容的多层转变,包含知识获取、知识建模、知识存储和知识服务等基本环节。最终通过知识图谱实现的“对象级”而非“文件级”、“内容层”而非“字符层”的知识服务,对于数据驱动背景下的电子文件价值的实现,具有重要意义。
06
新技术环境下电子文件管理纵深发展与关键问题分析
Analysis of Key Issues in the Development of Electronic Records Management
中国人民大学信息资源管理学院
钱毅副教授
QIAN Yi, Associate Professor, School of Information Resource Management, Renmin University of China
男神登场啦!钱毅副教授的报告包含三大板块:
第一部分是引言,主要表示ERM是档案信息化的核心工作,档案信息化核心是档案工作从模拟空间向数字空间迁移的漫长的过程,并深刻认识档案信息化与业务信息化的三部曲关系:滞后、同步、引领。
第二部分“三从”,包括从数字到数据(对象角度),从可读到可信(目标角度),从要素到空间(管理角度),详细论述了档案对象管理空间演变的三种形态,并提出两大挑战:“离散带来的挑战”和“技术能级跃迁的挑战”。
第三部分“三构”,即从三个方向进行提出应对目前挑战和问题的措施,即构建相对完备的理论框架,构建面向三态的规范体系,构建面向实现的行业生态,为大家带来了许多思考和启示。
认真听讲,收获多多~
专家组问答环节
Q1:提到数据管理,电子文件相关的法律标准,这些标准在数据化时代、机器时代的适应性问题如何看待,是否全废?标准建设的视角是什么?遥看十年之后,我们今天的标准该如何构建?
A:钱毅:数据态层级的标准的确不多,数据库归档方法,国际标准正在酝酿,数据相关的标准不可能是完全纯数据的,我们需要开拓不断地增量,加入更多人的理解。
Q2:档案数据的概念如何理解?数据与档案数据,术语上的理解?
A:钱毅:档案数据,我在学校讲数据库这门课,数据是颗粒度比较细,需要根据上下文进行理解,有数据才有信息,才有知识。
Q3:两位航空航天专家都提到三维数据的归档问题,十分给我启发。关于三维数据的真实性保存,想请问是否只将文件要素元数据与内容元数据打包保存就可以?
A:李泽锋:元数据是为了保障真实性,比对之类。我个人觉得,电子文件中的原数据和三维档案所提取的信息是不一样的,后者是三维档案内容本身的,不是元数据,三维元数据更多的是最后的真实性问题,包括检索目的,三性保障用,内容所抽取的元数据是有所不同的。
Q4: 知识图谱技术在电子文件管理中的应用的难点?
A:杨建梁:第一,电子文件序列化,内容的抽取有所困难;第二,如何基于内容的知识图谱与业务背景信息的知识图谱结合起来,目前仍在做,实体的构建,更多的信息、更多知识、更多知识关系的包含都值得人思考。
A:祁天娇:资源层面,资源多以非结构化形态存储,非结构如何转化结构化形态;人力层面,知识建模需要很多业务信息和技术信息,需要众多业务领域人员的加入,如何协同沟通,是一大困难。
专注的眼神
精彩的论坛圆满结束啦!
明年我们在这里等你呀!
如有未尽问题,请文后留言,论坛在线可持续!
赞赏本次论坛,请留下感想,点赞论坛组织者!
喜欢本篇报道,请点赞小编,鼓励知识传播者!
撰文:刘珂、刘俊信、邵亚伟
照片:王健、王雪莲、魏湛卓、邵亚伟
编辑:朱菡雨
在看吗?好看吗?点“在看”哦