文化数字化我们10年前已经提了,从“十二五”时期开始推动这项工作,实施文化数字化建设工程,从文化资源到文化生产再到文化传播,最后到文化消费,实现全面数字化。
去年党的十九届五中全会讲到文化的时候讲了两个数字化,一个叫作公共文化数字化建设,一个叫作文化产业数字化战略。这就意味着文化数字化已经从工程项目上升为国家战略。
文化数字化本身就是文化和科技融合的产物,要实施国家文化数字化战略,一定要依靠科技的支撑。下面我从四方面给大家介绍一下在推动文化数字化战略的实施和文化大数据建设过程中遇到的一些难点问题。
第一个难题是数据关联为什么提出这样的问题?因为经过10年的努力,宣传文化领域当中数据量非常大,比如说我们的新闻单位有好多图片库,广播电台、电视台有大量的媒资库,还有出版社、文化机构有大量的数据库。数字化之后形成了许多的数据库,随之出现了一个问题,就是数据的孤岛。数据库很多都是各个单位自建自用,量是非常大的,但都是孤岛,使用率很低。数据关联的本意是要把这些数据连到一起,能够共享,这是我们的出发点。怎么实现这种关联?拆成两个方面:一个是实现内关联。拥有数据的文化机构能够把这些数据关联起来,我们称之为内关联。内关联主要是三个步骤。一是分类。我们现在就是按照联合国教科文组织2009年版的文化统计框架进行分类的,分成6个类别。在这个基础上再做编目,编目主要是依靠我们各个行业、各个领域的专业化知识图谱做编目。在完成这两个工作的基础上,数据的坐标定好了,再对这些数据的特征进行描述,我们叫标注,实际上就是标签化。通过这三个步骤实现内关联。二是实现外关联。内关联基本上很容易做到,但是最难的就是外关联。我们想到了依托有线电视网络,把所有的文化机构的数据中心贯通,连一起,形成一张生产的互联网。一说国家文化专网,马上就想到搞重复建设,不是的。我们依托现有的有线电视网络、正在建的广电5G网络和互联互通的平台,就能实现外关联。国家文化专网有三个功能:一是闭环运行,二是标识解析,三是结算制度。这三个功能我们一定要具备,如果没有的话,我们的外关联还是实现不了。为什么闭环运行,是保障数据的安全。下面我想重点解释一下标识解析,我们的标识解析主要是依托中国主导的一项国际标准,即信息和文献的关联标识国际标准作为依托,在有线电视网络部署标识编码的注册登记和解析系统,这样就完成了第一步标识解析。这样就等于有线电视网络要新开展一项业务,国家文化专网接入服务,就是要把各个文化机构的数据中心贯通,实现互联互通,最终的目的是达到外关联。外关联最后要达到的是把零散的文化数据和不同领域的文化数据,比如说文化旅游、文物、新闻出版、广播电视、电影、网络文化,把这些数据贯通起来。还有一个是不同形态的,比如说文字、图片、音频、视频关联起来,还有一些是把文化资源的源和实体关联起来,最后实现内关联和外关联统筹,最终形成关联数据,这是文化数字化重要的成果。而这种关联数据由于凝结了专业工作者的劳动价值,所以说这种关联资产要实现资产化,就可以实现交易,让这种数据能够变现,成为文化机构一个重要的收入来源。在这个过程中我们需要大量的技术,不管是内关联技术还是外关联技术,特别是在数据的传输、安全、存储方面,需要大量技术。
第二个难题是数据加工每一个文化机构先接入国家文化专网,第二步部署一个底层关联集成系统,这也是刚才提到的标识解析的第二个方面,就是依托我们国家主导的国际标准,在各文化数据中心部署这样一种底层关联的引擎和应用软件,最后实现互联互通。在两个条件具备以后,每个文化机构或者若干个文化机构结合在一起的形成数字化文化生产线。这个文化生产线当中主要是解决解构这些数据和关联这些数据以及解构数据、重现数据的功能,最后形成两个产品,一个是通过解构形成的文化资源数据,另外一个是通过关联、重构和呈现形成的文化数字内容,这样就进入了数据的分发和内容的分发阶段。最后往下接的实际上就是数据超市,能够把这些数据变现,把生产单位的生产成果能够转化为资产,转化为产品,最后形成共享的东西。生产线一定要坚持守正。怎么实现守正呢?我们提了四个方面:第一个是数据要保真,第二创作要严谨,第三内容要把关,第四互动要有序。只有这样才能实现守正。如果不能够守正,也就谈不上创新,如果不能够守正,也就不能赢得人民的信任,这个产品的生命力就会大打折扣。数据加工能够关注两个方面,一方面是把大家的积极性调动起来;第二是要改造业务流程,让每一家传统文化机构都能够搭上数字化这辆快车。
第三个难题是全景呈现现在数据也有了,也有人加工,也有人传输,也有地方交易,最后我们最关注的问题是在消费环节,大家所看到的东西是和过去不一样的,如果说和过去一样,那么这个数字化就没有意义。我们现在,尤其是去年疫情以来,都在推线上的活动,线上内容确实是多但也有问题,就是现在大量的内容都是平移过来的,就是把线下的内容平移到了线上,也有一些博物馆,也有一些云演艺等等,这些活动比过去要多,但是看起来不方便,没有完全体现出数字化以后的那种新体验,这方面差。文化数字化不能止步于网页化,把过去一些东西搬到网页上就万事大吉了。我们能不能改写展陈史,能够让展陈方式发生根本变化,比如说我们能不能场景化,有些东西现在已经做到了,但大量的东西还没有。包括戏剧的形式,怎么能在线上看的和在剧场一样,同时又有比剧场更近一步的东西,空间还是很大的,我们把它叫做全景呈现。下一步要推动数字化的文化文化消费新场景,包括线上和线下,线上关注大屏和小屏,大屏是电视机,小屏就是移动终端。线下关注文化体验园、文化体验馆和文化体验厅,形成了在所有的体验场合都能有文化数字体验产品能够体现,这是我们最终的目的。
第四个难题是数据安全这些年每个单位都有大量的数据,但为什么没有拿出来?经过调研发现大家还是有些担心,担心数据拿出来之后很难识别数据是谁的,结果我们也用了很多技术,比如说区块链等,但是什么东西都依靠打官司,这个社会是没法运转的。能不能有一些前置和有效的手段来确保数据安全? 我们现在想到的数据安全,主要是三道门:第一道门是建国家文化专网,这也是我们为什么依托现有的有线电视网络做这件事,因为互联网和公网是物理隔离,数据没有流失,而且也不可能盗取;第二道门是数据存储的方式,文化机构最害怕的一件事就是把数据拿走,所以我们现在提出了一个基本原则,就是所有的数据中心即使贯通了,但还是按照物理分布、逻辑关联部署,别人需要你的数据,必须要经过授权才能使用;第三道门是刚才提到的标识解析,所有的数据一出来,就形成了唯一的标识符,可以实现溯源,但这是我们被动的手段,前两道是最关键的。以上问题中涉及到大量的技术问题,特别是最近几年在和北京邮电大学一起合作的时候,发现还有一些基础学科研究的问题,希望有更多的机构和更多的专家学者能够加入到这个行列当中,破解我们在文化数字化过程中这些难题,共同推动国家文化数字化战略的实施以及文化大数据的建设。