当今时代,数据要素在全球经济中的地位日益凸显,文章从数字经济时代背景出发,介绍了数据要素作为重要生产要素的地位和发展趋势,并采用文献综述、案例分析等方法,探讨数据要素在科技出版领域的应用路径,以及其对出版产业发展的影响。
研究发现,数据要素的应用为出版业带来了新的发展机遇,促进了优质内容的生产和传播。研究结果表明,数据要素在科技出版领域具有重要的应用价值,能够繁荣学术研究,促进科技创新,提升科技出版质量与效率、创新科技出版业态,数据要素的广泛应用将推动科技出版领域向更高水平迈进,促进出版产业融合创新发展,助力建设数字时代新型出版传播体系。(原文刊载于《传播与版权》2024年13期)
数字时代,数据要素已被世界各国视为关键生产要素,在全球经济中的地位日益凸显。2019年,党的十九届四中全会首次将数据列为与劳动、资本、土地、知识、技术、管理并列的生产要素。2022年12月印发的《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)明确了数据基础制度体系基本框架。2023年12月,国家数据局等十七部门联合印发《“数据要素×”三年行动计划( 2024—2026年 )》,旨在激活数据要素潜能,发挥数据要素的放大、叠加、倍增作用。数据要素正在快速融入各类社会经济活动之中,已然成为当今和未来经济增长的新变量。在出版领域,新型信息技术的广泛应用,创新了内容的呈现方式和传播方式,让优质内容能够更直观、更个性化地触达读者。科技创新扩大了出版范围,为出版业带来了新模式、新业态。科技出版源于科技又服务于科技,是出版业的重要组成部分,也是电子工业出版社(以下简称“电子社”)的核心业务。电子社十分重视数据要素和科技出版的深度融合,基于数据要素,在内容生产、技术加工、市场推广、用户精准服务等方面为企业提供科学决策支持,充分发挥数据要素作为新发展格局中的关键驱动力的重要作用,以促进出版业的高质量发展。鉴于此,文章旨在阐述科技出版领域数据要素的内涵和价值,重点分析科技出版领域数据要素的应用路径,以推动科技出版领域数据要素的创新应用。“数据是以文字、数字、图形、图像、声音和视频等格式对事实进行表现的”,本质是按照一定规则汇聚的事实、活动等现象的记录。“要素”一词源于经济学,本意是生产和经营活动所需的各种资源。数据要素既是纯技术角度以信息与通信技术(ICT)为载体的二进制字符信息,也是社会经济角度人类进行生产经营活动的财富创造基础要素。科技出版领域数据要素不是简单的数据累积,而是出版社利用专业手段对科技出版物的数据进行采集、计算、存储、分析和制作,按照一定规则进行汇聚,使得数据转化为可复用、可传播、可交流借鉴的资源。科技出版领域数据要素的高质量建设,对推动科技出版原创内容持续生成、促进学术交流等具有重要影响。科技出版领域的数据来源广泛,包括前沿科技研究成果、实验数据、专业技术知识和行业最新资讯等,涉及科研出版物、文献信息、市场趋势、读者行为等多方面,且数据类型多样,包括结构化数据和非结构化文本、图像等。随着数据多样性和复杂性的不断提升,科技出版领域在数据处理与分析方面面临日益严峻的挑战。科技出版领域的数据要素具有高度专业性、复杂性、动态性等特点,出版社需持续更新以准确、完整反映科技领域最新动向和发展趋势。出版社应通过对出版物内容、市场趋势、读者行为等数据要素的深度挖掘和分析,明确这些数据要素的发展趋势和潜在价值,为学术研究、内容策划、编辑加工和市场推广提供支持。科技出版领域数据要素的分类比较复杂,出版社需要从多个维度进行考虑。“数据二十条”进一步将数据分为公共数据、企业数据、个人数据,体现了数据要素的所有权并不同于法律上的所有权;也有研究从数据要素持有者与数据要素生成方式两个维度划分数据要素的类型。对科技出版领域数据要素的分类,出版社应厘清数据的所有者,明确数据要素的使用者和管理者。在科技出版领域,出版社依据数据来源进行数据要素分类是较为科学且可行的方法。科技出版领域的数据主要源自以下几个渠道。第一,出版物内容生成数据要素。出版物内容通常涉及实验设计、原始数据、处理方法、分析结果、产业趋势判断、核心技术介绍等,包含大量图表、数据、公式及演算、研究结论或产业资讯。这些都是在作者提交原稿时包含的内容,出版社可通过自动化工具对原稿内容进行数字化处理,如自动添加元数据、链接等,将内容数字化,生成基本的数据要素。第二,编辑整理原稿信息生成数据要素。出版社会对作者提交的原稿进行编辑和整理,借助专业工具和软件,生成更多的数据要素,如书名、作者信息、版本信息、出版日期、页数、目录、摘要、关键词等。第三,图书销售环节生成的数据要素。这主要包括与市场相关的数据,如目标读者群、市场定位、竞争分析、读者行为分析、专家意见反馈等;与实现销售相关的数据,如定价、销售地区、销售渠道、销售折扣等。基于这些数据要素出版社可以完整勾勒出该出版物的外部画像,促进出版业发展的良性循环。综上所述,科技出版领域通过以上方法生成的数据要素可以分为内容数据要素、文献信息数据要素和销售流通数据要素。内容数据要素主要由作者和出版方持有,二者重点对图书内容包含的数据进行整理加工。文献信息数据要素由出版方持有,主要包括书名、文章名、作者信息、出版日期、页数、目录、摘要、关键词、参考文献等。销售流通数据要素由出版方持有,其重点对与市场资讯和销售流通相关的数据进行整理加工。这三类数据要素共同构成当前科技出版领域的数据要素。当前,数据要素已经成为出版业的重要生产资源,在科技出版领域围绕数据要素发现新知识、创造新价值、提升新能力、构建新业态已经成为出版界的共识。出版社应以“数据”为基础,在科技出版全产业链上全力推进数据与出版的深度融合,实现结构化知识的互联互通,助力科技创新。出版社可采用数字化生产流程实现出版效率提升,打造以智能化为核心要素的出版新业态。将数据要素作为核心竞争力,在内容生产、技术加工、市场营销、用户行为精准分析等领域进行高质量的数据要素建设,将成为未来出版社竞争的新趋势。在已经出版的大量科技图书、期刊中,蕴藏了海量的研究数据、科技成果,这些数据和成果是促进我国科技发展的珍贵资源。过去,由于信息技术较落后且在出版业未能得到广泛应用,各种珍贵的数据分散在海量的出版物中。这导致数据散乱多样,缺乏统一的标准规范;数据质量参差不齐,数据访问权限模糊,存在“数据孤岛”“数据壁垒”等现象,严重阻碍了学术交流,影响了科技创新。如今,出版社通过对图书内容进行专业化处理,形成可利用、可分析的内容数据要素,破解“数据孤岛”“数据壁垒”现象,实现海量科研数据的整合、共享、互联互通,充分发挥数据的科研价值。经过加工的高质量内容数据要素具有强大的信息传播力,可以通过数字化形式迅速被传播至全球任何角落,不受物理空间限制。这种传播方式极大地加速了科研信息的流通和知识的普及,确保了科研数据可以被广泛地使用。内容数据要素的非竞争性在科技出版领域同样关键,同一份科研数据可以被多位科研人员同时访问和利用,不会因为一个人的使用而减少其他人的使用机会。这一特点促进了科研资源的最大化利用,使得科研人员能够便捷共享数据资源,共同推动科学进步。此外,不同的研究项目可以不同的方法引用并解读同样的数据。这使得数据在科技出版中可以得到灵活应用,满足各种研究需求。同时,在科技出版领域,内容数据要素具有非静态性,这使得数据成为一个可以持续更新和扩展的知识库,其内容可以随着科研不断发展而拓展,科研人员可以持续地对已发布的数据进行补充和修正,这样不仅扩展了数据的深度,还提高了科研的准确性和可靠性。数据要素的创新应用为科技出版领域的未来发展开辟了新的路径。一方面,数据要素的全面应用极大地推动了出版流程的优化,打破了传统出版模式的诸多限制,使传统的编辑加工朝着智能化、精确化方向发展,极大地提升科技出版物的质量。在传统出版模式中,编辑加工工作主要依赖人工完成,效率较低且容易出错。随着数据要素的全面应用,这一问题得到了有效解决。例如,出版社在出版流程中加入数据验证和审核环节,可以有效解决数据不一致等问题,使得出版过程更加严谨、准确,提高出版质量,并为读者提供更加可靠、有用的内容。另一方面,数字化的加工过程也使整个出版过程更加高效,并能更好地适应当下的科技发展趋势和市场需求。例如,出版社采用数字化编辑工具能够显著提升编辑工作的效率,借助其智能化处理功能,出版社能够快速完成初步编辑、排版、校对和修改等流程,从而大幅度节省时间成本,并降低后续的印刷成本。此外,出版社通过建立开放的数据共享和协作平台,能够促进作者、编辑、审稿人和读者之间的互动,加速推进出版流程并提高反馈效率。从长远来看,出版社加强信息的安全保障对出版业来说也是非常重要的。数据要素的深入应用也将使信息的安全性得到极大提升。例如,在科技出版工作中,出版社需要注重版权保护和信息安全,数据要素的建设使得出版社有能力采取合适的技术手段保护出版内容的合法权益和信息安全。在数据要素驱动的出版流程中,出版社通过建立有效的流程监控和安全评估机制,可以及时发现问题并保护读者的数据安全。这种由数据要素驱动的出版流程改革,从整体上显著提升了出版流程的智能化、精准化和高效化水平,既为出版业带来了效率和质量的双重提升,也展示了数据要素在现代科技出版领域中不可替代的价值。随着科技的进步,传统的纸质出版模式已不能完全满足市场需求,数字化出版和网络化销售成为新趋势。在这一转变中,数据要素的作用尤为关键。首先,通过应用数据要素,出版社能够实现内容的高度个性化。基于读者行为数据(如阅读时间、偏好主题、交互反馈等),出版社可以定制化地为读者提供内容。例如,基于读者的历史阅读行为,出版社应用出版系统可以自动推荐符合其兴趣的书籍或文章。其次,网络化销售的兴起使得出版内容的分发更为灵活和广泛。依靠互联网,出版社可将内容快速分发到全球各地。此外,数据分析在这一过程中可以优化库存管理和物流安排,出版社通过分析地区性市场需求,能够优化库存,降低资金占用和过剩库存的风险。数据要素还创新了营销方式。基于数据要素建成的统一服务平台,出版社将出版商、图书馆、科研单位、高校、书店及作者、读者集成在统一且透明的数据池子里,使其更好地理解和利用图书内容。通过分析读者在平台上浏览、引用、修改图书内容的行为,以及读者与作者之间交流沟通的行为形成的数据要素,出版社能够及时调整市场策略。例如,基于内容引用及读者、作者沟通交流的数据要素,出版社可有针对性地优化编辑选题策划及图书内容组织。此外,数据要素还推动了订阅模式等新商业模式的发展。不同于传统的单次购买,订阅模式提供持续的收益流,且通过持续的数据收集,可以更好地提升用户体验。例如,通过分析订阅用户的阅读进度和偏好变化,出版社可以调整推送的内容频率和类型,使推送内容更加贴合用户的兴趣。可以说,数据要素的应用极大地扩展了出版社的市场范围和业务模式。出版社实现了从内容生产到销售、用户服务的全链条优化。这不仅是对传统出版模式的一种升级,还是对整个出版业务模式的一次革新。对科技出版行业来说,利用数据要素进行自我革新已然成为科技出版行业实现创新发展的重要途径,在科技创新、优化出版流程、精细化内容生产、提升出版物质量以及推动商业模式的创新上,科技出版领域数据要素都呈现独特的应用价值。具体来看,在科技出版领域,首先,数据要素具有强大的信息传播力,由于数据的虚拟性和非消耗性,科研成果和相关信息可以通过数字化形式迅速被传播至全球任何角落,不受物理空间限制。这种传播方式极大地加速了科研信息的流通和知识的普及,确保了科研数据可以被广泛地使用,从而提高了科研工作的效率。数据的非竞争性在科技出版领域同样具有重要影响,同一份科研数据可以被多位研究人员同时访问和利用,不会因为一个人的使用而减少其他人的使用机会。这一特点促进了科研资源的最大化利用,使得科研人员可以在不增加额外成本的情况下共享数据资源,共同推动科学进步。其次,不同的研究项目可能需要利用同一数据集中的不同部分,或者以不同的方法解读同样的数据。这使得数据在科技出版中可以灵活应用,满足各种研究需求。同时,在科技出版领域,数据的非静态性意味着其内容和价值可以随着技术的发展而不断扩充和增长,这使得数据不仅仅是发布时的静态结果,还是一个可以持续更新和扩展的知识库。科研人员可以持续地对已发布的数据进行补充和修正,这样不仅扩展了数据的深度,也提高了科研的准确性和可靠性。最后,开放的科研数据可以被世界各地的研究人员所使用,从而极大地推动了科学问题的深入解决。例如,通过应用开放的基因序列数据,世界各地的科学家在疾病研究和药物开发上取得了突破。这种跨地域、跨学科的协作不仅提升了研究效率,还加速了科技创新。知识管理是科技出版中非常重要的一环,其中数据要素的应用起着至关重要的作用。科技出版领域涉及众多相关领域的高质量知识资源,通过应用数据要素,出版社可以更好地管理和传播这些珍贵的知识资源。数据要素的产生必须依赖高质量数据采集与整理,这个过程中出版社可以对知识进行重构,更好地组织和存储知识,以便形成结构化的知识库。出版社通过对数据要素进行整合和分类,还可以实现对文献、论文、专利等内容的分类存储,有利于管理和检索相关信息,实现对科技出版知识资源的有效管理。在此基础上,为了更好地传播及利用这些珍贵知识资源,实现数据的跨领域应用和共享,出版社可以建立统一的数据标准和开放的数据共享平台,促进数据的流动。通过有效的知识管理以及高质量数据资源共享平台的建设,出版社能够创新数据要素应用路径,真正实现数据增值。数据增值对科技出版工作的优化作用体现在很多方面。例如,通过数据要素的分析,出版社可以更好地把握读者的需求和偏好,从而针对性地开展知识传播活动。不仅如此,基于数据要素,出版社还可以选择更合适的传播渠道和方式,提高传播效果和扩大覆盖范围。基于数据要素出版社还可以监测和评估知识传播效果,及时调整传播策略,确保知识资源得到更广泛和有效的传播。具备知识管理与数据共享功能的数字化协作平台和专业工具可以帮助团队成员共同编辑、分享和探讨知识内容,提高工作效率、提升编校质量。通过数据分析与挖掘,出版社可以从海量数据中发现隐藏的知识,有助于深入理解知识领域,提炼出有价值的内容。出版社通过数据可视化,即利用图表、图形等形式生成的数据要素将复杂的知识以直观的方式呈现,更容易被读者理解和传播。利用数据驱动的方式,出版社可以更科学地进行选题策划。基于数据的分析结果,出版社能够打造满足市场需求的产品,实现产品业务及服务创新。数据要素在出版流程的各个环节中发挥着关键作用,使得筛选、审稿及编辑等核心步骤能够更加精确和高效地协同进行。以往,这些流程主要依赖于人工操作,不仅效率低,而且容易受到主观判断的影响。现在,随着数据要素的引入,这些流程得到了显著的优化。在此背景下,基于数据要素,出版社在算法和模型的支持下,可以自动识别符合发表标准的稿件,显著节省初期筛选的时间,同时减少人为错误。例如,通过对历史出版数据和读者反馈的分析,出版社可以构建模型预测稿件的受欢迎程度和潜在价值,从而在早期就过滤掉不符合市场需求的作品。在内容定位和市场针对性提升方面,基于对在线行为、购买历史和购买反馈等数据要素的读者行为分析,出版社可以得到关于读者偏好的详细数据,从而优化编辑决策,如决定哪些类型的书籍应该优先推出,哪些可能需要重新设计或是调整市场推广策略。例如,如果数据显示科技爱好者群体对最新的人工智能相关书籍反响热烈,出版社可以增加这一领域出版物的出版频次,或是调整相关书籍的市场推广策略,以适配市场需求。这种基于数据要素的决策支持使出版内容更加贴近市场需求,提升了出版物的市场渗透率和读者满意度。数据要素的利用还可以显著提高编辑质量和效率。基于数据要素,出版社利用机器学习技术建立模型,从而预测稿件的影响力和读者接受度。这对稿件筛选尤为重要。自然语言处理技术还可以帮助出版社实现深度文本分析,从而在编辑及校对阶段发现并纠正可能被编辑忽视的文字及语法错误。通过持续收集出版后的读者反馈,出版社可以对出版物进行持续的质量评估,利用这些数据反馈优化未来的出版计划。数据要素除了促进行业的自我革新,在人工智能时代,科技出版领域数据要素的创新应用还有助于促进融合出版业务发展,提升知识服务能力。具体而言,科技出版领域拥有大量专业且高质量的数据,这些数据包括但不限于科研数据、实验结果、专业论文及其引用信息等。这些数据的高质量特性使得它们成为训练人工智能模型的理想材料。人工智能的发展依赖于大量的、高质量的训练数据,特别是经过严格评审的科研数据。这些数据不仅为基础研究提供了支撑,还为应用研究提供了坚实的实证依据。在医疗、生物技术、环境科学等前沿领域,数据的精确性直接关系到人工智能系统的性能,因此确保数据质量的重要性不言而喻。同时,随着数据交易的兴起和成熟,数据的拥有者可以将自己的数据产品化,进行定价并对外销售,使得数据成为重要的经济资产。对科技出版领域来说,这也是一个促进自身持续发展和创新的机会。通过建设和维护自己的数据库,出版社可以不断优化和更新自己的数据资产,提高数据的质量和服务的附加值。这些数据资产的积累将进一步增强出版社在学术和科研市场中的竞争力,其可以通过销售数据获取直接的经济回报。数据资产的持续积累与精心优化,正推动科技出版行业在科研和技术合作领域扮演更加关键的角色。这一能力的提升,直接反映在数据服务品质的显著增强上,使得出版社能够向市场提供更为精确、更具价值的数据产品和服务。可以说,在人工智能时代,科技出版行业的数据资源将有更大的流通和应用空间,也是未来数据经济中的重要资产。出版社需要加强对数据库的建设和管理,推出更多更好的融合出版产品,积极探索数据商业化路径。出版社应通过与全球科研机构、大学及其他教育机构的合作,积极推动科研成果的交流和分享,提高自身研究能力,提升为读者提供知识服务的能力,以便未来在竞争中占据有利地位。总体而言,在全球科技快速发展和数字经济背景下,科技出版领域数据要素不仅提高了科研效率,还推动了出版业的全面转型升级。随着人工智能和大数据技术的进一步发展,科技出版领域的数据要素将产生更大的社会影响力,具有极高的经济价值,成为推动科技进步和知识普及的关键力量。数字时代,出版社应继续推进数据资产的管理和优化,探索数据产品化和商业化的新模式,确保在未来的数据经济中保持竞争优势并充分发挥其在科研和教育中的基础性作用。通过这些努力,科技出版领域的数据要素不仅能够为学术界带来革命性的变化,还会在社会层面产生深远的影响。
来源 《传播与版权》2024年13期(作者:马文哲,电子工业出版社有限公司工业技术出版分社社长/智能制造研究所所长;关永娟,电子工业出版社有限公司中级经济师)