文化大模型开发应用大会在南京举办
1.点击标题下面的蓝字【伏羲云】
2.点击页面右上角“…”
3.点击“设为星标”
9月21日,由中国公共关系协会文化大数据产业委员会(以下简称“专委会”)主办的文化大模型开发应用大会亮相南京融交会。本次大会重点展示了基于文化大模型开发应用的示范案例和相关工具等,参与文化大模型测评的单位代表、国家文化大数据标识基地建设试点机构负责人和专家学者共计172人参会。大会由中国公共关系协会文化大数据产业委员会副主任委员兼秘书长高凯主持。
9月21日央视《晚间新闻》报道南京融交会及文化大模型开发应用大会
为贯彻落实国家文化数字化战略,实现中华文化全景呈现、中华文化数字化成果全民共享,依托专委会协调推动建设的文化数字化成果和华为云在人工智能大模型领域的技术优势和研发能力,共同打造文化大模型和应用场景,并致力于在宣传文化和教育等领域推广。2023年7月,专委会携手华为云共同发布建设高质量数据的倡议,并签署联创文化大模型协议。
盘古大模型为基础大模型,主要作用就是做好海量基础知识的学习,可以形象地理解为“读万卷书”。在此基础上依托行业伙伴的专业数据打造行业模型和场景模型,可以称作“行万里路”。在成员单位支持下,专委会已提供相关训练数据集,形成了行业级的人工智能大模型。
大会首先为大家展示了文化大模型能做什么?
国家图书馆出版社数字出版部主任王涛
国家图书馆出版社数字出版部主任王涛发表题为《文化大模型为融合出版赋能》的案例分享。王涛说,国家图书馆出版社前期在传统文化的数字出版方面进行了一些尝试,实施过程中遇到了一系列的问题,由于环境的限制,缺少有效的解决方案,这也是出版业在实施融合发展中经常会遇到的问题。随着通用人工智能的发展,特别是文化大模型的出现,为出版业的融合发展提供了新的机遇。融合华为盘古大模型与文化大数据的文化大模型,为出版融合发展提供了新的思路和解决方案。打造一个出版行业自己的通用大模型是我们自身难以实现的目标,而文化大模型的出现,为整个出版行业的发展提供了一个新的契机,我们希望能够借助文化大模型,实现自身在融合出版方面的一次新突破。
中国数字文化集团大数据中心主任蒋鉴发表题为《基于文化大模型的数据自动标注》的案例分享。蒋鉴说,文化大模型的自动智能化标识、图像元素自动提取、文生图和图生文的多模态能力可以有效解决文化企事业单位在文化数字化建设中所面临的一系列问题,搭建更多的文化数字化应用场景。中数集团自成立以来,积累了大量丰富资源,在接入文化大模型后,就可以更加高效、智能地对文化资源素材进行自动化、智能化标识,达到降本增效的目的。文化大模型带来的AI与人工协同工作的全新模式,无疑能够进一步提升中数集团对文化大数据的利用和开发效率,在将来创新出更多样丰富的文化数字内容,为数字文化事业提供更强劲的发展动力,带来更惊人的突破创新。
雅昌文化集团数据库负责人李华发表题为《文化大模型赋能艺术与产业快速融合》的案例分享。李华在发言中主要介绍了文化大模型赋能艺术与产业的融合,雅昌文化集团以艺术数据为核心,IT技术为手段,互联网为平台,打造了艺术行业中最大的中国艺术品数据库。针对雅昌业务应用与海量数据库的数据处理在以提高效率、提高质量两大方面,对文化大模型的智能化提出了急切的需求,并对文化大模型赋能艺术与产业的融合列举了以CV视觉模型为主、多模态模型为辅的应用需求的设想与分享。
针对艺术行业的数据内容与应用特点,以图片智能校色、老照片智能修复、图片智能搜索、跨内容的智能标注/关联、以图识文、艺术品价格评估、艺术品鉴定、智能设计、智能排版、构建知识图谱等方面的成果设想,最后以专委会和华为云联创的文化大模型在美术文博行业数据处理量最大的抠图换背景进行了现场的演示。
雅昌三十年来一直秉持着保护、传承和弘扬中华优秀传统文化的使命,在文化数字化保护、创新、发展和利用等方面持续深耕。
北京世纪超星信息技术发展有限公司副总裁李林发表题为《文化大模型助力下的文生图场景介绍》的案例分享。李林在发言中主要介绍世纪超星是一家数字图书馆领域的领军企业,拥有海量的数字资源和先进的技术。在发展过程中,超星面临两大问题,一是文本数据和图片数据数字化后的利用率不高,二是搜索定位不准确,我们使用文化大模型进行了文生图尝试。文生图是一种基于深度学习的图像生成技术,它可以将文本描述转换成与应用匹配的图像,文生图技术可以用文本交互方式创作艺术作品、生成虚拟现实环境、改善图像检索等应用场景。
超星将通过文化大模型进行四方面探索包括,打造知识图谱自动生成功能,提升时间和效率;打造模糊查询、图片检索;查重与分析,实现对文字与图片、图片与视频与音频的查重;智能归类,根据读者平时个人喜好,根据阅读习惯等进行分类和排序,方便读者查询。
北京玖扬科技有限公司副总裁尹晖发表题为《博古通今,与华为联创文化大模型加持下的中医保健应用》的案例分享。中医模型是基于文化大模型训练而来的L2级应用场景模型,利用了AI的自然语言识别能力。用户可以输入需要咨询的中医保健相关的问题, 像如何食疗、如何养生、常见慢性疾病如何调理等问题都可以被AI模型很好的理解并精准的给出答案。据尹晖介绍,下一步将从三个方面优化中医模型, 一是基于人工反馈的强化训练,二是不断投喂高质量的中医数据,三是进一步完善交互方式, 利用高科技手段实现真正的望闻问切的中医诊断方式。在问到为什么玖扬科技会选择中医保健这个场景, 尹晖回答:“中医文化是中国优秀传统文化的重要有机组成部分, 深受黄老哲学思想的影响, 讲求天人合一、知行合一。中医自成体系,各类古籍繁多, 历史上名医辈出,这样的文化瑰宝在文化科技融合的时代背景下非常值得去探索如何利用AI等高技术手段去发扬传承, 并造福人民群众。”
南京文化投资控股集团有限责任公司党委书记、董事长潘谷平发表题为《基于文化大模型的博物馆智能馆长》的案例分享。潘谷平说,南京是中国首批历史文化名城,也是中国唯一的世界文学之都,南京文投集团作为南京的国有龙头文化企业,我们始终秉承“让城市文化生活更美好”的使命,从去年开启了南京城市文化数字化的探索。
一是自建文都云平台。去年发布全国首个数字时代城市文化整体解决方案,被新华社等众多媒体评价为“文化数字化的南京样本”。今年,我们紧密跟踪人工智能大趋势,提出“十为”建设路径,今天正式发布南京文都数字云平台2.0版本。
二是自采文化大数据。在专委会指导下,关联了超3亿的文化资源数据,打造城市文化数据基座,开展城市文化数据标准化处理。目前已打造南京世界文学之都大数据库、长江国家文化公园(南京段)大数据库,完成了南京文化大数据母库、金陵文化大数据库一期等。
三是自研文博语料库。博物馆体验“三分靠看,七分靠讲”,我们围绕集团的自有场景大报恩寺遗址博物馆打造虚拟智能馆长,每天至少进行超1000条问答训练,组建了由学者和景区讲解员等各方面组成专业团队,通过几个月连续提问和超过10轮的专家评审,根据评审反馈对大模型和语料库进行多轮精调,不断扩充大报恩寺语料知识库的知识边界并修正语料知识库,提高智能问答的高准确率。
四是自觉共享生态圈。我们建立文都产业基金、成立南京元宇宙产业协会、江苏文都创意城市研究院等,通过投资、互动、合作的方式共同打造生态圈和产业合作平台。
现场展示了智能博物馆馆长回答问题的能力。潘谷平最后说,文化数据要素和人工智能技术的有机融合,必将推动文化数字化战略的有效实施和文化产业的高质量发展,这也是数字化浪潮下优秀传统文化传承创新的有效路径!
中宣部文改办原副主任、一级巡视员,
中国公共关系协会文化大数据产业委员会副主任委员高书生
在主旨发言环节,中宣部文改办原副主任、一级巡视员,中国公共关系协会文化大数据产业委员会副主任委员高书生发表题为《从文化大数据到文化大模型》的主旨演讲。高书生说,开发文化大模型是实施国家文化数字化战略的必然结果,是文化传承发展智能化的内在要求,是维护意识形态和文化安全的技术保障。目前已建和在建的数字化工程和数据库为人工智能提供了高质量保真数据,为训练大模型提供了语料库。人工智能是文化和科技深度融合的产物,科技一定要携手文化,文化做两头,科技做中间,这样就实现了深层次的人工智能,生成式人工智能就不只是玩具,而成为工具,服务文化传承发展的工具。生成式人工智能需要专业人士保驾护航,需要专业人士为大模型校正把关后再投放到TO C的消费市场,这样才能确保文化大模型进入健康有序的发展轨道。
华为云盘古大模型资深技术专家李忻瑶发表题为《盘古大模型工程套件,打造大模型极致开发体验》的主旨演讲。李忻瑶介绍了盘古大模型开发套件,套件提供了低代码平台与高阶SDK,能力覆盖了从数据处理、模型开发、再到应用开发的全流程,大大降低大模型应用开发的知识门槛,加速各行各业落地行业大模型。
江苏有线数据网络有限责任公司副总经理林峰发表题为《算力赋能文化大数据区域中心建设》的主旨演讲。林峰说,2022年2月,国家发展改革委等部门联合印发通知,同意在8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,正式启动“东数西算”工程。目前,包括文化在内的各行业对算力需求日益旺盛,算网融合发展成为业界共识。江苏有线积极布局广电“新四网”,围绕中央、省两级文化数字化战略相关文件,以国家文化大数据华东区域中心为抓手,制定数网算融合整体规划和相关地方标准,依托全省智算中心和各类算力平台,为国家文化大数据体系“三中心”、文化数字化产业应用提供算网融合支撑。
为加快算网融合赋能文化数字化应用,江苏有线将紧跟国家文化数字化战略,依托国家文化大数据华东区域中心,探索大模型与文化数字化的融合创新,推进算力在文化数字化融媒视听、元宇宙、AIGC内容生产等领域的应用,尝试大模型在影视制作、文博展陈等行业的赋能;依托算网融合、大模型等技术,发展文化数字化新场景,以长江国家文化公园数字云平台为基础,向华东乃至全国重点文化数字化项目建设提供坚实底座。
深圳国夏文化数字科技有限公司商学院院长张拥金发表题为《文化数字化生态应用落地》的主旨演讲。张拥金说,2022年3月,中办国办印发《关于推进实施国家文化数字化战略的意见》,中央和地方联动,宣传文化全战线发动,国夏也积极地参与到其中,从数字化文化生产,到文化数据产品应用,再到企业数字化转型升级,国夏不仅帮企业大大增加了销售量,并且走出了一条文化数字化新赛道。
为全景呈现文化数字化落地应用,国夏在实践中探索出八步走实施路径,分别为:创作设计数字化、版权认证数字化、文化数据标的数字化、产品溯源数字化、消费场景数字化、数据流转数字化、文化资产数字化、赋能企业数字化,并创造性地提出了中小企业文化数字化赋能方案,至此,文化数字化落地应用生态基本建成。
在大会上还举行了“国家文化大数据标识基地” “国家文化大数据标识注册中心”授牌仪式和第二批“国家文化大数据标识基地”与江苏省文化产权交易所签约进场。
大模型时代,人工智能的三大核心要素之一就是数据。优质的数据集直接决定了大模型的竞争力,要把文化大模型打造为便捷、好用的文化数字化生产工具,离不开高质量数据,文化大模型的优质数据恰恰来自国家文化大数据标识基地(以下简称“标识基地”)。这是中国公共关系协会文化大数据产业委员会于今年三月启动的重大项目,今年6月30日,我们在重庆永川为首批标识基地授牌,经专家组审核通过,在大会上专委会为第二批标识基地授牌。他们分别为成都九天星空科技有限公司、苏州文化数字化运营管理有限公司、长春出版传媒集团有限责任公司、中国广电宁夏网络有限公司。
目前已授牌的国家文化大数据标识基地已经有11家单位。在国家文化大数据体系建设中,随着标识基地越来越多,为了给文化数据采集、汇聚、加工、分类、管理、交易等工作提供有效的标识与解析支撑,经专家组评审通过,专委会授于江苏有线数据网络有限责任公司“国家文化大数据标识注册中心”。
江苏有线数据网络有限责任公司作为国家文化大数据注册中心将会开展文化领域科技政策、标准、研究及专业性咨询及宣贯工作,开展国家文化数字化战略专业人才的教育、培训和考核工作,文化大数据标识数据资源管理与开发利用、国家文化大数据注册信息统计以及开展文化大数据产业促进相关工作等。
大会上还举行了文化数字化建设千名骨干人才培训班(第二期)学员结业仪式。
左起依次为:荣信教育文化产业发展股份有限公司王伟、华中文化大数据科技(武汉)有限公司夏立雄、南京文投股权投资管理有限公司钱源达、甘肃省百草园文化科技有限公司董瑞、中国广电重庆网络股份有限公司严开华、中国公共关系协会文化大数据产业委员会副主任委员兼秘书长高凯、江苏省文化产权交易所季方超、山西中光网络服务股份有限公司陈照远、河南广电传媒控股集团数字产业投资有限公司何阳
END
星标【伏羲云】,不错过每一篇精彩。
体验中华文化数字化成果,请下载伏羲云客户端👇