文化大模型评测工作座谈会在京举行
1.点击标题下面的蓝字【伏羲云】
2.点击页面右上角“…”
3.点击“设为星标”
由中国公共关系协会文化大数据产业委员会(以下简称“专委会”)和华为云计算技术有限公司(以下简称“华为云”)联创的文化大模型即将进入评测阶段,为做好评测工作,8月28日,专委会邀请二十余家成员单位、国家文化大数据标识基地负责人,在北京召开文化大模型评测工作座谈会,就文化大模型如何赋能文化数字化建设进行深入研讨,并取得共识。
会议现场
专委会副主任委员兼秘书长高凯主持座谈会,华为云盘古大模型产品总监周唐军出席座谈会并介绍相关情况。
图为专委会副主任兼秘书长高凯主持座谈会
专委会专家组成员尹晖以《文化大模型能为行业做些什么?》为题,针对文化企事业单位在文化数字化建设中面临的数据体量大、处理成本高、数据处理效率低等问题,提出了文化大模型解决方案,即通过文化大模型的自动智能化标识、图像元素自动提取、文生图和图生文的多模态能力可以有效解决。文化大模型帮助文化机构在多个应用场景高效完成各种工作,包括数字人对话、基于NLP的知识问答和搜索、多模态知识图谱生成、AIGC文生图自动标注、画作鉴真、长视频拆条自动处理等。针对文化机构自有数据量多、但因大模型投入大而裹足不前,尹晖提出,专委会和华为云可以提供安全且自主可控的基础设施平台,保障数据端到端的安全处理,文化机构不需要投入巨额资金建立自己的算力存储基础设施和工具链,就可以使用自有数据拥有专业模型。在成员单位支持下,专委会已提供相关训练数据集,华为云已完成数据清洗工作进入预训练阶段,即将进入评测调优阶段。
图为专委会专家组成员尹晖主旨发言
华为盘古大模型3.0包括三层结构,最底层对标通用大模型,称之为基础大模型(L0),这一层可以形象地理解为“读万卷书”,主要作用就是做好海量基础知识的学习。在这一层之上是行业模型(L1)和场景模型(L2),可以称作“行万里路”。
图为华为云盘古大模型产品总监周唐军作主旨发言
华为云盘古大模型产品总监周唐军介绍了华为盘古大模型及开发套件。盘古大模型基于华为云在行业上的实践积累,与行业伙伴联合创新了多个行业大模型,并取得了丰硕的应用成果。与专委会共创文化大模型,高质量文化领域数据对文化大模型的意义重大。面对文化领域的新场景、新应用,盘古大模型将深度赋能文化产业,更好地传播优秀的中华文明!
图为国家广电总局信息中心王仝杰处长发言
在讨论环节,参会负责人围绕座谈会主题发表看法和建议。国家广电总局信息中心王仝杰处长表示,文化大模型将有助于解决视频快速检索、标签标识提取、数据再利用等问题。
图为国家图书馆出版社副社长葛艳聪发言
国家图书馆出版社副社长葛艳聪说,我们作为首批参与国家文化大数据体系建设的单位已从中获益,我们非常愿意加入文化大模型的建设当中。首次见到为文化企业打造的大模型,这是专委会和华为云强强联合。我们多年工作积累形成的优质数据可以用于文化大模型的训练,同时也能对我们未来工作有所帮助,特别是为数据打标签的效率和数据搜索效率都会提高。如何将古籍中优秀的传统文化挖掘出来,服务于当下是我们一直努力的方向。
图为中国数字文化集团有限公司大数据中心主任蒋鉴发言
中国数字文化集团有限公司大数据中心主任蒋鉴说中数原创数据和集成数据区别较大,集成的数据由于采集、封装、存储的标准不同,需要用很原始的人工操作对数据进行识别和标注,信息的正确率和工作效率都不能保证,有了文化大模型将会实现降本增效的目的。
图为中央新影集团技术部关玥发言
中央新影集团技术部关玥表示,参加这次会议确实是受益匪浅,我们作为传统文化企业,一直是以人工的方式进行数据标注标识,包括视频的切分、识别工作等。文化大模型将为我们下一步的工作有很大启发。目前我们在做国家典藏工程是对历史珍贵胶片进行修复并转成4K的数字化存储后搭建数据平台。该平台是面向主流媒体和市场化新媒体的一个数据中心。文化大模型的视频分类分割检测模块对我们来讲是借鉴作用的,由于对影片内容要精准定位的缘故,我们目前用人工的方式,凭经验识别领导人、年代、具体战役、事件等,如果使用AI完成这项识别工作将能够给我们达到事半功倍的效果。
图为雅昌文化集团数据库负责人李华发言
雅昌文化集团数据库负责人李华表示,我们在标注、解构、重构方面都有相关的要求。在数据标注要做到完整准确,能够跨内容地把相关数据及其关联关系与数据来源的可信度一并标识,特别是对于敏感数据的标识可以准确标注。在图像处理方面可以自动图像校色修正,立体图像可以更换背景或剔除杂物。在解构方面可以快速、准确地识别并解构图片中的各种独立对象、场景、事物、文字、印章、印鉴款识等常见特征内容等,作为新创作品的素材或组件。在图像搜索方面,以相同图片或聚类图片,同一主题同一时间作品聚类,多模态的以图搜图、疑问选图、疑问作图、多图重构等功能,我们希望参与共同开发文化大模型,期望文化大模型模块尽快应用到企业,满足业务需求。
图为北京世纪超星信息技术发展有限责任公司北京分公司副总经理张静发言
北京世纪超星信息技术发展有限责任公司北京分公司副总经理张静表示,我们主要服务教育领域,内容准确性和意识形态安全性是我们审查的重点。这也是我们希望通过文化大模型解决的难题。
其他与会人员也就文化大模型开发应用问题提出了意见和建议,尹晖和周唐军同大家进行互动,就大家关心的问题一一解答,讨论气氛热烈。
最后,专委会副主任高书生作小结,他说,听完大家的热烈讨论,最深刻的印象是专委会和华为云联创文化大模型这件事做对了,大家对文化大模型具有实实在在的需求,愿意贡献数据完善文化大模型,对开发应用场景也有了比较明确的方向和构想,对文化大模型的发布充满期待。高书生指出,联创文化大模型不是赶时髦,是实施国家文化数字化战略的必然结果,是文化传承发展智能化的内在要求,也是维护意识形态和文化安全的技术保障。从文化数字化到文化大数据再到文化大模型,是符合逻辑的,将中华民族积淀了五千多年的文化资源,转化为具有文化内涵的数据,成为文化大模型训练数据,不仅可以补齐当下大模型训练数据短缺的短板,而且破解了人工智能哺育什么人的难题,还能够大幅提升文化机构的效率和效能。文化大模型具有领域宽、应用广的特点,它涵盖了宣传文化系统,包括思想理论、文化旅游、文物、新闻出版、电影、广播电视、网络文化文艺等,中华文化全景呈现是最大的应用场景,包括线上和线下,文化教育设施和公共场所,只要有空间,都可以升级为文化体验场所,都可以成为文化大模型的应用场景。
图为专委会副主任高书生作小结
座谈会后,高书生同华为云大模型生态崔斌总经理就推进下一步工作进行了深入沟通,并达成共识。
相关推荐
END
星标【伏羲云】,不错过每一篇精彩。
体验中华文化数字化成果,请下载伏羲云客户端👇