GPT-4惊艳亮相,国内厂商正面迎战,对标在所难免。获得百度文心一言和微软Bing内测资格后,文化产业评论(ID:whcypl)精心设计了关于国家文化数字化战略60问,全方位地考察AI的搜索、整合、研判能力和思维深度,同时也通过人机交互对国家文化数字化战略进行深注精解。文心一言与微软Bing之间真的有云泥之别?谁更懂国家文化数字化战略?结果,或许远超你的想象。
作者 | 周旋久(文化产业评论作者、三川汇文旅体研究院研究员)
3月14日,Open AI宣布推出GPT-4,并称其为“最先进的系统,能生产更安全和更有用的回复”。随后,微软宣布自家产品Bing(必应)已经接入了GPT-4,“确保用户拥有最全面的副驾驶功能”。3月16日下午,百度围绕新一代大语言模型、生成式AI产品“文心一言”召开新闻发布会,并强调,虽然内测过程难称完美,但未来迭代能力和提升空间却十分可期。多方入局,硝烟四起,比较、嘲讽、质疑在所难免。百度开放内测邀请,文心一言与GPT-4的正面较量也抬上日程。有人关注百度股价的跌涨,有人热衷于找bug、寻笑料、编段子,有人就文学创作、商业文案创作、数理推算、中文理解、多模态生成五大应用场景进行对比……在AI的秀场,玩法多样,值得探索的还有很多。文化产业评论(ID:whcypl)便决定别开生面地与文心一言和微软Bing来一场文化数字化的深度对话测试,围绕中办国办印发的《关于推进实施国家文化数字化战略的意见》设计了如下的60个问题,看看它们到底谁更懂国家文化数字化战略!03、可以深入讲讲你对《关于推进实施国家文化数字化战略的意见》的理解吗?04、文件中涉及了八项重点任务,你认为这些任务之间是怎样的关系呢?05、文件中提到“中华文化数据库”,可以解释一下吗?08、这些数据库要如何关联和共享呢?部署原则是什么?10、可以举一些“底层关联服务引擎和应用软件”的例子吗?11、中国现在有哪些企业可以做底层关联服务引擎和应用软件呢?12、“夯实文化数字化基础设施”具体指什么设施呢?13、文件中提到要“建设国家文化大数据体系全国中心”,你认为应该如何做?14、建设国家文化大数据体系全国中心的先决条件是什么?15、你认为目前哪些条件已经具备,哪些还需要加强?17、当前中国文化数字化基础设施建设的不足是什么,未来要怎么做?18、什么是“建设具备云计算能力和超算能力的文化计算体系”?20、李彦宏在百度文心一言发布会上说,“以后的应用会建立在大模型上,而不是建立在过去的云计算的这些算力或者存储上。”你认可他的说法吗?22、文化数据中心要怎么做才能贯通各类文化机构的数据资源呢?23、中国目前的国家文化专网建设处于一个什么阶段?你有什么建议吗?24、目前中国各地区有哪些针对建设国家文化专网的政策或举措呢?25、你能给我介绍一下其他国家或地区的类似国家文化数字化战略的措施或项目吗?28、文件中提出要“促进文化机构数字化转型升级”,这是什么意思?29、但是文件中解释的是“推动文化机构将文化资源数据采集、加工、挖掘与数据服务纳入经常性工作,将凝结文化工作者智慧和知识的关联数据转化为可溯源、可量化、可交易的资产,分享文化素材,延展文化数据供应链”,什么叫做“经常性工作”?什么叫做“文化数据供应链”?30、各类文化机构在接入国家文化专网过程中有哪些问题和阻碍呢?31、文化资源数据的标准、格式问题是一个很重要的问题,中国目前做了哪些努力呢?32、你觉得这个标准体系起到作用了吗?具体应用效果如何?存在什么不足呢?33、能举一些国际上的标准案例吗?如何与国际接轨?34、但国际标准是否可能不符合中国实际呢?如何平衡国际化与本土化呢?35、你觉得目前哪些国际标准比较适合中国参考或采用?36、怎么理解“发展数字化文化消费新场景”,可以举例说明一下吗?38、你觉得中国在这些数字化文化消费新场景上取得了哪些成果?40、可以具体说说国外现在在数字创意产业上的领先之处吗?举一些例子。41、可以举一些国内外“利用现有公共文化设施,推进数字化文化体验”的例子吗?42、那你觉得“美术馆、影剧院、新华书店、农家书屋”等公共文化设施要怎么改进,推进数字化文化体验呢?43、怎么理解文件中的“提升公共文化服务数字化水平”?44、评价一下中国目前公共文化数字内容的供给能力。45、“通过数字化手段促进城乡公共文化服务一体化发展”,具体有哪些手段和案例呢?47、当前,图书、报刊、电影、广播电视、演艺等传统业态都面临着升级转型,你认为这些传统业态分别面临着哪些难题?48、我对图书数字化很感兴趣,可以说说新型图书产品的案例吗?如果图书多媒体、互动化,那是不是跟广播剧、视频有关系了呢?图书的本质改变了吗?49、你了解电影的线上发行吗?你觉得这会替代原有线下影院吗?50、文件指出要“在文化数据采集、加工、交易、分发、呈现等领域,培育一批新型文化企业”,现在中国有哪些可称为新型文化企业呢?51、你能举出具体的企业吗?它们都分别在哪一领域处于前沿,你现在所说的更像是案例。52、就你看来,第十四届“全国文化企业30强”呈现了什么特点吗?比如领域集中度?企业属性?这反映出中国新型文化企业的什么问题?53、为什么在这些企业中,比较少有充分展示“文化+科技”力量的数字文化企业呢?56、你认为中国在“构建文化数字化治理体系”上,在哪些方面做得不错,在哪些方面需要加强?57、推进实施国家文化数字化战略的主要目标是“中华文化全景呈现”,怎么解释?58、你觉得中国达到这个目标面临着哪些挑战,又有哪些优势?59、中国将实现目标的时间设置在2035年,你觉得这十多年,文化数字化可能会给世界带来怎样的冲击与巨变?60、就当下而言,你认为ChatGPT、文心一言等语言大模型的出现,是否会影响中国国家文化数字化建设进程?上述问题包含了名词解释、搜索整理、对比思辨、理解阐释、主观评价、预测展望等多种问答类型,全方位地考察了AI的搜索、整合、研判能力和思维深度。由于问题数量较多,回答篇幅也较长,因此文化产业评论(ID:whcypl)在此选取一些了具有代表性、对比性和独特性的回答进行展示。
△微软Bing(搭载GPT-4)
△百度文心一言
文化产业评论:这一问题Bing与文心一言在整合回答上都没有太大问题,但Bing的回答相对来说更加切中要点。这里我们也发现文心一言回答中出现了“传播播体系系”这样的bug,似乎在意料之中。
文化产业评论:这一题有关政策搜索。Bing就询问的内容给了两个相关答案,而文心一言就一个政策进行了内容阐释。总体来说,Bing的回答更符合题中要求。
04、文件中涉及了八项重点任务,你认为这些任务之间是怎样的关系呢?
文化产业评论:这是一个理解阐释型的问题,有关文化数字化战略八大任务之间的内在关系。从回答上来说,两个都答到了相辅相成的核心要点,但显然Bing的回答更能揭示几者之间的内在联系,而文心一言的回答是较为笼统的。
文化产业评论:这一题还是一道搜索型的题目。而这次文心一言的回答明显更胜一筹,针对题目中所说的文化专题数据库,竟然给出了8条相关信息,而且看起来也恰有其事。但缺点也很明显,Bing给出的信息均有索引,而文心一言给出的条目却无法索引,难以判断是真实存在还是胡编乱造。08、这些数据库要如何关联和共享呢?部署原则是什么?
文化产业评论:这一题承接上文,询问的是数据库关联和部署原则,从答案上说,Bing的回答更多围绕着政策展开,文心一言的回答则更发散,阐释的内容也更多。不过总体而言,可以说都不专业,并没有真的提现出目前在推进的措施。14、建设国家文化大数据体系全国中心的先决条件是什么?
文化产业评论:关于建设国家文化大数据体系全国中心的先决条件,虽然都是表面的内容(甚至片汤话),但Bing与文心一言的回答侧重点不同。Bing侧重于数据展开,而文心一言则是面面俱到式的回答。在下一题“你认为目前哪些条件已经具备,哪些还需要加强?”中,文心一言再次重复了这套论述,Bing则给出了新的答案。这也显示出两者对于关键词抓取和理解还存在一定的差距。20、李彦宏在百度文心一言发布会上说,“以后的应用会建立在大模型上,而不是建立在过去的云计算的这些算力或者存储上。”你认可他的说法吗?
文化产业评论:这一题涉及到主观评述,Bing的回答相当地精简和适宜,而文心一言虽然稍有啰嗦,但也展现了较强的理解输出能力。23、中国目前的国家文化专网建设处于一个什么阶段?你有什么建议吗?
文化产业评论:这一题最重要的是对“阶段”这一词的理解,Bing的问题相对更准确,而文心一言则回到了说囫囵话,泛泛而谈的状态。不过,Bing在回答中所引的《关于加快推进广播电视网络融合发展促进5G时代信息消费扩容增效的指导意见》并不存在,这也是GPT始终存在的糅合信息,说瞎话问题。25、你能给我介绍一下其他国家或地区的类似国家文化数字化战略的措施或项目吗?文化产业评论:这一题考察的是AI对海外信息的搜索整合能力。从国家信息来源可以看到,Bing的信息覆盖范围应该是全球性的,而文心一言提供的信息都出自东亚国家。29、文件中解释的是“推动文化机构将文化资源数据采集、加工、挖掘与数据服务纳入经常性工作,将凝结文化工作者智慧和知识的关联数据转化为可溯源、可量化、可交易的资产,分享文化素材,延展文化数据供应链”,什么叫做“经常性工作”?什么叫做“文化数据供应链”?
文化产业评论:在上文中考察了两者对“促进文化机构数字化转型升级”的理解,紧接着询问对两个具体关键词的解释。可以看到,无论是Bing还是文心一言,其实回答得都还不错,没有缺漏。31、文化资源数据的标准、格式问题是一个很重要的问题,中国目前做了哪些努力呢?
文化产业评论:这一问题关于国家文化大数据标准的制定,Bing与文心一言的回答显示出了明显差异。Bing的回答均聚焦于标准和格式,而文心一言却把重点放到了文化机构数字化转型升级。很明显,我们更想要的是Bing式的回答。而且文心一言提到的《文化数据管理办法》、国家文化云等,目前并不存在。44、评价一下中国目前公共文化数字内容的供给能力。
文化产业评论:此题关乎主观评价,从回答的完整性来说,文心一言做得更好,既给出了评价、原因,还提出了措施。Bing的回答虽然较为简略,但是更具有特点的概括性。47、当前,图书、报刊、电影、广播电视、演艺等传统业态都面临着升级转型,你认为这些传统业态分别面临着哪些难题?
文化产业评论:此题考察的重点仍然是关键词提取——“分别”。很明显,Bing就图书、报刊、电影、广播电视、演艺等传统业态均进行了评述,而文心一言则漏掉了“分别”,将传统业态放在一起囫囵解释。48、我对图书数字化很感兴趣,可以说说新型图书产品的案例吗?如果图书多媒体、互动化,那是不是跟广播剧、视频有关系了呢?图书的本质改变了吗?
文化产业评论:这道题的难点在于题目中提出了三个问题,需要对应作答。从回答上看,Bing无疑是完美的,没有漏掉题目中的每一点,甚至还正面回答了颇具刁难度的“本质”问题。而文心一言仅回答了第一个问题,但内容质量还是不错的。57 推进实施国家文化数字化战略的主要目标是“中华文化全景呈现”,怎么解释?
文化产业评论:此题是对“中华文化全景呈现”核心目标的理解。文心一言一如既往地发挥了长文字长阐释的特点,而Bing仍然以简答为主。至于哪个回答更令人满意,还是要看提问者的应用场景是什么。58、你觉得中国达到这个目标面临着哪些挑战,又有哪些优势?
文化产业评论:这一问题的要点在于要对中国文化数字化建设进行整体的评判,从对话感来看,Bing的回答虽然简略,但更像是一个人在跟你做交流,而文心一言则像是一个面试者,分点回答问题。59、中国将实现目标的时间设置在2035年,你觉得这十多年,文化数字化可能会给世界带来怎样的冲击与巨变?
文化产业评论:“这是一个很有前瞻性的问题”,Bing如是评价道。这个问题Bing与文心一言都各有优点,差距并不大。60、就当下而言,你认为chatgpt、文心一言等语言大模型的出现,是否会影响中国国家文化数字化建设进程?
文化产业评论:此题是一个预测理解型问题,文心一言从积极的方面进行阐述,而Bing则从正反两面都进行了阐述,从视角的多元性来说更胜一筹。
百度CEO李彦宏更是在发布会上直言,“大家的期望值是要对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。”发布会期间,百度港股股价甚至一度下跌10%至120.1港元。而百度开放内测,也进一步激发了大家对标和证实的兴趣。有趣的是,内测开放后,一夜之间,外界的态度就开始分化。不少试用者说“远超预期”,资本市场也给出了正向反馈,百度股价开始回升。从文化数字化战略60问的测试中也不难看出,文心一言与GPT-4之间,虽然存在不小的差距,但并没有云泥之别,天悬地殊。从关键词的抓住、理解,灵活表达而言,微软Bing无疑是更具优势,在应对多个问题时也能做到条理清晰。但文心一言在搜索整合信息时,明显更有中文语料的优势,可以获取到多段信息,很多阐述也相对完整。从缺点来说,微软Bing最大的问题是可能会提供较多虚假信息,造成信息污染,而文心一言的缺点则是对问题还缺乏全面的理解,会漏掉要点,表达时也经常泛化冗长,信息凝聚力不强。但正如李彦宏所说,“大语言模型这种产品一旦发布出来,就会获得真实的用户反馈,有了用户的反馈,它的迭代速度、能力提升就会非常快。”作为中国首个AI大语言模型,文心一言既是百度未来战略中的重磅武器,也是承载中国科技荣光的智能产品,面对真实的应用场景和强大的对标对手,它当然还有很长的路要走。但是,只要在向前奔行,就不会沉睡无声。行业窗口与顶尖新媒体【文化产业评论】已运维3000多期(持续8年有余,跨越3000多天),推送文化、旅游、体育领域专业优质文章7000多篇。【文化产业评论】始终秉承权威、专业、准确、及时、实用的特点,聚焦文化、旅游、体育等行业前沿动态、发展思考,直面新时代行业发展重大问题,融汇行业内外精英的观察和理解,得到了全国从中央到地方各级政府公务员、企事业单位负责人、精英从业者的高度关注与大力支持,亦架设起沟通各方的畅通渠道,是中共中央宣传部、国家发展和改革委员会、文化和旅游部 、国家广播电视总局、国家电影局、国家新闻出版署、国家文物局、国家体育总局等有关部门,各地市政府,以及全国各文化、旅游、体育企业的重要助手。欢迎订阅关注!
点击下方【阅读原文】加入「文化产业评论」,这里,是你的舞台~