查看原文
其他

巧妇难为无米之炊,底蕴决定未来

镇长本人 大树乡谈 2023-06-03
账号暂停使用前,2月6日的文章消失了,感谢《服务外包》编辑部的认可,这篇文章经微整后已刊登在2023年第5期AI专题部分。

关于AI和GPT,之前在《人工智能会不会取代甚至毁灭人类》一文有所探讨,小镇认为GPT能够模仿人的逻辑归纳能力,前进了一大步,但距离想象中的AI还有非常漫长的距离,随着大模型的不断完善,在更多领域一定会发生极为迅速的变革,影响极为深远,但要说取代甚至毁灭人类,就过于焦虑了。

人是有限的,人的造物不可能超越人类,人工智能无论多么接近人,也绝不可能脱离人类而存在,没有了人类,AI也就失去了存在基础。何况以目前发展情况看,AI仍然停留在信息学层次,还远远没能挨到生物学的边缘。

在过去的三个多月里,小镇对AI进行了更多学习和思考,还与相关从业者进行了交流,比如刊文配图来源的视觉中国,又比如之前风口浪尖的百度等等,综合思考下有了新的认识。

第一点思考:AI已经极大改变了众多行业,在AI的帮助下,一人成军变得更加容易,认知、思维重要性进一步提高。

受机械、能源等其他领域技术限制,AI的威力在线上尤其内容生成领域展现的更为直接,依托人工智能、云计算、区块链、大数据等相关技术,已经在视频、音乐、摄影、美术、AR/VR、3D、设计等等领域出现了一大批代表更高效率的工具,虽然相比行业精英仍然有差距,但已经可以让一名从未接触过这些领域的普通人,在短短几十个小时达到准专业程度。

举三个例子。

例子1:midjourney,输入文字,就能通过人工智能产出相应的图片,不断优化得到自己想要的。

这仅仅是基础,还有更多的用法,比如设计师,设计品牌LOGO和外包装是一件非常费脑子的事情,现在依靠midjourney可以生成大量图片,再从生成的图片中找到符合要求的结构和元素,在此基础上进行简单组合,再以组合后的图片为基础继续AI生成,如此循环,可以更高效的完成设计。

就像AlphaGo诞生后,人类棋手向AI学习下棋,在AI辅助下提高棋艺,设计师与AI成为了具有更高效率的组合。

例子2:AI作曲,这方面国内早在几年前就已经落地,如网易在2020年正式发布了全AI生成歌曲《醒来》,在全球也处于领先地位。

近期“AI孙燕姿”在互联网走红,利用AI模仿孙燕姿的音色、唱腔翻唱与孙燕姿风格相似或迥异的歌曲,孙燕姿对此专门回应,谈到“该怎么跟一个每分钟就能推出一张新专辑的‘人’比呢?”,认为AI可能将威胁到成千上万个由人类创造的工作。

模仿其他歌手音色翻唱对AI来说不过是小事,甚至一名音乐人将自己的作品导入AI进行训练后,AI能够模仿这名音乐人的风格,一定程度上复制这名音乐人的创作能力,从输入的一句话、几个词开始,自动生成一篇完整的歌词,根据歌词生成旋律,甚至还能生成midi转换为曲谱。

当然,细细分析,当下AI的作品更加直白、死板,有一种网络神曲的感觉,情感几乎没有,就像写茉莉花不能只写茉莉花。但放在以前,谁能想象,AI在几分钟之内就能完成一首还算可以的歌曲呢?在AI创作基础上,由人进行升华,又会如何呢?

例子3:DragGAN,一个功能强大的图像编辑工具,目前只是一个雏形,有待进一步开发,项目组已经开源以吸引更多投资。

学精PS,就足以找到一份还不可以的工作,而在PS领域,有一个段子叫“不能把大象P转身”,用于调侃甲方对图像编辑无底线的苛刻要求。然而现在,使用DragGAN只需要拖动鼠标,就能够让图片中的大象转身。

给一张图片,可以任意让图片里面的任意物体随意转动,摆出各种不同的姿势,这在PS时代绝无可能实现,至于其他PS能实现的编辑功能,随着开发的进一步深入,想必也没什么技术难度。

过去需要一整支专业团队才能做到的事情,现在只需要一两个人就可以完成,这既是对人的解放,但也将对更多人产生巨大冲击。

第二个思考:工具与人的关系,终究是善于使用更先进工具的人,代替其他人。

在过去的几个月,小镇也与尚未进入职场的在校生有所交流,他们很焦虑未来就业,清华的学生也不例外,尤其是新闻文学等文科类专业,本来就没有真正的专业壁垒,面对来势汹汹的AI,更担心在人与工具的竞争中失利。

小镇认为,不必担心人竞争不过工具,工具绝无可能取代人,只有人才会取代人,既然已经看到AI的强大,为什么不当第一批善于使用新工具的人呢?

随着新技术的传播、扩散,在初期一定会有一批人最先提高效率,这当然会导致出现竞争更激烈的内卷,导致竞争压力更大,职场变得更累。就像打字机和打印机的普遍使用,导致公文变得越来越啰嗦、从初稿到成稿的改动次数越来越多。(参见《没有救世主,做自我的解放者》)

但这毕竟是几年后的事情,AI这种工具的使用门槛还是有的,而从历史看,新事物被人普遍接受要比想象的更长。比如新能源汽车,明明国家早就规划未来私人小汽车纯电和混动各半,全球各国也纷纷加强电动汽车的推广,但仍然有一大批人坚决认为电动汽车就是骗局,AI也不会例外。

个人角度相对还好说,更需要担心的是整体。

人不是教科书上的纸上谈兵,也不是电子游戏中的一个数据,现实中一旦失业,在同行业找一个同岗位、同职责的工作都很不容易,那么在新技术的颠覆性冲击下,行业、岗位发生巨大变化,跨行业、跨岗位完成职业转型,又谈何容易呢?

人工智能的大潮已不可避免,国家层面必须提前谋划了,人的培养需要时间,不可能像电子游戏一样,点一点就立刻完成人才教育,过去的诸多改革中,已经在这方面吃了大亏,不可不慎。

第三个思考:监管规制面对时代发展,要找到一个合适的位置。

关于监管创新和新兴业态,会有一篇专门的文章阐述,放与不放、紧与松都可能出现问题,今天先讲一个方面,那就是监管规制落后于时代发展带来的问题。

在与视觉中国、百度等AI领域从业者交流中,达成了一个共识:当前知识产权体系已经严重落后时代发展,已成为制约人工智能发挥更大作用的关键卡口。

就拿视觉中国来说,掌握全中国最优质、最丰富的素材资源,仅与CCTV的合作,就从2万小时的纪录片获得了30多万个优质素材。小镇试用过多种AI视频制作工具,根据图文内容选择相应素材,剪辑成视频,相对而言,抖音的剪映比较好用,核心是素材多。
但就算是剪映,素材仍然远远不够,质量更是粗糙,如果能够将如视觉中国等掌握的大量优质素材引入,再由华为、百度这类掌握更强AI技术的公司训练出更强的大模型,相信可以大幅提升AI视频生成的质量。

行业相关企业也确实想到了,也探讨了合作可能,但现在就卡在数字版权上,在商言商,数字这类可以无限复制的特殊产品,如何确定权属和利益分配至关重要,形不成一个完善的商业闭环,就不可能成功。

在AI时代之前,数字版权体系比较完善,商业模式也很成熟,比如开头提到的《外包服务》使用的配图就是从视觉中国购买的。

但是进入AI时代,数字版权已经不可能再追溯,也就无法确认权属,不可能按照传统的版权销售模式进行分账,谈不妥利益那就不可能形成新的商业模式,只能等待新的探索成型,比如利用区块链技术,比如通过社会学实验等等,最终达成适应AI时代的版权共同体,现在刚刚起步,还有大量工作需要完成。

但这又大大超出了当前的法律、监管、规制和治理体系,存在大量的模糊、灰色地带,各方合作存在基础不稳,利益易受损,合作关系难以维系。

对此小镇也咨询了知识产权保护方面的相关人士,结合今年的知识产权方面的改革探讨AI时代知识产权保护体系的升级,机制调整还需要市场进行更多创新探索。

第四个思考:AI时代,国与国之间的差距会进一步拉大,文明底蕴是关键。

很多新东西,究其本质并没有那么复杂。

就拿AI来说,需要大量数据进行模型训练,这个过程需要人的大量参与,比如数据清洗、标注,又比如新职业“人工智能训练师”,就是要不断地对AI提问,根据AI回答进行引导、反馈,从而加速AI进步。

这个过程一定涉及意识形态,涉及思想和社会学,别的文明训练出来的AI模型,用起来就是不顺手。

比如现在国内大模型开发,确实存在大量使用国外开源模型的问题,在开源模型基础上进行学习、解读、再训练,但来自国外的大模型显然水土不服,关键是训练的数据差异太大,国外大模型并不包括中国特色的部分,中国传统文化、历史底蕴、人文思想在这些舶来大模型上并无体现,也就出现了此前“文言一心”出现的一些问题。

(上图取自百度搜索)
训练属于中国的大模型势在必行,技术上不存在难点,卡点在最基础的原材料也就是数据上,要面对本土语料库也就是数据来源丰富性、可及性不足、数据孤岛等诸多问题,今年的机构改革核心之一就是数据。(参见《透过机构改革,把握未来的发展方向》)

但从长远看,技术问题都不是大问题,中国拥有全球最多的接受过高等教育的人口,还有全球最多的接受过基础教育的人口,打通数据堵点,依靠人才优势迅速提高本土数据的质量,在未来几年内打造出属于中国的通用大模型并非不可能。

发展属于本国的AI,真正考验的恰恰是本国的文明底蕴。中国有数千年的文明传承,依靠全球最大规模的人口、网络优势,拥有海量数据和文化资源,这就是金山银山
西方作为一个整体,在数据和文化上并不逊色。

但全球多数国家呢?无论在文化积累、数据资源、技术实力乃至市场需求等等各方面,都很难训练出真正属于自己的通用大模型,只能使用非本土的,这种差距只会越来越大,看不到缩小的可能。

从思想、认知的根本底层,文明也会更为明显的拉开层次,从属、绑定更加潜移默化。

庆幸,生在中国,生在这个时代。


其他文章推荐
■  透过机构改革,把握未来的发展方向
■  大病初愈,急不得,要慢养
  防失联措施汇总  ■

如果喜欢,还请点赞、“在看”和关注吧
欢迎分享,让更多人发现“大树乡谈”
防失联,请关注“大树乡谈2022、2023”
       

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存