Key Points
OpenAI:超级智能(superintelligence)比通用智能(AGI)更需要监管;
孙燕姿回应AI孙燕姿:AI超越人类指日可待,没什么好争的;
AI换脸直播带货公司被起诉;
思维树(ToT)框架使GPT-4推理能力最高可提升1750%。
OpenAI:超级智能(superintelligence)比通用智能(AGI)更需要监管
5月22日,OpenAI发表由CEO Sam Altman、联合创始人兼首席技术官Greg Brockman、首席科学家Ilya Sutskever撰写的联名文章《Governance of superintelligence》(《超级智能的监管》)。文章指出,未来10年内,AI系统就将在大多数领域超越专家的技能水平,这种能力将远超通用智能(AGI)。而为了降低AI技术的风险,超级智能(superintelligence)更需要监管。
·以年为单位,限制AI能力的发展速度:全球各主要政府可以成立一个组织或设立一个项目,以年为单位,将前沿AI的能力限制在一定增长速度内。个别公司也应承担起更多责任。
·设置类国际原子能机构(IAEA)的AI监督机构:通过追踪计算资源的使用状况,监督所有超过AI能力阈值或计算资源限额的研究和应用。比如,该机构可以检查AI系统、要求审计、测试产品是否符合安全标准,并限制AI系统部署程度和安全级别等。将AI的风险管理提升至全球级别,而非国家级别。·开发确保超级智能安全的技术:超级智能可能在未来10年出现,而我们还缺乏确保使这些超级智能安全的技术。·上述建议中提及的国际机构应当专注于降低灭绝性风险,而非解决各国针对性问题,比如定义哪些内容AI可以生成,哪些则不能。
·允许公司和开源项目开发低于重要能力阈值的模型,此时无需过度监管,比如申请许可证、审计等。
参考链接:
https://openai.com/blog/governance-of-superintelligence
孙燕姿回应AI孙燕姿:AI超越人类指日可待,没什么好争的
5月23日,孙燕姿在自己的博客上回应AI孙燕姿走红这件事。她承认,当AI能够通过处理海量的信息,同时以最连贯的方式拼接组合手头的任务、模仿或创造出独特复杂的内容时,人类无法超越它的那一天已指日可待。
AI孙燕姿的音频由AI音色转换技术Sovits4.0版本(全称Sovits-svc)生成。无论是周杰伦的《发如雪》、郭顶的《水星记》,还是南拳妈妈的《下雨天》,AI孙燕姿都能驾驭。不过,在模仿音色,感情、技巧、唱腔等方面,AI孙燕姿仍然会出现失误。
4月28日至6月24日,B站音乐区推出“虚拟之声创作计划”:up主可选择话题“AI虚拟之声实验室”投稿,平台将给优质稿件提供流量扶持和活动奖励。目前,很多up主通过AI复刻孙燕姿嗓音二创歌曲且获得百万浏览量。
总之,在音乐领域,AI似乎即将成熟到可以通过图灵测试。不过,使用被模仿者的音频数据训练AI并商用,若事先没有获得授权、支付使用费用,则涉嫌侵权,有法律风险。
参考链接:http://www.makemusic.sg/blog/
4月以来,上海鱼腥草信息科技有限公司因其“换脸App”被多位博主起诉。该公司未经许可使用一些博主的影像作品制作视频模板,并提供给付费会员使用。杨幂、迪丽热巴等明星常被AI换脸。有消息称,有的网站提供的AI实时换脸全套模型价格为3.5万元。
AI换脸所使用的核心技术是人脸关键点检测,目前GAN(生成式对抗网络模型)是生成效果较好的模型。
中伦律师事务所樊晓娟告诉「新皮层NewNewThing」,未经他人同意,使用他人肖像替换某一个主播的形象和姓名,会侵犯肖像权、姓名权。如果使用相关人的作品,还会涉嫌侵犯著作权、改编权。
AI换脸技术的伦理问题多年前就已存在。2017年,有用户使用AI换脸软件DeepFakes将情色电影里的女主角换成好莱坞明星,并发布在Reddit论坛上。因大量受害者投诉,Reddit论坛封杀了DeepFakes的账号。随后,DeepFakes开源了其AI换脸项目的代码,很多市面上的AI换脸App,比如ZAO、FakeApp都基于DeepFakes的算法。今年5月初,针对AI生成内容,抖音推出了11条平台规范与行业倡议,要求:
·发布者需对AI生成内容显著标识,并对AI生成内容产生的相应后果负责,无论内容如何生成;·禁止利用生成式AI技术创作和发布侵权内容,包括但不限于肖像权、知识产权等;·禁止利用生成式AI技术创作、发布违背科学常识、弄虚作假、造谣传谣的内容。
思维树(ToT)框架使GPT-4推理能力最高可提升1750%
5月17日,普林斯顿大学和Google DeepMind的研究员提出了一种全新的语言模型推理框架:「思维树」(Tree of Thoughts,简称ToT),该方法可以让LLM(Large Language Model,大语言模型)探索多种思维推理路径,从而提高复杂推理能力。
论文称,ToT在24点游戏、创意写作、迷你填字游戏三个任务中表现良好。比如在24点游戏中,GPT-4只解决了4%的任务,但ToT方法的成功率达到74%。
现有LLM中普通使用的推理技术是思维链(Chain-of-Thought,CoT),它使AI能够“think step by step”,从而生成更有逻辑的语言。但这种技术只能从左到右一个token、一个token地生成——所谓“预测下一个词”。而思维树(ToT)使得模型可以同时探索多条路径。
人类有两种决策方式,一种是快速、自动、无意识的;另一种是缓慢、深思熟虑、有意识的。
第一种方式只能逐步给出当下方案,类似于采用自回归模型的LLM,只能能生成单个输出,无法开展多轮对话或解决复杂的推理问题;第二种方式则通过评估当前状态、回溯过去、预见未来,做出更全局的决策。ToT框架模拟人类的第二种决策方式,可以增强LLM模拟人类第一种决策方式的能力。
论文地址:https://arxiv.org/abs/2305.10601
项目地址:https://github.com/kyegomez/tree-of-thoughts
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关照人的命运的读者一样,我们希望在这个有史以来不确定性最高的时代,更好地理解快速变化的科技世界,也更好地理解生而为“高级智能”的我们自己。在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的是智能,不只是AI。
请扫码关注我们吧!
喜欢就关注我们吧,记得“设为星标”哦~
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye