AI治理必修第27刊|为什么GPT-4不开源?为什么现在的LLM都是Decoder-only的架构?
1942年,阿西莫夫在其科幻小说(I, Robot)中提出了机器人三定律:
1.机器人不得伤害人类
2.机器人必须服从人类命令,除非命令与第一定律发生冲突
3.机器人必须保护自己,只要不违背第一或第二定律
大半个世纪以来,对这三定律的讨论基本停留在科幻领域,大众也从来没有真正担心过机器人会对自己的生活会产生实质威胁。然而ChatGPT的出现让人们不得不开始严肃地思考相关问题,不得不面对ta带给整个社会的阵痛。在短短数月间:插画师、摄影师、程序员,越来越多的职业开始被AI重塑;AI会带来大量失业的对策,诸如通用基础收入(universal basic income)被越来越多的国家放到台面上讨论;一众业界巨擘尝试叫停更大规模的AI实验,这又引来了一场激烈的争论;意大利政府宣布对ChatGPT的临时禁令。而这一切只是一场巨大风险和收益持续博弈的开始。
本月发布的GPT-4前所未有的强大,也前所未有的封闭。几十页的技术报告中完全不讨论任何模型的细节。各方都在尝试复刻、逆向类GPT-4的能力,各类开源和闭源复刻层出不穷,模型萃取(model extraction)类的逆向也开始出现。如果将ChatGPT类比为iOS(封闭生态),LLM上我们暂时还没能看到类似于Android(开放生态,让渡部分权利)的商业模式。随着各方资本的不断进场,笔者认为我们将很快有机会看到一个更加多极化的生态。
Sam Altman(OpenAI CEO):「一种新的摩尔定律就要开始了:每18个月,宇宙内的智能总数会翻一倍。」指数增长的不止是智能,还有风险。今天,机器人伤害人类的风险,已经不再科幻。
点击题目即可查看全文
《规定》作为我国首部针对深度合成服务的专门性部门规章,坚持安全与发展并重,将对新技术新应用的发展起到固根本、稳预期、利长远的积极作用。标志着我国网络综合治理能力的进一步优化提升,但深度合成技术应用与治理尚处于起步阶段,在技术支撑和能力建设方面有待于进一步加强。
第一章是总则,明确立法目的依据、适用范围和行政执法原则。第二章是管辖和适用,对网信部门行政执法地域管辖、级别管辖、指定管辖、移送管辖等制度作出规定。第三章是行政处罚程序,全面规范立案、调查取证、听证、决定和送达等各环节的具体程序要求。第四章是执行和结案,规定行政处罚的执行与监督制度。第五章是附则,对有关概念进行解释。
3.证监会科技监管局局长姚前:重点发展基于AIGC技术的合成数据产业 构建大模型训练数据的监管体系
证监会科技监管局局长建议重点发展基于AIGC技术的合成数据产业,以更高效率、更低成本、更高质量为数据要素市场“增量扩容”,助力人工智能未来发展。他提出建立数据托管机制,对数据托管方进行约束,要求数据托管方按照监管机构的规定对数据来源、处理结果以及使用去向等进行监测,从而使得模型的输入、输出结果符合监管要求。此外,文章还探讨了大模型训练数据的来源与处理流程、合成数据的发展趋势等问题。
1. 为什么GPT-4不开源?OpenAI联合创始人:过去的做法是“错误的”
OpenAI未分享用于训练该模型的数据、能源成本、硬件或方法的信息,这引发了人工智能社区的批评,认为这破坏了该公司作为一个研究机构的创始精神,并使其他人更难以复制其工作。同时,这也使人们难以制定保障措施来应对像GPT-4这样的人工智能系统所带来的威胁。
3. 为什么现在的LLM都是Decoder-only的架构?
ChatGPT作为大型语言模型的代表,具有强大的对话能力,但也存在着可信性、对话式搜索引擎和通用人工智能发展等方面的局限。它正在改变传统人工智能研究方向,为接近通用人工智能提供了一种可能的方式,但需要克服现有的问题。
4. Stable Diffusion公司新作Gen-1:基于扩散模型的视频合成新模型,加特效杠杠的!
5. GPT-3解数学题准确率升至92.5%!微软提出MathPrompter,无需微调即可打造「理科」语言模型
该平台将收集到的prompt输入到模型并测试其回复的安全性,并考虑八个安全维度和六种指令攻击下的安全性。目前已测试ChatGPT在内的多个中文语言模型并将安全分数公布在平台的排行榜上。
Adobe Firefly是Adobe推出的创意生成式人工智能模型集,将成为跨Adobe云端产品的全新Adobe Sensei生成式AI服务的一部分。它能够帮助设计师提高设计效率,突破创意的边界,并且专注于商业设计用途,确保创作安全可用。同时,Adobe还创立了可信数字内容归属的全球标准CAI,旨在提高人工智能生成内容的透明度。Adobe Firefly是为创意时代提供的一种满足设计师需求的高效工具。
OpenAI CEO Sam Altman表示,人工智能技术将重塑社会,可能会取代许多工作,但也可能会带来更好的工作和改善生活。OpenAI推出了最新的ChatGPT模型GPT-4,能够处理图像输入,回答比其他版本更准确,用户也可以与之进行更长的对话。然而,ChatGPT等AI语言模型存在错误信息的问题,OpenAI表示正努力解决,并呼吁社会参与,帮助遏制其广泛使用所产生的任何负面结果。
13. ChatGPT王炸更新!能联网获取新知识,可与5000+个应用交互,网友:太疯狂了
OpenAI推出ChatGPT插件功能,让ChatGPT能够使用工具、联网、运行计算。用户可以接入数学知识引擎Wolfram Alpha,查询最新新闻、航班、酒店、电商数据等,也可以投喂私有数据,成为人的“第二大脑”或企业的智能助理。OpenAI还开源了知识库检索插件的代码,并强调了安全原则,多项保障措施一一针对功能。
该工具集成了一个华丽的聊天界面,可通过语音或键盘输入生成代码,并集成了单元测试、debug建议等功能。此外,Copilot X还提供了Pull Request、文档查询和CLI等多项功能。据称,Copilot X能够将开发人员的生产力提升至少10倍。一些网友表示担忧,AI的出现可能会使编程岗位失去工作。
15. GPT-4写代码能力提升21%!MIT新方法让LLM学会反思,网友:和人类的思考方式一样
该方法使用二元奖励机制,让模型在自我评估之后,若输出为0则开启反思模式,并利用启发式函数和修正函数实现自我反思和修正。在HotpotQA和编程测试中,使用Reflexion的LLM都表现出了明显的性能提升。这种方法不仅适用于GPT-4,也适用于其他大语言模型。
Databricks发布了拥有60亿参数的Dolly,它类似于ChatGPT,但只需要少量高质量的训练数据和30分钟的训练即可实现。Databricks希望通过证明构建类似ChatGPT这样的服务并非看起来那么困难,来抢占OpenAI的风头。Dolly的发布意味着即便是一个“过时”的开源大型语言模型,也能通过30分钟的训练,赋予它神奇的类似ChatGPT的指令跟随能力。
本文先讲述预训练语言模型与知识的关系,再阐述在对话系统中引入外部知识的原因和做法等方面,对基于知识的对话模型作简单综述。
18.Stealing Large Language Models: 关于对ChatGPT进行模型窃取的一些工作
该研究团队讨论了通过较小的模型可以在特定代码相关的任务上逼近甚至超过大模型的能力。该研究对未来模型保护提供了一些见解,并为无法承担训练超大模型的公司/个人提供了解决方案。但仅仅用于学术研究,相关人员没有用所得到的模型进行任何形式的盈利。
19. 300美元平替ChatGPT!斯坦福130亿参数「小羊驼」诞生,暴杀「草泥马」
斯坦福学者联手CMU、UC伯克利等推出了130亿参数的Vicuna模型,经过测试和对比,结果显示Vicuna模型在绝大部分问题上的表现都非常出色,性能可以与GPT-4相匹敌,并且相对于其他模型,具有更高的准确性和流畅性。除了写作,Vicuna模型在编码、数学、角色扮演、常识等方面也具有很高的能力。
20. 彭博&约翰霍普金斯大学:首个用于金融的大语言模型BloombergGPT
Bloomberg构建了一个3630亿个标签的数据集,训练了专门用于金融领域的LLM。他们开发了拥有500亿参数的语言模型——BloombergGPT,其在金融任务上表现远超过现有模型,同时在通用场景上的表现也很出色。该模型可以用于金融预测、金融风险控制以及自然语言处理等方面。
1. 强化学习与神经交互;2. 人类运动-神经系统建模;3. 机器学习优化神经界面设计;4. 安全稳健的强化学习方法;5. 瘫痪患者的运动功能重建;6. 结语展望
2. 无需完美,文心一言已然自证百度
新加坡工程院院士、AAAI、ACM、IEEE 和 IAPR会士颜水成加入智源研究院,任访问首席科学家。他的研究领域包括计算机视觉、机器学习和多模态分析,曾获十次冠军和荣誉奖、十多个最佳论文奖和最佳学生论文奖,在多模态顶级会议 ACM 上拿下多次奖项。
● AAIG成立一周年!砥砺前行,谱写新时代的科技之歌~请查收这份最新的自我介绍
● 月刊|AI治理必修第26刊|GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了?
● 听委员说|AAIG薛晖出席杭州市"两会",提出加快建立人工智能产业的多元协同治理机制
● 不是超能力,而是科技力!安全稳健的神经调控疗法帮助瘫痪患者实现自由站立!《追AI的人》第22期直播回放
● “算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!
更多人工智能治理和可持续发展好文点击下方名片关注和星标【阿里巴巴人工智能治理与可持续发展研究中心】👇AAIG课代表,获取最新动态就找她