智能周报|欧洲议会通过《人工智能法案》草案;OpenAI大幅更新API,或导致与微软矛盾加剧…
本周智能领域最重要的变化就是监管。
欧洲议会本周三通过了《人工智能法案》草案,意味着继《通用数据保护条例》(GDPR)后,欧洲继续走在了监管科技公司最前方。与欧洲对AI严阵以待的态度相反,日本政府已经准备用AI来辅助工作。同样是在本周三,东京都知事小池百合子表示8月份当地所有政府部门就将全部接入ChatGPT来工作。
我们似乎真的处在一个分裂的时代。对于生成式AI,不仅各国政府的态度千差万别,从科技公司的角度看,微软与Google所期望的监管也截然不同。Google本周在回应美国商务部的政策征求意见中表示,对AI的监管不应该是集中式的,而应该由各个组织各个部门提出各自的监管方法。相对的,微软和OpenAI都倡议建立新的政府机构来监管AI。
回归到生成式AI技术。OpenAI在本周对GPT模型的API做了大量更新,赋予开发者更多的自定义权限。中国科技公司们也在迎头赶上,北京市政府支持的智源研究院和前搜狗CEO王小川的新创业公司百川智能分别推出了最新的大模型产品。
可以关注《第一财经》YiMagzine的最新IP「新皮层NewNewThing」。以下过去一周最值得关注的智能新闻,由该新IP为大家整理,请享用。
Key Points
监管篇
欧洲议会通过《人工智能法案》草案;
日本东京都政府将从8月开始使用ChatGPT工作;
Google提出新的AI监管模式,与OpenAI截然相反。
大模型篇
OpenAI大幅更新API,或导致与微软矛盾加剧;
智源大会召开,悟道3.0大模型系列发布;
百川智能发布70亿参数开源中英文大模型。
监管篇
欧洲议会通过《人工智能法案》草案,距离禁止实时(real-time)面部识别技术又近了一步
当地时间6月14日,欧盟《人工智能法案》(AI Act)有了里程碑式的进展:欧洲议会以499票赞成、28票反对和93票弃权通过了全部草案。
此次投票为欧洲议会、欧盟成员国和欧盟委员会即将到来的「三方」谈判铺平了道路。该谈判将在2023年6月至12月西班牙担任欧洲理事会轮值主席国期间继续。顺利的话,该法案预计将在今年年底获得最终批准,并最终在24个月后,也就是2026年开始对相关企业产生实际影响。
该法案重点规定了什么?
禁止实时面部识别技术
这是争论的核心议题之一。其实在去年年底,欧盟成员国曾经通过修正案,允许在特殊执法情况下——部分右翼立法者希望将寻找失踪儿童和防止恐怖袭击的情况纳入其中——使用实时面部识别,但这些修正案在此次表决中被否决。
值得注意的是,被禁止的只有实时面部识别技术,非实时(post)的识别技术并没有被禁,这意味着可以对已存档的监控录像做面部识别。此外,法案还规定禁止企业从社交媒体上抓取生物识别数据来建立数据库。
要求披露生成式AI训练数据版权
AI法案不会将ChatGPT等生成式AI判定为高风险,但对这些需要大量数据训练的AI新增了透明度和风险评估要求。该法案要求彻底记录任何用于训练AI的原始内容,包括文本、图像、视频和音乐。OpenAI、Google和微软等公司都被要求申明,训练AI时所使用的材料不存在版权问题。
这对科技公司意味着什么?
初创企业更难参与竞争:AI数据平台Apheris CEO Robin Röhm(罗宾·罗姆)认为,该法案草案通过标志着AI监管取得里程碑式的进步,但提出的问题多于解决的问题。法案提高了训练生成式AI的门槛,初创公司将更难与大公司竞争,投资者也不太乐意将资金投入到在欧盟运营的公司。
企业或将面临巨额罚款:如果技术公司的行为违反《人工智能法案》,极端情况下,该公司全球年收入的6%可能会用于缴纳罚款,对Google和微软等技术公司而言,罚款可能高达数十亿美元。而欧盟在未来10年可能会收获高达1.3万亿美元的巨额罚金。
参考链接
https://www.bloomberg.com/news/articles/2023-06-14/eu-lawmakers-vote-to-ban-remote-face-scanning-in-public?srnd=technology-ai
https://www.artificialintelligence-news.com/2023/06/14/european-parliament-adopts-ai-act-position/
日本东京都政府将从8月开始使用ChatGPT工作
据《日本时报》6月14日报道,东京都知事小池百合子表示,日本东京都政府的所有部门将从8月起接入AI聊天机器人ChatGPT。
用ChatGPT做什么?
目前,东京都政府主要将ChatGPT用于准备问答文件类的工作任务,后续还会就其新用途向员工征求意见。
小池百合子表示,ChatGPT有极大的潜力改变当前公共行政工作开展的方式。全面评估AI正反两方面的影响,有助于优化城市治理。
此外,为解决AI工具可能存在的信息外泄等问题,东京都政府成立了一个项目组测试ChatGPT的效率,并制定使用指南。
这在日本已有先例
今年6月初,在经过1个月的试用之后,日本神奈川县横须贺市政府宣布,正式将ChatGPT用于日常工作。横须贺市是日本第一个使用生成式人工智能工具的地方政府。试用期间,ChatGPT主要被用于制作简报、总结会议记录、检查文档等工作。横须贺市政府称,这款工具有助于全面提高工作效率。
但是,参与测试的员工中有一半人表示,对ChatGPT给出的回答的准确性不满意。此外,横须贺市政府要求员工在使用ChatGPT时不允许输入个人信息。
此外,日本埼玉县户田市也在今年4月成立了研究小组,探索ChatGPT应用于各项公务中的可能性。
日本政府对于生成式AI的态度
相较于欧洲对ChatGPT等工具的强监管态度,日本政府的态度较为开放。日本首相岸田文雄在4月10日与OpenAI首席执行官萨姆·奥特曼(Sam Altman)会晤,双方就人工智能的技术进步和优点,以及隐私和版权问题等风险交换了意见。奥特曼称,考虑在日本开设办公室并扩大业务。
日本内阁官房长官松野博一彼时就表示,如隐私和网络安全问题得到解决,日本将考虑在政府部门引入ChatGPT等人工智能技术,以减少政府工作人员的工作量。
但是,本月初,日本监管机构对OpenAI的信息使用作出限制。6月2日,日本个人信息保护委员会发布公告,提醒OpenAI称,未经使用者允许,ChatGPT不能获取使用者的个人敏感信息,这些信息包括病例、诊断结果、残疾和犯罪记录等信息。
参考链接
https://www.japantimes.co.jp/news/2023/06/14/national/tokyo-metropolitan-government-chat-gpt-use/
Google提出新的AI监管模式,与OpenAI截然相反
针对美国商务部提出的人工智能问责政策征求意见,Google连同DeepMind一起作出了回复。Google方面提出,AI治理需要一种多层次、兼顾多方利益的方法,反对一个集中化的管理机构——Google反对的,正是OpenAI创始人兼CEO萨姆·奥特曼提出的AI监管设想。
Google版本的AI监管设想
Google对于这种多层次、兼顾多方利益的方法有具体阐述,包括三个方面:
行业、民间以及学术专家针对负责任的人工智能开发与分享最佳实践,包括安全和错误信息问题在内的技术标准;
国家监管层面,一套中心化的轮辐模式。Google呼吁美国商务部下属美国国家标准与技术研究院 (NIST) 向各机构发布应对人工智能风险的技术指南;
联盟和伙伴之间的国际协调,包括地缘政治安全、竞争以及监管方法的一致性。
在接受《华盛顿邮报》的采访时,Google全球事务总裁Kent Walker认为,由于AI将影响各个行业,AI行业也需要熟悉各个领域的监管者。因而,相比创建单一机构负责监管的「一刀切」方式,上述监管方式是更好的方案。
Google对监管设想的反面:OpenAI与微软
在5月的国会听证上,OpenAI创始人兼CEO萨姆·奥特曼认为,需要设立新的政府机构负责AI治理,包括管理大型AI模型许可证、减少小型公司和研究人员面对的监管负担、为AI模型创建安全标准。只有在对模型表现的独立审计上,奥特曼认为,需要与独立专家合作。
微软公司同样支持这样的管理设想。5月,微软总裁Brad Smith在公司发布的《AI治理:未来蓝图》中表示,他支持设立一个新的政府机构来监督AI的发展,也赞成建立「安全制动器」来管理那些控制关键基础设施的AI,包括电网、供水系统和城市交通流量。他曾经在2017年的达沃斯世界经济论坛上预测,各国政府将在大约5年内讨论如何监管AI。
参考链接
https://www.washingtonpost.com/documents/51c2e856-1542-4cec-b49a-5dde9c9224ae.pdf?itid=lk_inline_manual_6
https://www.cnbc.com/2023/06/13/google-challenges-openais-calls-for-government-ai-czar.html
https://www.washingtonpost.com/politics/2023/06/13/google-bucks-calls-new-ai-regulator/
https://mp.weixin.qq.com/s/j1ayw2LgQF3eUR747oAkvA
大模型篇
OpenAI大幅更新API,赋予开发者更多权利的同时,与微软的矛盾更尖锐
6月13日,OpenAI大幅更新了其大语言模型的API产品,包括推出新的函数调用功能、支持更长tokens的API,以及降低使用价格等等。API(应用程序接口)是一种软件中介,它允许两个不相关的应用程序相互通信。
具体都有哪些更新?
增加了函数调用功能
开发者现在可以在调用GPT的API时增加一个新参数(函数:Function),通过调用函数可以更精确地控制GPT的回答。举例来说,「天气怎么样」这样的提问会自动转换为适当的函数调用,如「get_current_weather (location: string, unit: 'celsius' | 'fahrenheit')」,而用户可以自定义这个函数的数据来源,例如你可以告诉GPT,被问到天气信息时,可以从「高德天气」那里获取数据,这样就可以避免GPT在没有数据时编造一个答案来回复你。
这个函数调用(function calling)功能其实跟「插件」功能类似,都是让GPT能够连接到模型以外的软件或数据,从而在回答特定问题时给出更准确的答案。区别在于,「之前的插件功能只能在OpenAI的ChatGPT里使用,而函数调用功能更加灵活,开发者甚至可以直接使用自己公司的内部API。」即刻的算法负责人徐昳昶告诉新皮层。
需要注意的是,该功能要通过gpt-3.5-turbo-0613、gpt-4-0613、gpt-4-32k-0613这3个新模型的API来使用。
支持更长tokens的API
OpenAI为最受欢迎的API,也就是gpt-3.5-turbo,提供了拥有更长上下文的版本gpt-3.5-turbo-16k。原来的版本只支持4k长度的tokens,新版本的长度是之前的4倍,意味着它一次可以处理约20页长度的英文文本。
其实OpenAI此前已经开发了支持32k tokens的版本gpt-4-32k,但GPT-4仅对部分资深用户开放,本次更新的16k版本则是对所有用户开放。
多个API降价
OpenAI将最流行的嵌入模型text-embedding-ada-002的价格降低75%,至每1k tokens的价格为0.0001美元。
同时,他们还将最流行的聊天模型gpt-3.5-turbo的tokens输入价格下调25%,每1k tokens的输入价格为0.0015美元。输出价格保持不变,为每1k tokens 0.002美元。
一些API将被弃用
OpenAI表示gpt-3.5-turbo-0301、gpt-4-0314和gpt-4-32k-0314这3个API将于2023年9月13日停止支持。
OpenAI与微软的关系最近出现了裂缝
一直以来,OpenAI与微软的关系都很紧密,OpenAI长期优先向微软云提供独家技术支持,同时也利用微软Azure提供的算力来训练模型。看上去双方各取所需,可谓是天作之合。但近期多家媒体报道称,OpenAI与微软的关系似乎没有看上去那么甜蜜。
The Information于今年3月的文章中指出,两家公司其实存在争抢客户的矛盾。微软Azure的销售人员在拓展客户时,称OpenAI的授权更适合实验项目,而Azure相比之下可以提供更多企业级功能,包括更好的安全和隐私功能。此外OpenAI还延迟向Azure授予新产品的使用权限,包括语音识别模型Whisper等等。
《华尔街日报》在6月13日的文章中称,微软员工抱怨公司与OpenAI合作后开始削减内部的AI研究支出,但同时OpenAI又不允许微软员工接触其技术。此外,一些微软高管对OpenAI去年推出ChatGPT的时机颇有微词。当时微软正尝试将OpenAI的技术集成到其 Bing 搜索引擎中,他们担心ChatGPT会抢走新Bing的风头——事实也确实如此。
从OpenAI CEO萨姆·奥特曼(Sam Altman)最近一系列的活动来看,他与OpenAI并不甘于待在幕后。奥特曼奔走于欧亚各个国家与当地的政要会面,接受各种媒体的访谈,很大一部分是为了树立个人的影响力与OpenAI的品牌。并且从业务角度看,OpenAI走向台前的欲望也很明显:
个人业务方面,对标微软的Bing,OpenAI有ChatGPT;
企业业务方面,OpenAI与客户关系管理服务公司Salesforce合作推出了Einstein GPT;
此次OpenAI的更新赋予了开发者更多的权利,这自然也会导致微软Azure云的吸引力下降。
虽然微软向OpenAI提供了数百亿美元的投资,但作为一家目标是千亿甚至万亿美元的公司,这些投资自然是无法满足OpenAI的野心的。「伟大的平台公司历史上都有一款杀手级应用程序,ChatGPT的愿景是成为超级智能助手,」萨姆·奥特曼这样说道。
参考链接
https://openai.com/blog/function-calling-and-other-api-updates
https://www.wsj.com/articles/microsoft-and-openai-forge-awkward-partnership-as-techs-new-power-couple-3092de51?mod=tech_lead_pos5
智源大会召开,悟道3.0大模型系列发布
6月9日至10日,第五届北京智源大会召开,该峰会由北京智源人工智能研究院承办,全球AI巨头聚集,共同讨论如中文大语言模型安全研究、大语言模型安全与对齐、如何让大模型更可靠等AI领域最热门的话题。与此同时,智源还发布了悟道3.0大模型系列,3.0大模型系列中增加了视觉大模型。
北京智源人工智能研究院是家什么机构?
2018年年初,北京市出台《北京市支持建设世界一流新型研发机构实施办法》。同年,北京为建设怀柔科学城召开了一场研讨会,这场研讨会围绕「如何推动北京人工智能创新工作发展」的6项建议之一,就是建设「北京智源」等人工智能软硬件计算平台。
2018年12月,北京智源人工智能研究院正式成立,由北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建。智源实行理事会领导下的院长负责制,微软亚洲工程院前院长张宏江担任理事长,北京大学信息科学技术学院教授黄铁军担任研究院院长。主要涉及的研究方向包括人工智能的数理基础、人工智能的认知神经基础、机器学习、自然语言处理、智能信息检索与挖掘、智能系统架构与芯片等。
悟道大模型系列发展历程
自2020年智源研究院启动超大规模智能模型「悟道」项目以来,悟道大模型经历了3轮迭代。相较于以前只构建一些电子商务、智能文本服务等领域的示范性应用,智源试图通过提供一系列不同功能不同级别的API来服务从个人开发者到企业、不同需求的客户。不仅如此,一个由开发者和使用者组成的开源社区,也将为模型迭代贡献思路。
以下是悟道大模型的三轮迭代:
悟道1.0版本:2021年3月智源推出面向中文的预训练语言模型「悟道·文源」(侧重中文语义理解)、中文通用图文多模态预训练模型「悟道·文澜」(侧重多模态)、超大规模预训练模型「悟道·文汇」(侧重认知)、超大规模蛋白质序列预测预训练模型「悟道·文溯」(侧重蛋白质预测)。
悟道2.0版本:2021年6月智源发布新版本,参数规模扩大至1.75万亿,是AI模型GPT-3的10倍。此外,悟道官方平台开放了其模型、算法、工具、API和数据,以构建包括底层数据收集处理、模型能力和算法评测、开源开放等在内的大模型技术和算法体系。
悟道3.0版本:2023年6月智源推出涉及语言、视觉、多模态等领域的大模型,包含「悟道・天鹰」(Aquila)语言大模型系列(涵盖Aquila·基础模型、AquilaChat对话模型、AquilaCode生成模型)、FlagEval (天秤)大模型语言评测体系以及「悟道・视界」视觉大模型系列。
百川智能发布70亿参数开源中英文大模型
6月15日,王小川组建的「百川智能」正式推出首个中英文预训练大模型——baichuan-7B,该模型基于Transformer结构、在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。该模型使用的原始数据包括开源的中英文数据和自行抓取的中文互联网数据,以及部分高质量知识性数据。
虽然王小川在采访中自称打榜不是目的,百川智能还是详细放出了该模型在各个基准的跑分成绩,它在C-Eval、AGIEval和Gaokao三个具有影响力的中文评估基准完成了综合评估,且都取得了超出平均水平的成绩。
目前,百川智能宣布将代码开源,可免费商用。北京大学和清华大学已率先使用baichuan-7B模型推进相关研究工作。
参考链接
https://github.com/baichuan-inc/baichuan-7B
新皮层New New Thing
Hello!
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关照人的命运的读者一样,我们希望在这个有史以来不确定性最高的时代,更好地理解快速变化的科技世界,也更好地理解生而为“高级智能”的我们自己。在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的是智能,不只是AI。
请关注我们吧!
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
识别下图二维码,
即可购买《第一财经》杂志2023年6月新一线特刊