查看原文
其他

AI及信息技术应用2023年7月16日简报

搜藏小秘书 哈斯日志 2024-01-02

本周AI研发的突出故事是ChatGLM2、 Claude 2两个模型的版本升级,与此前相比,性能效果都有大幅度提升。另外一个有趣的故事是,蓝振忠博士的西湖心辰的大模型,与其他大模型公司构造线上的虚拟空间,应用大模型形成数字化聊天、陪伴不同,他选择打通TOM这种传统对话实物与人之间的对话,曲径通幽,挺有趣味的路径。

Google的大模型应用,新的入门级场景,也是选择了NotebookLM,与OpenAI生态的MEM一样,搜藏作为阅粒模型应用的入门选择,在过大的想象空间和精细的应用空间中,选择一个能充分发挥技术优势、又不会带来不切实际期待的蔓延的应用场景是挺重要的,但是没有实际场景的嵌入,就不会应用反馈,无法形成有效的迭代反馈。大模型有大想象力,但是清晰具体应用场景和应用价值是个好的切入方式,亦如,这种切入方式会让人有一种,大模型做这个是不是高射炮打蚊子?所以模型服务和应用服务解耦,这还得想当时间来解耦和培育,经纬张颖说的好像也是这个意思。


1,AI应用

清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用

[摘要]ChatGLM2-6B 模型于 6 月 25 日发布,在保留了初代模型对话流畅、部署门槛较低等特性的基础之上,又增加许多新特性:ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度,同时也降低了生成过程中 KV Cache 的显存占用。

Anthropic 发布了最新的大型语言模型 Claude 2

[摘要]根据 Anthropic 的说法,新模型比以前的模型更智能,更擅长考试、编码和解决数学问题。它也更安全,并且不太可能提供有害或不正确的答案。 Claude 2 也有一个更大的上下文窗口。它现在可以容纳 200K 个令牌,相当于大约 150,000 个单词(作为比较,GPT-4 允许最多 8,192 个令牌,某些版本将其扩展到 32,768 个令牌)。换句话说,可以给 Claude 2 一整本书来总结(Anthropic 说最初,上下文窗口将限制为 100k 个 token)。 Anthropic 计划通过 API 向企业提供 Claude 2,为其人工智能产品提供支持。

OpenAI 将在美联社新闻上训练人工智能模型

[摘要]OpenAI 已与美联社 (AP) 达成协议,在未来两年内根据美联社的新闻报道训练其人工智能模型,其中包括美联社档案中可追溯至 1985 年的内容。Open AI 获得AP 文本档案的许可, AP 获得Open AI 的最新技术。

GPT-4参数最新爆料!1.76万亿参数,8个2200亿MoE模型,PyTorch创始人深信不疑

[摘要]George在接受Latent Space的采访时,对GPT4架构的描述着实让人震惊。他的部分原话如下:GPT-4每个head都有2200亿参数,是一个8路的混合模型。所以,混合模型是当你想不出办法的时候才会做的。OpenAI训练了相同模型8次,他们有一些小技巧。他们实际上进行了16次推断。他特别强调,OpenAI做了8个混合专家模型,任何人可以花8倍资金都能训练出来。

谷歌已向部分美国用户开放了其人工智能笔记工具(现称NotebookLM )

[摘要]NotebookLM是谷歌的一款人工智能笔记工具,目前已向部分美国用户开放使用。这款工具旨在帮助用户更高效地记录和管理笔记,以及运用人工智能技术进行文本生成和处理。用户可以使用NotebookLM来创建和编辑笔记,同时利用它的人工智能能力来自动生成文本、提供智能建议和增强笔记的可读性和有效性。这项技术开放给部分用户进行试用,将进一步优化和改进,以满足用户需求。

H2oGPT:大型语言模型的大众化

[摘要]H2oGPT,这是一套开源代码存储库,用于创建和使用基于生成预训练 Transformer (GPT) 的 LLM。该项目的目标是创建世界上最好的真正开源替代闭源方法。作为令人难以置信且势不可挡的开源社区的一部分,我们与令人难以置信的开源社区合作,并作为其一部分,开源了多个经过微调的 h2oGPT 模型,包含 7 至 400 亿个参数,可在完全宽松的 Apache 2.0 许可证下用于商业用途。我们的版本中包含使用自然语言的 100% 私人文档搜索。

「西湖心辰」正式推出自研的通用大模型——西湖大模型

[摘要]西湖大学博导蓝振忠在模型发布会上表示: 构建智商情商俱佳的通用大模型,打造陪伴 10 亿人的 AI。近日,西湖心辰再一次获得了汤姆猫的战略投资,投资金额过亿,双方将加速大模型的应用落地。躬身入局 脱颖而出西湖心辰是国内最早推出一系列 2C 产品的大模型公司,已积累两百多万 C 端用户,服务了上百家 B 端客户,其中不乏汤姆猫、知衣、星巴克、支付宝、知乎、酷家乐等知名企业。

埃隆·马斯克宣布成立新的人工智能公司

[摘要]这家名为 xAI 的公司推出了一个网站和一个由十几名员工组成的团队。据该网站称,新公司将由马斯克领导,“将与 X (Twitter)、特斯拉和其他公司密切合作,在实现我们的使命方面取得进展。”“xAI 的目标是了解宇宙的真实本质”,这呼应了马斯克之前用来描述其人工智能雄心的语言。

华为推出精准AI天气预报

[摘要]华为云研究人员开发了基于人工智能的全球天气算法“盘古天气”,能够比传统方法提供更快、更准确的预报,包括湿度、风速、温度和灾害预警等参数。

AI 可以通过工具箱做什么...代码解释器入门 

[摘要]Code Interpreter 最令人印象深刻的一点是,它以非常人性化的方式对数据进行“推理”。当被问及网络分析的结果时,得出了有趣的结论:英雄通常拥有的一组能力本质上是视觉的(因为它们来自漫画书),适合某些原型,并且最适合构建持续的冒险。将数据和故事集成在一起的巧妙方法!

复旦肖仰华团队推出最全语言模型领域知识评估Benchmark——獬豸:包含了516门学科、13学科门类、240w条数据

[摘要]第一个是作者们为了验证他们的实验设定,以及为了充分评估目前市面上大多数的开源模型,所以把一些最近推出的知识性评估Benchmark也拿来进行了实验,实验结论如下:除此之外,因为Xiezhi数据集覆盖了13个学科领域,除去了“军事”这个比较敏感的领域之外,他们给所有模型在所有学科领域上进行了排名,具体排名如下:观察表2中列出的总体结果,可以发现所有排名前十的开源LLM都是基于llama或bloom之上上的。

Pi:这个比 ChatGPT 情商还高的 AI,我可以和它聊三天三夜

[摘要]Pi 这个名字,是对 personal intelligence(个人智能)的缩写。开发者想从名字就体现,Pi 是一款以用户个人为中心的产品:Pi 优先考虑与人的对话,而其他 AI 则服务于生产力、搜索或回答问题。Pi 的评价标准是对话自不自然、情商够不够高等等。

Meta 计划发布其 AI 模型 LLaMA 的商业开源版本

[摘要]LLaMA是Meta开源的一种机器学习模型,它可以支持文本、图像和代码生成。然而,当它被泄露后,开发人员在此基础上构建商业产品,这违反了Meta的许可规则,因为该模型不应在商业产品中使用。Meta准备发布商业版本的人工智能模型,允许初创企业和企业在其基础上构建定制软件。这将使Meta能够与微软支持的OpenAI和谷歌竞争,这两家公司在开发生成式人工智能方面处于领先地位。

116家国产大模型起名:一场关于道家中医、神话人物的文艺复兴

[摘要]大模型公司的命名策略反映了它们在大模型领域的不同定位。互联网巨头倾向于使用旧词新组和古词新用的命名方式,以建立与用户的情感链接和差异化竞争优势。科研院所倾向于使用道家术语和神话来命名大模型,以突出特定能力和目标。中小型科技公司更倾向于使用GPT+垂类专属名称的方式,以快速传达产品的技术基础和功能特点。地方高校则使用地名命名,以提高地方的认知度。不同的命名方式反映了公司的定位和战略目标,但实际应用和核心竞争力才是大模型发展的关键。

经纬张颖:AI的远与近

[摘要]现在最头部的AI公司比如OpenAI、Character.AI,都是既做模型又做产品,这与移动互联网非常不同,LBS、4G/5G等移动互联网的基础技术,和上层应用比如淘宝、滴滴还是相对分离的。

2,产品市场创新

AI 初创公司 Liner 为三星互联网浏览器添加 GPT 服务

[摘要]韩国人工智能初创公司 Liner 发布了 Liner Copilot,这是三星互联网浏览器的扩展,使用生成式人工智能技术提供交互式搜索服务,突出显示重要内容,总结关键部分页面,解释长句子,并翻译成其他语言。

ChatGPT 的爆炸式增长显示流量自推出以来首次下降

[摘要]据路透社报道,与 5 月份相比,ChatGPT 网站 6 月份的流量下降了 9.7%,独立访客数量相应下降了 5.7%。此次下降标志着 ChatGPT 自 2022 年 11 月推出以来首次出现流量减少。

AI lawyer.pro触手可及的私人人工智能律师

[摘要]AI律师可以轻松提供法律信息和帮助。它还可以帮助简化法律语言并更好地理解复杂的法律问题。

3 ,监管与合规

国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》

[摘要]国家网信办等部门联合发布《生成式人工智能服务管理暂行办法》,旨在促进生成式人工智能的健康发展和规范应用。该《办法》明确了生成式人工智能服务的总体要求和具体措施,包括鼓励创新发展、分类分级监管、数据处理要求、安全评估等。同时,规定了生成式人工智能服务提供者的责任和法律责任。该办法的出台是为了防范生成式人工智能服务的风险,维护国家安全和社会公共利益,保护公民和组织的合法权益。生成式人工智能的发展与治理需要政府、企业、社会和网民等多方参与,共同推动其健康发展,为人民带来更多福祉。此前该草案法规为企业提供了更多的操作空间,规定企业在产品发布后有10个工作日的时间向中国相关部门注册。自8月15日起生效。这些规定要求ChatGPT等人工智能服务必须获得运营许可,进行全面的安全评估,并符合社会主义核心价值观。这些法规适用于向公众提供的服务,为科技巨头提供了明确的框架。

欧盟已批准与美国达成一项新的数据传输协议,允许 Facebook 和谷歌等科技巨头在两个地区之间自由传输数据

[摘要]根据上下文,欧盟已经批准与美国达成一项新的数据传输协议。这意味着科技巨头如Facebook和谷歌将能够在欧盟和美国之间自由传输数据。该协议的批准对于这些科技公司非常重要,因为它们依赖于大量的数据来支持其业务和服务。此前,欧盟和美国之间的数据传输一直存在法律和隐私方面的问题,因此这项新的协议旨在解决这些问题并确保数据的合法传输。该协议的批准也是欧盟和美国之间合作加强的一个例证,对于数字经济和跨境业务来说具有积极影响。

网信办:关于加强“自媒体”管理的通知

[摘要]自媒体”在发布涉及国内外时事、公共政策、社会事件等相关信息时,网站平台应当要求其准确标注信息来源,发布时在显著位置展示。

Keep低调上市,中国互联网公司IPO的窗口打开了吗?

[摘要]Keep在港交所进行了一次低调的上市,成为近两年来中国互联网公司在IPO方面表现最好的一次。与其他公司相比,Keep的股价稳定,上市三天后基本没有破发。虽然募资金额不大,但其表现仍然被认为是不错的。然而,许多其他公司仍在等待IPO的窗口期,希望能够获得更高的募资金额。尽管投资人渴望退出,但流动性问题仍然存在,市场上资金流入仍未恢复。

“分享每周阅读的有价值的资讯,重点关注人工智能技术应用案例、AI产品化、信息技术、推荐、搜索、社交媒体,电商交易、新技术(区块链、加密货币等...)的技术伦理和体验创新。”该简报使用阅粒搜藏(yueli.com)+chatGPT生成。“

AI及信息技术应用2023年7月9日简报

AI及信息技术应用2023年7月3日简报

AI及信息技术应用2023年6月26日简报

AI及信息技术应用2023年6月19日简报


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存