AI及信息技术应用2023年7月16日简报

Original 搜藏小秘书哈斯日志 2024-01-02

本周AI研发的突出故事是ChatGLM2、 Claude 2两个模型的版本升级，与此前相比，性能效果都有大幅度提升。另外一个有趣的故事是，蓝振忠博士的西湖心辰的大模型，与其他大模型公司构造线上的虚拟空间，应用大模型形成数字化聊天、陪伴不同，他选择打通TOM这种传统对话实物与人之间的对话，曲径通幽，挺有趣味的路径。

Google的大模型应用，新的入门级场景，也是选择了NotebookLM，与OpenAI生态的MEM一样，搜藏作为阅粒模型应用的入门选择，在过大的想象空间和精细的应用空间中，选择一个能充分发挥技术优势、又不会带来不切实际期待的蔓延的应用场景是挺重要的，但是没有实际场景的嵌入，就不会应用反馈，无法形成有效的迭代反馈。大模型有大想象力，但是清晰具体应用场景和应用价值是个好的切入方式，亦如，这种切入方式会让人有一种，大模型做这个是不是高射炮打蚊子？所以模型服务和应用服务解耦，这还得想当时间来解耦和培育，经纬张颖说的好像也是这个意思。

1，AI应用

清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用

[摘要]ChatGLM2-6B 模型于 6 月 25 日发布，在保留了初代模型对话流畅、部署门槛较低等特性的基础之上，又增加许多新特性：ChatGLM2-6B 使用了 Multi-Query Attention，提高了生成速度，同时也降低了生成过程中 KV Cache 的显存占用。

Anthropic 发布了最新的大型语言模型 Claude 2

[摘要]根据 Anthropic 的说法，新模型比以前的模型更智能，更擅长考试、编码和解决数学问题。它也更安全，并且不太可能提供有害或不正确的答案。 Claude 2 也有一个更大的上下文窗口。它现在可以容纳 200K 个令牌，相当于大约 150,000 个单词（作为比较，GPT-4 允许最多 8,192 个令牌，某些版本将其扩展到 32,768 个令牌）。换句话说，可以给 Claude 2 一整本书来总结（Anthropic 说最初，上下文窗口将限制为 100k 个 token）。 Anthropic 计划通过 API 向企业提供 Claude 2，为其人工智能产品提供支持。

OpenAI 将在美联社新闻上训练人工智能模型

[摘要]OpenAI 已与美联社 (AP) 达成协议，在未来两年内根据美联社的新闻报道训练其人工智能模型，其中包括美联社档案中可追溯至 1985 年的内容。Open AI 获得AP 文本档案的许可， AP 获得Open AI 的最新技术。

GPT-4参数最新爆料！1.76万亿参数，8个2200亿MoE模型，PyTorch创始人深信不疑

[摘要]George在接受Latent Space的采访时，对GPT4架构的描述着实让人震惊。他的部分原话如下：GPT-4每个head都有2200亿参数，是一个8路的混合模型。所以，混合模型是当你想不出办法的时候才会做的。OpenAI训练了相同模型8次，他们有一些小技巧。他们实际上进行了16次推断。他特别强调，OpenAI做了8个混合专家模型，任何人可以花8倍资金都能训练出来。

谷歌已向部分美国用户开放了其人工智能笔记工具（现称NotebookLM ）

[摘要]NotebookLM是谷歌的一款人工智能笔记工具，目前已向部分美国用户开放使用。这款工具旨在帮助用户更高效地记录和管理笔记，以及运用人工智能技术进行文本生成和处理。用户可以使用NotebookLM来创建和编辑笔记，同时利用它的人工智能能力来自动生成文本、提供智能建议和增强笔记的可读性和有效性。这项技术开放给部分用户进行试用，将进一步优化和改进，以满足用户需求。

H2oGPT：大型语言模型的大众化

[摘要]H2oGPT，这是一套开源代码存储库，用于创建和使用基于生成预训练 Transformer (GPT) 的 LLM。该项目的目标是创建世界上最好的真正开源替代闭源方法。作为令人难以置信且势不可挡的开源社区的一部分，我们与令人难以置信的开源社区合作，并作为其一部分，开源了多个经过微调的 h2oGPT 模型，包含 7 至 400 亿个参数，可在完全宽松的 Apache 2.0 许可证下用于商业用途。我们的版本中包含使用自然语言的 100% 私人文档搜索。

「西湖心辰」正式推出自研的通用大模型——西湖大模型

[摘要]西湖大学博导蓝振忠在模型发布会上表示：构建智商情商俱佳的通用大模型，打造陪伴 10 亿人的 AI。近日，西湖心辰再一次获得了汤姆猫的战略投资，投资金额过亿，双方将加速大模型的应用落地。躬身入局脱颖而出西湖心辰是国内最早推出一系列 2C 产品的大模型公司，已积累两百多万 C 端用户，服务了上百家 B 端客户，其中不乏汤姆猫、知衣、星巴克、支付宝、知乎、酷家乐等知名企业。

埃隆·马斯克宣布成立新的人工智能公司

[摘要]这家名为 xAI 的公司推出了一个网站和一个由十几名员工组成的团队。据该网站称，新公司将由马斯克领导，“将与 X (Twitter)、特斯拉和其他公司密切合作，在实现我们的使命方面取得进展。”“xAI 的目标是了解宇宙的真实本质”，这呼应了马斯克之前用来描述其人工智能雄心的语言。

华为推出精准AI天气预报

[摘要]华为云研究人员开发了基于人工智能的全球天气算法“盘古天气”，能够比传统方法提供更快、更准确的预报，包括湿度、风速、温度和灾害预警等参数。

AI 可以通过工具箱做什么...代码解释器入门

[摘要]Code Interpreter 最令人印象深刻的一点是，它以非常人性化的方式对数据进行“推理”。当被问及网络分析的结果时，得出了有趣的结论：英雄通常拥有的一组能力本质上是视觉的（因为它们来自漫画书），适合某些原型，并且最适合构建持续的冒险。将数据和故事集成在一起的巧妙方法！

复旦肖仰华团队推出最全语言模型领域知识评估Benchmark——獬豸：包含了516门学科、13学科门类、240w条数据

[摘要]第一个是作者们为了验证他们的实验设定，以及为了充分评估目前市面上大多数的开源模型，所以把一些最近推出的知识性评估Benchmark也拿来进行了实验，实验结论如下：除此之外，因为Xiezhi数据集覆盖了13个学科领域，除去了“军事”这个比较敏感的领域之外，他们给所有模型在所有学科领域上进行了排名，具体排名如下：观察表2中列出的总体结果，可以发现所有排名前十的开源LLM都是基于llama或bloom之上上的。

Pi:这个比 ChatGPT 情商还高的 AI，我可以和它聊三天三夜

[摘要]Pi 这个名字，是对 personal intelligence（个人智能）的缩写。开发者想从名字就体现，Pi 是一款以用户个人为中心的产品：Pi 优先考虑与人的对话，而其他 AI 则服务于生产力、搜索或回答问题。Pi 的评价标准是对话自不自然、情商够不够高等等。

Meta 计划发布其 AI 模型 LLaMA 的商业开源版本

[摘要]LLaMA是Meta开源的一种机器学习模型，它可以支持文本、图像和代码生成。然而，当它被泄露后，开发人员在此基础上构建商业产品，这违反了Meta的许可规则，因为该模型不应在商业产品中使用。Meta准备发布商业版本的人工智能模型，允许初创企业和企业在其基础上构建定制软件。这将使Meta能够与微软支持的OpenAI和谷歌竞争，这两家公司在开发生成式人工智能方面处于领先地位。

116家国产大模型起名：一场关于道家中医、神话人物的文艺复兴

[摘要]大模型公司的命名策略反映了它们在大模型领域的不同定位。互联网巨头倾向于使用旧词新组和古词新用的命名方式，以建立与用户的情感链接和差异化竞争优势。科研院所倾向于使用道家术语和神话来命名大模型，以突出特定能力和目标。中小型科技公司更倾向于使用GPT+垂类专属名称的方式，以快速传达产品的技术基础和功能特点。地方高校则使用地名命名，以提高地方的认知度。不同的命名方式反映了公司的定位和战略目标，但实际应用和核心竞争力才是大模型发展的关键。

经纬张颖：AI的远与近

[摘要]现在最头部的AI公司比如OpenAI、Character.AI，都是既做模型又做产品，这与移动互联网非常不同，LBS、4G/5G等移动互联网的基础技术，和上层应用比如淘宝、滴滴还是相对分离的。

2，产品市场创新

AI 初创公司 Liner 为三星互联网浏览器添加 GPT 服务

[摘要]韩国人工智能初创公司 Liner 发布了 Liner Copilot，这是三星互联网浏览器的扩展，使用生成式人工智能技术提供交互式搜索服务，突出显示重要内容，总结关键部分页面，解释长句子，并翻译成其他语言。

ChatGPT 的爆炸式增长显示流量自推出以来首次下降

[摘要]据路透社报道，与 5 月份相比，ChatGPT 网站 6 月份的流量下降了 9.7%，独立访客数量相应下降了 5.7%。此次下降标志着 ChatGPT 自 2022 年 11 月推出以来首次出现流量减少。

AI lawyer.pro触手可及的私人人工智能律师

[摘要]AI律师可以轻松提供法律信息和帮助。它还可以帮助简化法律语言并更好地理解复杂的法律问题。

3 ，监管与合规

国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》

[摘要]国家网信办等部门联合发布《生成式人工智能服务管理暂行办法》，旨在促进生成式人工智能的健康发展和规范应用。该《办法》明确了生成式人工智能服务的总体要求和具体措施，包括鼓励创新发展、分类分级监管、数据处理要求、安全评估等。同时，规定了生成式人工智能服务提供者的责任和法律责任。该办法的出台是为了防范生成式人工智能服务的风险，维护国家安全和社会公共利益，保护公民和组织的合法权益。生成式人工智能的发展与治理需要政府、企业、社会和网民等多方参与，共同推动其健康发展，为人民带来更多福祉。此前该草案法规为企业提供了更多的操作空间，规定企业在产品发布后有10个工作日的时间向中国相关部门注册。自8月15日起生效。这些规定要求ChatGPT等人工智能服务必须获得运营许可，进行全面的安全评估，并符合社会主义核心价值观。这些法规适用于向公众提供的服务，为科技巨头提供了明确的框架。

欧盟已批准与美国达成一项新的数据传输协议，允许 Facebook 和谷歌等科技巨头在两个地区之间自由传输数据

[摘要]根据上下文，欧盟已经批准与美国达成一项新的数据传输协议。这意味着科技巨头如Facebook和谷歌将能够在欧盟和美国之间自由传输数据。该协议的批准对于这些科技公司非常重要，因为它们依赖于大量的数据来支持其业务和服务。此前，欧盟和美国之间的数据传输一直存在法律和隐私方面的问题，因此这项新的协议旨在解决这些问题并确保数据的合法传输。该协议的批准也是欧盟和美国之间合作加强的一个例证，对于数字经济和跨境业务来说具有积极影响。

网信办：关于加强“自媒体”管理的通知

[摘要]自媒体”在发布涉及国内外时事、公共政策、社会事件等相关信息时，网站平台应当要求其准确标注信息来源，发布时在显著位置展示。

Keep低调上市，中国互联网公司IPO的窗口打开了吗？

[摘要]Keep在港交所进行了一次低调的上市，成为近两年来中国互联网公司在IPO方面表现最好的一次。与其他公司相比，Keep的股价稳定，上市三天后基本没有破发。虽然募资金额不大，但其表现仍然被认为是不错的。然而，许多其他公司仍在等待IPO的窗口期，希望能够获得更高的募资金额。尽管投资人渴望退出，但流动性问题仍然存在，市场上资金流入仍未恢复。

“分享每周阅读的有价值的资讯，重点关注人工智能技术应用案例、AI产品化、信息技术、推荐、搜索、社交媒体，电商交易、新技术（区块链、加密货币等...）的技术伦理和体验创新。”该简报使用阅粒搜藏（yueli.com）+chatGPT生成。“

AI及信息技术应用2023年7月9日简报

AI及信息技术应用2023年7月3日简报

AI及信息技术应用2023年6月26日简报

AI及信息技术应用2023年6月19日简报

继续滑动看下一个

反向激励，在加速这个社会的黑化

指向自身的觉醒，只会导向新的困境

清华大学的113周年校庆：都这么创新了吗？

刚刚，司法部原副部长，在公安部工作过28年的省公安厅原厅长被查

观察｜实验室被强行关闭，病毒学家在门口过夜？

AI及信息技术应用2023年7月16日简报

您可能也对以下帖子感兴趣

反向激励，在加速这个社会的黑化

指向自身的觉醒，只会导向新的困境

清华大学的113周年校庆：都这么创新了吗？

刚刚，司法部原副部长，在公安部工作过28年的省公安厅原厅长被查

观察｜实验室被强行关闭，病毒学家在门口过夜？

生成图片，分享到微信朋友圈

AI及信息技术应用2023年7月16日简报

您可能也对以下帖子感兴趣