查看原文
其他

【AI周刊】本周重要AI产品和AI资讯概览(05.15-05.21)

GenAI Gen AI Hub 2023-05-25

 #AI周刊 栏目由Gen AI Hub运营,每周一凌晨更新,主要回顾上周AI领域发布的一些重要产品和业内值得关注的大事以及重大研究成果或论文等。




本周重要产品


🤯OpenAI推出IOS平台ChatGPT应用程序

OpenAI 本周官宣推出 IOS平台的 ChatGPT APP。并表示,App首先在美国推出,未来几周内还将扩展到其他国家和地区,也会很快会推出安卓版本。



ChatGPT 应用界面简洁,对话体验流畅,功能与网页版一致,普通用户只能够使用GPT-3.5,Plus用户可使用GPT-4,但是不支持插件和联网功能。



此外,APP还支持了语音输入,能够跨设备同步记录。最重要的,Plus可以直接通过App Store 进行订阅开通,这大大降低了国内用户开通Plus的门槛。


国内苹果手机用户可以直接登陆美区App Store进行下载注册,并通过支付宝买礼品卡进行支付开通Plus会员。


🔗 IOS下载地址:https://apps.apple.com/app/openai-chatgpt/id6448311069

🤯ChatGPT插件和联网功能本周正式向所有Plus用户开放


OpenAI本周向所有ChatGPT Plus用户开放了ChatGPT的网络浏览和插件功能。


Plus用户可直接使用联网功能或许最新的数据信息,并利用超过70个(截止21日插件已经更新到了126个)第三方插件进行各种操作。ChatGPT正在往一个平台生态的方向发展。



ChatGPT 的首批插件由 OpenTable、KAYAK、FiscalNote、Expedia、Zapier 等提供,涵盖了文档处理、在线搜索、娱乐生活、财务投资、房地产、招聘工作、旅游出差等领域。


目前使用插件首先需要打开插件开关按钮,然后在插件商城中下载要使用的插件,最后勾选使用的插件,并且一个对话页面最多只能同时勾选3个插件。不过插件生态系统尚属于测试阶段,整体上手体验起来,生成速度会比较慢,生成效果也不佳,而且可实用能够解决真实痛点的案例较少。


🔗 Plugin汇总地址:https://www.chatplugin.top/


🤯Stability AI开源图像生成模型平台StableStudio


Stability AI 本周发布了 DreamStudio 的开源版本 ——StableStudio。

Stability AI 表示,StableStudio 的目标是进行更广泛的社区合作,为生成式 AI 打造一个世界级的用户界面,让用户能够充分使用。



与DreamStudio相比,StableStudio删除了 DreamStudio 专属品牌;所有在线 API 调用都已被插件系统取代,用户可以轻松更换后端;删除了专属于 Stability 的帐户功能,例如计费、API 密钥管理等。而且还将和 StableVicuna 结合,推出聊天界面。


除此之外,StableStudio 未来还会更新以下功能:

  • 通过 WebGPU 进行局部推理

  • 通过 stable-diffusion-webui 进行局部推理

  • 支持桌面安装

  • 支持ControlNet 工具


🔗 项目地址:github.com/Stability-AI/StableStudio


🤯交互式AI绘图工具DragGAN爆火,有望颠覆PS

DragGAN 是一种控制 GAN 的新方法。它允许用户以交互方式将任意图像点“拖动”到目标位置,从而实现对生成对象的姿势、形状、表情和布局的精确控制。



具体而言,用户只需要用户只需要设置几个控制点(红点)和目标点(蓝点),以及圈出将要移动的区域(比如狗转头,就圈狗头)。背后的 GAN(生成对抗网络)会计算并展现调整效果。从demo效果来看,计算后得到的效果非常真实。


现在的demo可以调整对象的形状、位置、尺寸、角度,甚至可以调整人的微表情。对象适用范围也比较广泛,可以处理人类、动物、汽车、风景等不同类型的图片。


🔗 项目地址:https://arxiv.org/abs/2305.10973

🔗 论文地址:vcai.mpi-inf.mpg.de/projects/DragGAN


🤯Poe正式向开发者推出 Poe API


poe官方宣布向开发者提供API接口,基于新的Poe API,开发者可以在Poe上构建Chatbot,实现个性化和更复杂的功能。



定制自己的Chatbot非常简单。Poe提供了一个简单的协议来与机器人通信,该协议通过HTTP运行,并提供了示例代码以帮助你开始使用。此外,该平台还集成了与Langchain和LlamaIndex的能力。


在Poe上构建AI应用的好处包括向数百万用户分发,跨平台支持,并提供持久的历史记录和跨平台同步。


🔗 开发文档:github.com/poe-platform/api-bot-tutorial



本周重要资讯


📢OpenAI CEO Sam Altman出席美国国会听证,呼吁加强AI监管


OpenAI首席执行官Sam Altman首次赴国会听证,呼吁政府为AI系统制定安全标准。他强调了政府干预的重要性,并提出了三点方案:


1、成立一个新的部门,负责为AI大模型颁发许可,并拥有撤销许可的权力。

2、制定一套安全标准,对AI模型的危险性进行评估,包括它们是否具有“自我复制”和“逃脱实验室并行动”的能力。

3、要求独立专家对模型的各种指标进行独立审计。



除此之外,Altman表示,GPT-4是一种工具,而不是一种生物,可以被人类很好地控制。他还承认,AI可能会对部分人的就业造成影响,但同时也会带来更多的好处。


🔗 新闻详情:www.washingtonpost.com/technology/2023/05/16/ai-congressional-hearing-chatgpt-sam-altman/


📢谷歌&普林斯顿大学发布新的大语言推理框架:思维树(ToT)

Google本周发布了一篇值得关注的AI论文,在这篇论文中,Google DeepM与普林斯顿大学研究人员提出了一种全新的语言模型推理框架:思维树(Tree of Thoughts, ToT)。

ToT将当前流行的「思维链」方法泛化到引导语言模型,并通过探索文本(思维)的连贯单元来解决问题的中间步骤。

简单来说,「思维树」可以让LLM:

  • 自己给出多条不同的推理路径

  • 分别进行评估后,决定下一步的行动方案

  • 在必要时向前或向后追溯,以便实现进行全局的决策

论文实验结果显示,ToT显著提高了语言模型在需要规划或搜索的问题解决能力:例如24点游戏、创意写作和填字游戏。

比如,在24点游戏中,GPT-4只解决了4%的任务,但ToT成功率达到了74%。

🔗 论文地址:https://arxiv.org/abs/2305.10601


📢大模型能力排行榜单


随着越来越多大型语言模型的出现,需要对它们进行客观的评估。目前有三个榜单正在进行评分,供人们进行交叉比较。分别如下:

  • LMSYS ChatBot Arena:主要对市面上最主流的几个LLM进行评分比

  • HuggingFace Open LLM:主要针对开源LLM的比较

  • SuperClue:主要针对LLM的中文能力进行比较

上述三个榜单的评测结果如下:

1、LMSYS组织发布的大模型能力排行,可以看到GPT-4仅以微弱的优势领先Claude。

2、从开源的模型的得分来看,Llama系列依然是最好的。Vicuna虽然参数少,但是排得也很靠前。

3、最懂中文的Top3模型仍然是海外的大模型GPT4、GPT3.5和Claude,国内大模型中表现最好的是讯飞星火大模型。

🔗 msys.org/blog/2023-05-10-leaderboard

🔗 huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

🔗 github.com/CLUEbenchmark/SuperCLUE


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存