查看原文
其他

《2024年人工智能指数报告》- 2.1 2023年AI模型概述

renee创业狗 Renee 创业随笔
2024-10-09

2023年比较重要的15个模型如下:

  • 2023年3月14日,Claude:由Anthropic发布,这是其首个公开发布的大型语言模型(LLM)。Anthropic作为OpenAI的主要竞争对手,设计Claude模型旨在尽可能的有用、诚实和无害。

  • 2023年3月14日,GPT-4:OpenAI推出的GPT-4,在GPT-3的基础上有所改进,是迄今为止最强大的LLM之一,其性能在多项基准测试中超越了人类。

  • 2023年3月23日,Stable Diffusion v2:Stability AI升级版的文本转图像模型,能够生成更高分辨率、质量更优的图像。

  • 2023年4月5日,Segment Anything:由Meta开发,这款AI模型能够通过零样本泛化实现图像中对象的隔离。之前分享过:《【AIGC 学习】Segment Anything- Stable Diffusion web UI 如何用系列10》。

  • 2023年7月18日,Llama 2:Meta更新了其旗舰大型语言模型,发布了开源版本的Llama 2。其较小的变体(7B和13B)在相对的体积下提供了高性能。

  • 2023年8月20日,DALL-E 3:OpenAI推出了其文本到视觉模型DALL-E的改进版,DALL-E 3。之前分享过:《Dall-E 3》。

  • 2023年8月29日,SynthID:由Google和DeepMind共同开发,这一工具用于对AI生成的音乐和图像进行水印标记,其水印即使在图像被修改后仍然可检测。这个挺有意思的,稍后看一下。

  • 2023年9月27日,Mistral 7B:由法国AI公司Mistral推出,这款紧凑的70亿参数模型在性能上超过了Llama 2的13B版本,使其在同等规模的模型中排名首位。

  • 2023年10月27日,Ernie 4.0:百度,这家多国籍中国科技公司推出了Ernie 4.0,这是迄今为止表现最优的中国大型语言模型之一。

  • 2023年11月6日,GPT-4 Turbo:OpenAI发布了升级版大型语言模型GPT-4 Turbo,具有128K的上下文窗口并降低了价格。

  • 2023年11月6日,Whisper v3:OpenAI发布了开源的语音转文本模型Whisper v3,该模型以其更高的准确率和扩展的语言支持而闻名。

  • 2023年11月21日,Claude 2.1:Anthropic推出了最新的大型语言模型Claude 2.1,拥有业界领先的200K上下文窗口,这增强了其处理长篇文学作品等广泛内容的能力。之前分享过:《Google Bard /Anthropic Claude2 / ChatGPT Code Interpreter 最新更新》。

  • 2023年11月22日,Inflection-2:由DeepMind的Mustafa Suleyman创立的新创公司Inflection推出了其第二款大型语言模型Inflection-2,这一发布凸显了LLM领域的竞争加剧。

  • 2023年12月6日,Gemini:Google推出的Gemini成为GPT-4的强劲竞争者,其中一个变体Gemini Ultra在多个基准测试中表现优于GPT-4。之前分享过《Gemini 1.5 - Google 的 LLM最新亮点》。

  • 2023年12月21日,Midjourney v6:Midjourney发布了最新版本的文本到图像模型,通过更直观的提示和优化的图像质量,提升了用户体验。之前分享过《Midjourney V6 体验》。

近年来,人工智能系统在多个任务的执行上相对于人类基准水平取得了显著的进展。这些任务涵盖了九个AI基准测试,例如图像分类、基本阅读理解等。

具体来说,AI在以下几个领域已经超越了人类基准:

  • 2015年,在图像分类领域首次超过人类水平;
  • 2017年,在基本阅读理解任务中取得领先;
  • 2020年,在视觉推理领域实现突破;
  • 2021年,在自然语言推断任务上超越人类。

然而,截至2023年,人工智能在某些任务类别中仍未能超越人类能力,尤其是那些涉及更复杂认知能力的任务,如视觉常识推理高级数学问题解决(竞赛级数学问题)。

我们人类还未被完全超越 🐶。

继续滑动看下一个
Renee 创业随笔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存