查看原文
其他

GPT-4 发布后的 20 个小时

Founder Park Founder Park 2023-03-21

「活着,在此时此刻,是历史上最好的时刻。

OpenAI 的推文下,有人感叹幸运。

北京时间 2022 年 3 月 15 日凌晨 1 时,OpenAI 发布 GPT-4。

更新、功能、应用,和它好像炫耀的考试成绩,我想你们都知道了。这里不再赘述,还没补课的可以看 Founder Park 今晚推文的次条。

「我不关心它是不是 AGI,GPT-4 就是超越想象的革命性技术。」一位开发者兴奋地分享自己不到 60 秒做出的游戏,「一切都将改变」。

这句话我们听过很多次,但似乎是挺久以前了。像是,10 年前?

这是来自 Founder Park 团队的一条简单的推文,仅仅分享过去 20 小时里,我们看到的 Post GPT-4 的世界。

3 月 16 日(周四)晚 8 点 30 分,Founder Park 会在视频号直播间聊一聊 GPT-4 将会带来的改变,解读一些当下已经非常热门的 LLM 产品,我们邀请你一同探讨。


媒体

科技媒体更乐观,

大众媒体却更悲观

麻省理工科技评论:OpenAI 越来越商业了

MIT 认为 GPT-4 可能是迄今为止最好的多模态大语言模型,但是随着大模型行业的竞争者越来越多,OpenAI 更多把这个版本当做了一个产品的更新,而不是一个研究更新。比如微软、Stripe、冰岛政府等已经使用了 GPT-4,其他公司还在苦苦排队中。

但是 GPT-4 到底有多大,为什么会更好,OpenAI 却没有说。GPT-4 可能是该公司有史以来最神秘的版本,也标志着它从非营利性研究机构向盈利性技术公司的全面转型。

TechCrunch:GPT-4 为视力障碍者提供了新的希望

在详细介绍了 GPT-4 的技术参数后,关注科技创业的媒体 TechCrunch 对于 GPT-4 的图片识别功能比较关注,单独介绍了这项功能和 Be My Eyes 这款应用。

  • 我们的城市对于视力障碍者非常不友好,GPT-4 的这项功能很实用。

  • 对于 Be My Eyes 来说,人类志愿者仍然是有用的,他们无法被取代,只是一些简单的识别可以让 AI 来做了。


  • AI 的进步被迅速应用于帮助到人们的工作中,这是让人振奋的。


Wired:GPT-4 仍有缺陷,但离真正可用越来越近了

科技媒体 Wired 对于 GPT-4 的发布似乎更为冷静一些,他们认为 GPt-4 让 ChatGPT 更加智能,但是也没有修复一直以来的缺陷:事实性错误以及瞎编乱造、明显的社会偏见、以及在某些提示下行为不端或者扮演了令人不安的角色。

不过 Wired 采访的多位专家对此的态度会更乐观一些:

  • 虽然 GPT-4 还没达到真正的可靠性,但已经非常接近了。
  • GPT-4 的到来对于科技行业来说是个令人振奋的时刻。
  • 无论现在的 ChatGPT 多么优秀,它仍然只是个 Chatbot,还有很多事是暂时没法做到的。

也就是说,人类暂时还是 safe!

The Verge:Bing 其实早就在偷偷运行 GPT-4

The Verge 除了标准的 GPT-4 报道,还发布一篇文章《Bing 的 AI bot 一直在偷偷运行 GPT-4》。

文章提到,过去 6 周里,使用预览版 Bing 的用户应该已经体验到 GPT-4 的强大功能。

新 Bing 放宽了使用限制,单轮对话 15 回合,每天最高 150 回合。微软必应的 CVP 也发推确认了 Bing 使用的普罗米修斯模型(Prometheus)就是 OpenAI 今天发布的 GPT-4。

纽约时报:AGI 成为创业新热点,虽然 GPT-4 仍然不成熟

纽约时报的记者在体验新发布的 GPT-4 之后,从几个不同的角度对其进行了汇总,有优点,也有缺点。

  • GTP-4 的输出更加精确了:如果让 GPT-4 提供一个学习西班牙语的教学大纲,答案相比 GPT-3.5 更加精准和实用,对于很多语言学习类 app 或者想通过 GPT 自学的人来说,这是个好消息。

  • 准确性提高了,但仍然会犯错。官方发布会上虽然强调 GPT-4 的准确性提高了,但是要注意,它仍然会「一本正经的胡说八道」,如果想让 GPT 作为你的 wiki,现阶段还做不到。

  • 可以识别图片了!比如你拍一张冰箱内部的照片,GPT-4 会给你一份菜谱,告诉你能做什么菜。不好的消息,这部分的 api 暂时没有公开,目前只有发布会上公布的应用 Be My Eye 使用了这一服务。

  • 不太善于畅想未来发生的事情,即使推理能力提升了,但是它更擅长总结别人说过的话,而不是原创。

  • 仍然喜欢瞎编,可能因为它不知道什么是真,什么是假。如果你问它关于癌症研究的网站,结果里会有不少不存在的网站。

纽约时报:「资本热潮来袭!」

与此同时,纽约时报在今天发布的另外一篇文章《『Let 1,000 Flowers Bloom』: A.I. Funding Frenzy Escalates》(百花齐放:人工智能热潮升级),文章中提到:过去的几个月,AGI 领域的创业已经朝向狂热的方向发展,投资人们盯向了 Google、Meta 和 OpenAI 公司的专家们,很多初创公司估值飙升。

Salesforce 风险投资的负责人 John Somorjai 认为,这是少有的技术革命的机会,这些公司可能是软件领域下一个万亿美元的机会。

Slow Ventures 的风险投资人 Sam Lessin 却有些悲观,他认为 AGI 的技术不会给创业公司真正的机会,绝大多数的战利品仍将落入目前这些巨头的手中。

大西洋月刊:OpenAI 变了,AI 造假的危害正在扩大

大西洋月刊(The Atlantic)关于 GPT-4 的文章中,认为 OpenAI 似乎正离这家公司最初的价值观越来越远,而且将这种转变视为一种妥协。

  • 随着投资回报政策的调整,GPT-4 的代码也更加保密,尽管该公司表示不透明可以防止被恶意利用,但是批评者认为保密会使得公众很难对技术错误和有害输出进行问责。

  • AI 的歧视问题一直没有得到解决,GPT-2 显示出对女性、同性恋者和其他人口群体的偏见;GPT-3 说过种族主义和性别歧视的话;ChatGPT 也被指控发表过类似的有毒言论。OpenAI 试图解决这个问题,但每次都失败了。就目前来看,这次也没能解决。

针对 AI 被使用来制造偏见和虚假新闻的问题,大西洋月刊在今日还发表了另外一篇文章对此进行了讨论。
  • 右翼人士似乎正在利用 AI 大规模产出有利于他们的,可以用来宣传意识形态的内容。科幻杂志 Clarkesworld 因为接收到太多的 AI 稿件而在 2 月份被迫停止手稿。

  • 在 AI 技术越来越进步的当下,AI 可能已经被利用来大量生产虚假新闻了。文章给出了三个可能的解决办法:AGI 生产的内容打水印、惩治虚假内容生产商、以及设计一种可以检测虚假信息和错误信息的 AI。看起来都很难,但或许也能产生新的创业赛道。

The Verge:你们是不是不知道我有多忙?

The Verge 今天还发布了一篇文章《Bing、Bard 和 ChatGPT:AI 聊天机器人正在重塑互联网》。

文章提出,各大公司都在尝试让大众更容易地使用过去仅存在实验室里的技术。LLM 用「一系列自动补全的程序学习语言」,这也导致它们没有硬编码的事实数据库,用看似合理自以为事实的方式产出内容。

然后话锋一转,文章主体部分陈列了以 The Verge 自家报道为主,近期大模型 AI 值得关注的文章和消息。

从 2 月开始算,有 102 条。


官方动态

OpenAI 在感谢员工,

微软在自夸

OpenAI:感谢 GPT-4 的幕后团队

GPT-4 幕后团队包括预训练、长文本、联想、强化学习、评估与分析以及统筹,涉及包括超级计算、infra、模型分发、数据、API 评估等上百个岗位的工作人员。每个团队的核心贡献者包括 Jakub Pachocki,Łukasz Kaiser,Christine McLeavey,John Schulman,Alvin Wang 等。

微软:不愧是我

微软官方发布文章《微软对 Azure 的押注如何开启了人工智能革命》。

文章开头提到 OpenAI 在约 5 年前向微软提出建立一个「将永久改变人与计算机交互方式的人工智能系统」。微软意识到这种技术实现的可能,也清楚它需要怎样的超算基础设施,怎样大规模的超算基础设施。

「这意味着你不仅要有最大的基建,还要能够可靠地运行很长一段时间。」Azure 高性能计算和人工智能产品负责人说。

微软为此搭建了规模前所未有的 AI 训练用计算集群。几年后,这一规模的计算集群成为了微软向其他客户提供服务的标准水平。

文章主要针对大规模 AI 训练、全球化 GPU 部署等方面解读 Azure 为 AI 作出的布局,感兴趣的读者可以自行去微软官方博客阅读。


吃瓜群众

有人期待 GPT-4,

有人担心被取代

Reddit 的讨论:网友们很期待

  • GPT-4 似乎比人类更懂笑话:一则关于「Where do animals go when their tails fall off?」的笑话,GPT-4 成功解释出了笑点,网友的反应是:I didn't understand the joke until the AI explained it to me...Fuck.

  • 大家对于 GPT-4 单次对话的文本升级到 25,000 个单次表示欢迎,虽然一次请求需要 2 美元,但是比花钱定制文章便宜多了!

  • 对于越来越商业化的 OpenAI,网友们似乎更宽容一些,甚至认为有些时候「商业资本主义可能是支持创新的唯一途径」。

四个小时,GPT-4 的政治倾向就暴露了

发布 4 小时后,有人验证了 GPT-4 的政治倾向——通过强制让它单选是否同意某个观点,发现 GPT-4 中立的外表下其实又挺讲究政治正确。

比如当你问它:有些人根本不应该生育,你同意吗?

GPT-4 会答:非常不同意。

轻微存在主义危机

GPT-4 发布后,有人焦虑地在 HN 上发帖:AI 加速的当下,我们怎么办?

「我们很难不感受到轻微的存在危机,就算 AI 能做所有人会做的事,而且还能做得更好,那又有什么意义呢?」

评论区的观点如下:

  • 我小时候学校还组织核弹爆炸演习来着。别天天想这么多没用的。——from 一个 62 岁的老头

  • 末日恐惧吗???无论是单个个体还是从整个社会层面,都没啥办法(尤其西方国家这种没有集体意识的社会

  • 禁欲 maybe??不吃不喝?



从业者

AGI 时代来临了,

却更贵了,

也更封闭了

科技创业者:真正的 AGI 时代已经到来

Substack 创作者,同时也是斯坦福大学客座讲师、科技创业者的 Howie Xu,认为随着 GPT-4 的发布,真正的 AGI(artificial general intelligence,通用人工智能)时代已经到来,2023 年 3 月 14 日的 π 日,将成为人工智能到达 AGI 的纪念日。

他的理由如下,并且用这些理由说服了他的五位硅谷 CEO 朋友。

  1. GPT-4 的能力足够强大:GPT-4 可以理解图片,甚至可以直接根据图片的内容生成网站了,还能梳理税务需求等。

  2. GPT-4 在许多专业学术考上达到甚至超越了需要人类的水平,这符合 OpenAI CEO Sam Altman 对于 AGI 的定义:学习弄清楚事情的技能,并且具有普通人做决策的能力。事实上,Howie Xu 甚至询问了 GPT-4 关于最近倒闭的 SVB(硅谷银行)的决策,GPT-4 做出了正确的决策。

  3. AGI 不意味着完美,因为人类的中位数也不完美:人类中的大多数做判断的时候都基于自己的偏见和认知,甚至连 Meta、谷歌和亚马逊这样的公司也是这样的,更客观基于(手中的)事实来判断的 AI 明显更胜一筹。

  4. 人工智能一直在学习,而且比人类还快。

所以承认吧,AGI 时代已经到来了!

信息太少引发质疑

Hacker News 上有人发帖称 OpenAI 公布的信息逐年减少。

自从 2019 年由非营利性机构切换至「有上限的盈利机构」,GPT-2 采用了分阶段推出,GPT-3 没有公布参数权重,GPT-4 没有参数的细节、架构、研究细节。这一变化会对行业带来消极影响。

评论区就「垄断」、「不作恶」、「开放」、「消费者意识」、「工程师心态」吵作一团。

太阳底下无新事。

算账:GPT-4 要比 ChatGPT 贵很多

创业者 Ivan Campos 在 Medium 发表文章《GPT-4 API 价格分析》。

现阶段,要么选择排队等 API,要么付 20 美元月费用通过 ChatGPT Plus 使用 GPT-4,目前每 4 小时最多可以接收 100 条消息。

但与之对比的,GPT-4 的 API,20 美元可以处理 44 万 token,约 33 万个单词。

但是对开发者而言,GPT-4 会比 ChatGPT API 贵很多,用于 prompt 的贵 14 倍,用于 completion 的 API 贵 29 倍。

这样的价格差距,就是开发者需要考虑的问题,数倍的成本是否会带来匹配的收益。

作者认为,核心考虑的要素包括:应用场景、精确度需求、道德考虑、财务能力、适应未来发展的能力等。


开发者们

有人已经下场做应用了

当大家热火朝天地讨论、分析、批判时,开发者们拿 GPT-4 做了这些事

  • 不到 60 秒开发出乒乓游戏

  • 复杂点,20 分钟内开发贪吃蛇

  • 一键起诉,生成 1000 词的起诉书

  • 给一份以太坊合约 debug

  • 光速把 GPT-4 集成到 PDF 阅读器中

  • Dating app,视觉筛选匹配对象,通过个人资料和偏好分析对方是否值得追求

······

(对产品感兴趣的话,不要忘记关注 Founder Park 视频号 3 月 16 日晚 8 点 30 分的直播。)


马斯克

他一直挺不安的

一位教育畅销书作家发布推文,展示了 ChatGPT 写作的关于 Trump 和 Biden 的两首诗。他 @ 马斯克,「我们完蛋了」。

马斯克回复:非常不安。

黑镜下一季还怎么拍?」Doge 币创始人问道。

「反乌托邦故事都没新意了。」马斯克回复。

AI 开发者 Mckay Wrigley 表示 OpenAI 直播中演示的手绘图生成网页是他在科技行业见过最酷的东西。

马斯克回复:「笑笑机确实好笑。」

这是一个来自《南方公园》的梗,一个新型喜剧机器人 Funnybot 参加喜剧大赛,在比赛上大讲人类不如机器的笑话,引起了人类观众的愤怒。

雷蛇创始人说:「未来智能的评价标准将会是 GPT 而不是智商。那家伙最多就 GPT-10,但那边的哥们绝了,GPT 快 200 了。

马斯克回复:Transformer 是有局限的。

也可以被翻译成:变形金刚不是全能的。

下面几条不解释了。






3 月 16 日,猎户星空董事长傅盛、阅览室创始人王俊煜、乱翻书主理人潘乱将与极客公园创始人 & 总裁张鹏一起,共同探讨 GPT-4 发布的划时代意义,从产品的视角,解读现阶段初具规模的大模型应用。



更多科技创业者的采访,欢迎在小宇宙或者苹果播客收听我们的播客节目「Founder 100」。


Founder 100 栏目一直在招募优秀的科技创业者来做客我们的直播间,如果大家对于这档栏目感兴趣,也有意向想要来分享自己的故事,欢迎大家长按下图,识别图中二维码,填写报名申请单。
更多阅读

转载原创文章请添加微信:geekparker

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存