ChatGPT-地表最强AI模型!要消灭人类?
最近,美国人工智能研究机构 Openai 发布了最新的大语言模型 ChatGPT,惊艳的性能在海外掀起了一波又一波热潮。
通过对各种领域专业知识的训练,ChatGPT 不仅可以帮助人们搜索知识,还能进行进一步的总结和分析。
目前,ChatGPT处于测试阶段,只要有 OpenAI 账户就可以免费使用。万万没想到,此超级对话模型一经开放,很多人便深陷其中,无法自拔。就连 OpenAI 背后的投资者马斯克不忘调侃一句,“很多人疯狂地陷入了 ChatGPT 循环中。”
这个模型到底有多令人兴奋呢?它能回答一连串的问题,效果惊人、超预期。ChatGPT方称,人工智能的对话模型开始能在大范围、细粒度问题上给出普遍稳妥的答案。简单地说,人工智能的大对话模型可以达到基本不犯错误的水平了。先来围观下网友们怎么玩出花~
-帮你安慰女友-
-鸡汤文章,手到擒来-
-哲思:我们如何过好这一生?-
-参加SAT考试并拿到不错的成绩-
-自动制作表格,并利用多轮对话修改表格-
-评价一个领域、科研方向-
-ChatGPT+Midjourney-
最让程序员狂喜的是,ChatGPT的训练样本里包含了大量来自Stackoverflow和Github的内容,其编程类问题回答质量颇高。自动写代码、注释代码和debug,各种语言和任务不在话下。现有全网的案例可以看出,它可以实现包括但不限于shellcode生成、nim编写、JavaScript解混淆、nuclei模板生成、yara生成、免杀生成、反编译等等。
根据 OpenAI 的介绍,ChatGPT是在2022年初训练完成的GPT-3.5系列模型的基础上调优而来。ChatGPT使用了与另一款GPT-3.5系列的模型InstructGPT相近的方法——基于人类反馈的强化学习(Reifocement Learning from Human Feedback,RLHF)。团队收集了AI与人类对话的数据,既包括人类自己的也包括AI的, AI 训练师可以参照建模建议写出自己的答案。
对于强化学习奖励模型,OpenAI 记录了 AI 训练师和聊天机器人之间的对话。然后,该团队随机选择了一个人工智能利用不同自动补全功能生成的回复,并让训练师对其进行评分。在进行微调时,OpenAI 使用了近端策略优化(proximal policy optimization),这个过程会反复进行多次。
点击下方空白 ▼ 查看明日开发者黄历