我敢肯定你没这么玩过 GPT
Editor's Note
把 GPT 的 code interpreter 玩出新高度~
The following article is from 南瓜博士 Author ElfeXu
昨天参加一场技术交流会,真长见识呀。资料袋里有份组织者则宇特地打印出来给大家看的文章(后GPT时代,多模态是最大的机会),今天一翻超有意思,就琢磨着用 code interpreter 也来试试看。
做了好几种尝试,最好玩的是画表情。调教好所有表情后,让它编个台词再给每句台词配上表情。台词一看就很源自生活,表情选用地也挺贴切。
请欣赏👇
每一个表情,都是 GPT 用 python 代码画出来的。最开始还画翻车了:
后来就越画越娴熟,例如这样的:
偶尔我也会给它一些建议
除了玩表情,我还画三维的。一开始是模仿文章中的例子,让 GPT 用立方体拼 minecraft 里的小人:
但让它坐下脚向前伸,结果成劈叉了
手水平前伸也不太对
让仔细看看,就纠正过来了。(就和 let's think step by step 一样啥都没教)
和论文中的例子一样,左右也搞反了:
目前 GPT 没能搞定的是画手。本来我像让它用矩阵画出手,然后来比划各种手势的,但结果非常翻车:
画成这样已经很不容易了:
我本还希望能让它从1到10的手势全部比划一遍呢,结果太难调教了,各种千奇百怪的错误。
考虑到 GPT 没有直接学过任何 3D 模态的信息,仅仅是从人类文字中获取 3D 建模的信息,今天的三个任务做到这点效果,挺满意的了。以后这类事情,还是交给专业的程序来做吧。GPT 有 GPT 的用处。(昨天见识了一个超级酷的玩法,后面我自己尝试出来再分享。)
----
附:之前的几篇 plugin 和 code interpreter 的文章
带上插件后的 ChatGPT 更惊艳!机器人和机器人对话的世界真的来了
加了插件的 ChatGPT 目前确实是中心,希望未来的机联网不是
能运行代码的 GPT 那是真的王炸呀
当 AI 开始自动思考和行动——让 GPT 左右互搏会发生什么