其他
对话实录:黄仁勋对话Transformer论文七大作者,探讨大模型未来
郭晓静 本文作者
这个世界需要比Transformer更好的东西,我想我们在座的所有人都希望它能被某种东西所取代,将我们带到一个新的性能高原。 我们在最初的目标上并没有成功,我们开始Transformer的初衷是想要模拟Token的演化过程。它不仅仅是线性的生成过程,而是文本或代码的逐步演化。 像2+2这样的简单问题,它可能会使用大模型的万亿参数资源。我认为自适应计算是接下来必须出现的事情之一,我们知道在特定问题上应该花费多少计算资源。 我认为当前的模型太过经济实惠,规模也还太小,大概1美元百万toke的价格,比外出购买一本平装书要便宜100倍。
推荐阅读
腾讯研究院:《Sora能引爆生成视频新纪元吗?》