其他
“远见者”特斯拉AI主管Karpathy|深度学习崛起十年
神经网络实现了一个完全随机的函数,做完全随机的事情,基本上是从零开始的。你必须告知它在每种情况下该做什么,收集的情景越多,就必须告知它更多,以便它在所有情况下都能做正确的事情。
泛化性对于人工智能的运行极其重要,一切都与数据集的管理有关。如果你在业界做AI应用,尤其做图像识别,数据集会迭代很多次,算法设计和建模的优先级更低一点。我在工作中做的很多事情就是整理数据集,而不是编写算法,这是现在所有工程的内容。
我们拥有一支高度专业、训练有素的员工来管理数据集,这是正确的方向,因为这是一种新的软件编程范式,他们是软件2.0领域的新程序员,当他们标注样本时,会告知系统如何解释场景,这实际上是在对自动驾驶进行编程。
在新的编程范式中,必须围绕数据集管理开发全新的工具,监控神经网络的部署、迭代、微调,新范式编程的一切都是未知领域。
如果能训练一个更大的网络,效果会更好,结果会更神奇。
归根结底,你需要一个非常健壮的流程来进行真正的测试,并对它进行大量评估,也可能是对所有的单个组件进行评估,确保检测本身正常工作。
马斯克可以把一个非常复杂的系统简化为系统的基本原理和系统中最重要的组成部分,然后对这些进行陈述。