其他
“三巨头”联合发布万字长文,深度学习将通往何方?
从手工设计的编码到分布式向量表示
深度学习的兴起
近期进展
正对由同一图像的不同版本组成,这些版本通过裁剪、缩放、旋转、颜色偏移、模糊等方式扭曲。负对是不同图像的类似失真版本,它们可以通过称为硬负挖掘的过程从数据集中巧妙地挑选出来,或者可能只是小批量中其他图像的所有失真版本。网络较高层之一的隐藏活动向量随后用作以监督方式训练的线性分类器的输入。这种连体网络方法在标准图像识别基准上取得了出色的结果。
最近,两种 Siamese 网络方法设法避免了对对比样本的需求。第一个称为 SwAV,量化一个网络的输出以训练另一个网络,第二个称为 BYOL,平滑两个网络之一的权重轨迹,这显然足以防止崩溃。
信息容量受限于包含球体内部有多少噪声球体。嘈杂的球体相互排斥,因为良好的重构误差需要对应于不同样本的代码之间有小的重叠。
深度学习的未来
随着聊天机器人 Meena 和 BlenderBot 变得越来越大,它们也在不断改进。
监督学习需要太多标记数据,而无模型强化学习需要太多试验。人类似乎能够以少得多的经验很好地概括。
当前的系统对分布变化的鲁棒性不如人类,人类可以通过很少的例子快速适应这种变化。
当前的深度学习在感知任务和通常所谓的 system 1 任务方面最为成功。将深度学习用于需要经过深思熟虑步骤序列的 system 2 任务,是一个仍处于起步阶段的令人兴奋的领域。