查看原文
其他

谷歌开源图像分类工具TF-Slim,定义TensorFlow复杂模型

2016-08-31 新智元

1 新智元编译1

 来源:Google Research

作者:Nathan Silberman & Sergio Guadarrama,谷歌研究员

译者:闻菲


【新智元导读】谷歌今天宣布开源 TensorFlow 高级软件包 TF-Slim,能使用户快速准确地定义复杂模型,尤其是图像分类任务。这不由让人想起 Facebook 上周开源“从像素级别理解图像”的计算机视觉系统。不管怎么说,在计算机视觉方面,强大的工具又多了。下文是官方博文翻译。在新智元后台回复“0831”下载论文。



今年早些时候,我们发布了图像分类模型 Inception V3 在 TensorFlow 上的运行案例。代码能够让用户使用同步梯度下降用 ImageNet 分类数据库训练模型。Inception V3 模型的基础是一个叫做 TF-Slim 的 TensorFlow 库,用户可以使用这个软件包定义、训练、评估 TensorFlow 模型。TF-Slim 库提供的常用抽象能使用户快速准确地定义模型,同时确保模型架构透明,超参数明确。


自发布以来,TF-Slim 已经得到长足发展,无论是网络层、代价函数,还是评估标准,都增加了很多类型,训练和评估模型也有了很多便利的常规操作手段。这些手段使你在并行读取数据或者在多台机器上部署模型等大规模运行时,不必为细节操心。此外,我们还制作了 TF-Slim 图像模型库,为很多广泛使用的图像分类模型提供了定义以及训练脚本,这些都是使用标准的数据库写就的。TF-Slim 及其组成部分都已经在谷歌内部得到广泛的使用,很多升级也都整合进了 tf.contrib.slim.


今天,我们将 TF-Slim 的最新版本与 TF 社区共享,亮点包括:


  • 很多新的层(比如 Atrous 卷积层和 Deconvolution),使神经网络架构更丰富;

  • 支持更多的代价函数和评估指标(如 mAP,IoU)

  • 部署运行库,让在一台或多台机器上进行同步或异步训练更容易

  • 代码,用于定义和训练广泛使用的图像分类模型,比如 Inception、VGG、AlexNet、ResNet

  • 训练好的模型,这些模型使用 ImageNet 分类数据库训练,但也能用于其他计算机视觉任务

  • ImageNet、CIFAR10 和 MNIST 这些容易使用的标准图像数据库


使用 TF-Slim 的 GitHbu 代码:


README:https://github.com/tensorflow/models/blob/master/slim/README.md

使用说明:https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/slim


贡献突出的研究员:


  • TF-Slim:Sergio Guadarrama, Nathan Silberman.

  • 模型定义和检查:Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, Jon Shlens, Zbigniew Wojna, Vivek Rathod, George Papandreou, Alex Alemi

  • 系统基础设施:Jon Shlens, Matthieu Devin, Martin Wicke

  • Jupyter 说明:Nathan Silberman, Kevin Murphy


参考文献:


  1. Going deeper with convolutions, Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich, CVPR 2015

  2. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift Sergey Ioffe, Christian Szegedy, ICML 2015

  3. Rethinking the Inception Architecture for Computer Vision, Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon Shlens, Zbigniew Wojna, arXiv technical report 2015

  4. Very Deep Convolutional Networks for Large-Scale Image Recognition, Karen Simonyan, Andrew Zisserman, ICLR 2015

  5. ImageNet Classification with Deep Convolutional Neural Networks, Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, NIPS 2012

  6. Deep Residual Learning for Image Recognition, Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, CVPR 2016


在新智元后台回复“0831”下载论文




【号外】由中国自动化学会和新智元联合主办的AI全球年度盛典『AI WORLD 2016世界人工智能大会』即将盛大开幕。大会官网:http://aiworld2016.com/



更多详情,点击“阅读原文”,查看大会官网

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存