查看原文
其他

终于有人把深度学习讲清楚了!

黄申 技术领导力 2022-07-13

作者:黄申  编辑:Emma

来源| 技术领导力(ID:jishulingdaoli)


近些年,随着人工智能和深度学习的兴起,相应的专业书籍也越来越多。有的朋友可能刚刚开始接触这个领域,需要一些入门的指引,而有些朋友可能已经积累了相当的经验,期待学习更深入的知识。


因此,选择一本合适自己的书就很关键。为了帮助你选书,我今天来点评一下Manning出版社于2020年8月出版的一本关于深度学习和PyTorch的书籍《Deep Learning with PyTorch》,目前此书的官方中文版尚未分布,我有幸阅读了其英文版,在这里我将从个人的角度,来分析这本书是否适合你。


《Deep Learning with PyTorch: Build, train, and tune neural networks using Python tools》


如果你对PyTorch并不了解的话,这里先提几句。它是一个开源的Python机器学习库,由Facebook人工智能研究院于2017年推出,对应于Google的TensorFlow。PyTorch有两个重要的特点:第一,具有强大的基于GPU加速的张量计算;第二,包含自动求导系统的深度神经网络。也正是因为此,它特别适合深度学习理论的应用。


《Deep Learning with PyTorch》这本书共15章,其中前8章组成了第一大部分,主要是从PyTorch中的基本概念讲起,逐步深入,一直介绍到卷积神经网络(Convolutional Neural Network,CNN)在PyTorch中的实现。后7章组成了第二大部分,主要是通过一个医学影像的案例,讲解了如何使用PyTorch和深度学习的模型,来解决癌症细胞的识别。


咱们先来说说前8章,第1章延续了Manning的一贯风格,对深度学习和PyTorch进行了整体性的描述,降低了入门的门槛。第2章的设计还算有新意,让读者直接使用已经预先训练好的神经网络,来完成宠物狗图片的识别。


你可以随手拍一张自家狗狗的照片,或者从网络上下载一张图片,并让这个训练好的模型对它们进行识别,告诉这只狗是什么品种,甚至是对原图进行一定程度的篡改。这样一来,读者即使不了解过多的神经网络理论和编程知识,也能实践图像识别的案例,带来了更多的动手乐趣。



第3章和第4章相对枯燥一些,主要是介绍张量(Tensor)的概念,已经如何使用它,表达现实世界中的不同类型的数据。感觉这部分对于张量的本质描述不算很深入,可能某些入门读者读起来有点费劲。好在第4章列举了不同应用场景下,如何实现基于张量的表示,不仅实用,而且还加深了你直观上的理解。


第5章其实并非聚集于深度学习,而是主要介绍了机器学习的某些基本概念,包括模型的拟合、参数调优、损失函数、梯度下降学习、以及如何在PyTorch中运用或者实现它们。当然,如果你对这些都不熟悉,还是有必要学习一遍,否则第6章就很难理解了。因为第6章是在之前的基础上,讲解如何使用神经网络来进行机器学习。通过第6章和第5章的对比,你也许就能体会到神经网络的精髓在哪里。


第7章和第8章详细讲解了如何使用深度神经网络进行图像识别。第7章在CIFAR-10数据集(https://www.cs.toronto.edu/~kriz/cifar.html)上,构建了一个基本的神经网络,识别一张图片中的物体小鸟还是飞机。而第8章则阐述了为何第7章的基本神经网络不够,已经如何使用卷积神经网络来解决物体在图片中不同位置所带来的问题。代码讲解的不算太细致,对新手来说读起来有点费劲。


前8章所组成的第一大部分,虽然只涉及了卷积神经网络,而并没有涉及循环神经网络(RNN)、长短期记忆网络(LSTM)等其他类型,但整体上章节构成还是比较清晰的,行文也算流畅。如果你对神经网络和深度学习不太了解,这些内容对你来说还是很有价值的。如果满分10分,我能给到8分。


相对于第一大部分的好评,我对第二大部分槽点更多。第二大部分共有7个章节,篇幅上占了全书的将近一半。从大纲来看是实战部分,本来我是满心期待的。结果看完后失望大于期望。


作者挑的案例是医学界的癌症诊断,而且整整7大章都是在讲这个案例。首先,这个案例的受众面过于窄。尽管深度学习在图像识别中运用最为广泛,但是我相信大部分此书的潜在读者都是冲着标题中的关键词Deep Learning和PyTorch去的。


光这两点,就能产生很多很多不同领域中的应用案例,包括自然语言处理、语言识别、客户行为分析等等。再加上第7和第8章也是有关图片识别的,让人感觉,这本书的名字应该叫《Deep Learning with PyTorch for Image Recognition》。


另外,即使是一定要讲图片识别,也可以讲讲人脸识别、车牌识别之类的对吧,那样岂不是更香?当然,人脸之类的识别也烂大街了,也许作者想另辟蹊径吧。但无论如何,我都觉得这个案例的挑选值得商榷。


其次,作者花了较多的篇幅去介绍癌症诊断的内容、数据特征等等。由于前面提到的受众面较窄,所以这部分的内容也比较鸡肋。此外,连作者自己也承认用于实验的数据量过于庞大、计算过于依赖GPU的运算。


虽然大家都明白深度学习需要大量的数据,但是如果能举出一些其他的案例,可以使用较小规模的数据,在普通电脑CPU上也能完成一些实验,那对读者来说,学习效果是不是更好呢?正是基于这些,我觉得第二部分勉勉强强能拿个6分吧。



综合第一和第二大部分的内容,此书在7到8分之间,很好奇将来豆瓣上的评分和我这个预测能有多接近。个人觉得降低有关图片识别的相关篇幅,转而介绍更多的神经网络类型、以及它们在不同实际案例中的应用,本书应该会更有价值。


在写评价的最后,我刚刚得知本书还会出第2版,所以将自己的反馈发给了作者,希望他们能够在第2版中作出一些内容上的调整和优化。但就目前此书的内容来看,还是比较适合深度学习入门级、或对图像识别有特殊需求的读者。


当然,书没有最好,只有最适合。如果你觉得这就是你想要的书,你可以持续关注本书的官方中文版,预计在今年年底至明年初就会发布。


作者简介:

黄申 博士,2015年美国杰出人才,微软学者,IBM ExtremeBlue天才计划成员。2006年博士毕业于上海交通大学,拥有20余篇国际论文和30多项国际专利。超过20年机器学习和大数据领域的经验,现任Glassdoor机器学习资深研发经理,曾任职于LinkedIn、微软研究院、IBM研究院、eBay研发中心,1号店和大润发飞牛网。出版过《大数据架构和算法实现之路:电商系统的技术实战》、《大数据架构商业之路:从业务需求到技术方案》、《程序员的数学》等技术书籍和专栏,累计读者超10万人。其2021年3月最新力作《程序员的数学基础课-从理论到Python实践》正在京东、当当等各大平台热销,帮助你解决人工智能时代的数学入门。



 -END- 



加入读者群,跟老K、及100位大咖学习交流?
加群助理微信,注明:加群

如遇繁忙,请手动添加:andelu2025



美团、字节的《人人都要学的架构思维》.pdf 下载

点击“BAT架构”,回复:架构


大家在看:

1.杀死低代码!

2.他是最牛程序员,一个月写了操作系统!

3.假如杨笠吐槽程序员。。。

4.如何用敏捷搞垮一个团队?

5.程序员怎样写出搞垮公司的代码?

6.阿里彻底拆中台了!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存