【学术人生】一位外国小哥把整个 CNN 都给可视化了，卷积、池化清清楚楚！网友：美得不真实...

人工智能前沿讲习 2022-06-01

收录于合集 #学术人生 57个

当你初入江湖，迷茫不知道该干什么的时候，不妨去模仿前人是如何进行科研的，并从中归纳出最适合自己的道路。为此，我们推出“学术人生”专栏，介绍科研的方法与经验，为你的科研学习提供帮助，敬请关注。

萧箫鱼羊发自凹非寺

量子位报道 | 公众号 QbitAI

做计算机视觉，离不开CNN。

可是，卷积、池化、Softmax……究竟长啥样，是怎样相互连接在一起的？

对着代码凭空想象，多少让人有点头皮微凉。于是，有人干脆用Unity给它完整3D可视化了出来。

还不光是有个架子，训练过程也都呈现得明明白白。

比如随着epoch（迭代次数）的变化，训练过程中各层出现的实时变化。

为了能更清楚地展示网络细节，用户还可以在其中自由地折叠、扩展每个层。

比如将特征图在线性布局和网格布局之间转换。

折叠卷积层的特征图输出。

对全连接层进行边绑定（edge bunding）等等。

这样的可视化图像，可以通过加载TensorFlow的检查点来构建。

也可以在Unity编辑器中设计。

是不是有点鹅妹子嘤那感觉了？

最近，这个项目又在社交媒体上火了起来。

网友们纷纷表示：

“要是能在训练的时候看到这个过程，再长时间我也能忍啊。”

“求开源。”

该项目的作者，是一位来自维也纳的3D特效师。

据他介绍，之所以创建这样一个CNN可视化工具，是因为他自己初学神经网络时，经常觉得很难理解卷积层之间是如何相互连接，又如何与不同类型的层连接的。

而该工具的主要功能包括，卷积、最大池化和完全连接层的可视化表示，以及各种能实现更清晰可视化的简化机制等等。

总而言之，就是想让初学者通过最直观的方式，来get到CNN的重点。

如何用Unity搞出一个3D网络

在正式上手Unity前，作者先在Houdini软件中，搭建了一个可视化的3D网络原型。

也就是说，先给Unity版3D网络提供一个搭建思路，提前准备好实现展示卷积计算的方法、特征图的形状、边绑定的效果等问题。

它的节点编辑器长这样：

然后，就可以在Unity上搭建3D神经网络了。

首先，需要预设好神经网络的“形状”。

由于之前并没有用过Unity，作者先学习了着色器和过程式几何相关的知识。

这里面，作者发现了一些局限性，他采用的是Unity为着色器开发的语言Shaderlab，这个语言无法使用着色变化，只有对语义进行预定义的变量，才能让它在顶点、几何和像素着色器之间传递。

而且，它无法任意分配顶点属性，只有位置、颜色、UV等预定义属性。（可能这也是3D网络无法实时改变颜色的原因之一）

在研究了一些实例化（instancing）相关的概念后，作者计划采用几何着色器的方法生成神经网络的连线。其中起点和终点被传递到顶点着色器，并直接转发到几何着色器。

这些线，最多可以由120个顶点组成，因为Unity允许的几何着色器能创建的变量的标量浮点数为1024。

设计后的网络形状，大致长这样：

然后，就是从模型的TensorFlow代码中，生成对应的3D神经网络图像。

其中，Tensorflow-native.ckpt格式的文件，需要存储重构模型图所需的数据、二进制的权重读取和激活值，以及特定层的名字。

以Cifar10-greyscale数据集为例，需要编写一个检查点（checkpoint）文件，以及设置随即初始化的权重。

在那之后，需要加载这些检查点文件、启动TensorFlow会话，输入训练示例，以便查询每一层的激活函数。

然后编写一个json文件，存储每一层的形状、名称、权重和激活函数，便于读取。然后使用权重值，将颜色数据分配给各层的Unity Mesh。

最终搞出来的效果，还是不错的：

作者还录了个开发视频，在文末可以找到地址。

相关研究还不少

事实上，此前已经有不少学者，进行过神经网络可视化的研究。

例如，去年5月，太牛逼了！一位中国博士把整个CNN都给可视化了，每个细节看的清清楚楚！，只需要点击对应的神经元，就能看见它的“操作”。

这是用TensorFlow.js加载的一个10层预训练模型，相当于在浏览器上就能跑CNN模型，也可以实时交互，显示神经元的变化。

不过，这还是个2D的项目。

目前，也已经有人像上面那个神经网络模型一样，做出了3D的可视化神经网络:

这个项目，同样用到了边绑定、光线追踪等技术，与特征提取、微调和归一化相结合，将神经网络可视化。

这项项目希望能借由这些技术，来估计神经网络中不同部分的重要性。

为此，作者将神经网络的每一部分都用不同的颜色来表示，根据节点和节点在网络中的重要性，来预测它们之间的关联性。

大致的处理过程是这样的：

如果对于这类3D神经网络可视化感兴趣，可以在文末找到对应的开源项目地址。

作者介绍

Stefan Sietzen，现居维也纳，此前曾是个3D视觉方向的自由职业者。

目前，他在维也纳工业大学读硕，对视觉计算（visual computing）非常感兴趣，这个3D神经网络，就是他在硕士期间做的项目之一。

开发过程：
https://vimeo.com/stefsietz

已开源的3D神经网络项目：
https://github.com/julrog/nn_vis

参考链接：
https://www.reddit.com/r/MachineLearning/comments/leq2kf/d_convolution_neural_network_visualization_made/
https://mp.weixin.qq.com/s/tmx59J75wuRii4RuOT8TTg
https://vimeo.com/stefsietz
http://portfolio.stefansietzen.at/
http://visuality.at/vis2/detail.html

本文目的在于学术交流，并不代表本公众号赞同其观点或对其内容真实性负责，版权归原作者所有，如有侵权请告知删除。

“学术人生”历史文章

请点击文章底部“阅读原文”查看

分享、点赞、在看，给个三连击呗！

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

【学术人生】一位外国小哥把整个 CNN 都给可视化了，卷积、池化清清楚楚！网友：美得不真实...

算法工程师技术路线图

如何开始写英文论文

英文学术论文写作——词汇积累和常见错误（2）

英文论文写作-词汇积累和常见错误

注意，这十个短语在学术论文中要少用......

2021年自然语言处理方向学术会议情报

如何写高质量的SCI论文摘要

计算机视觉 | 哥大读博五年总结（全）

学术论文投稿与返修（Rebuttal）分享

Rutgers大学熊辉教授：《易经》如何指导我们做人工智能？

陈天奇：机器学习科研的十年

陶哲轩对数学学习的一些建议

最新国内大学毕业论文LaTex模板集合（持续更新中）

如何写一篇合格的NLP论文

初入NLP领域的一些小建议

SFFAI分享 | 张士峰：经验分享之我的科研历程【附PPT与视频资料】

SFFAI分享 | 王少楠：博士生活杂谈【附PPT与视频资料】

北大读博手记：怎样完成自己的博士生涯？非常具有指导性！

给研究新生的建议，光看论文是学不好的，一定要看书，看书，看书！

北大读博手记：怎样完成自己的博士生涯？非常具有指导性！

SFFAI分享 | 考月英：科研与工作经历分享【附PPT】

加州伯克利大学计算机系是如何培养计算机人才的？

更多学术人生专栏文章，

请点击文章底部“阅读原文”查看

您可能也对以下帖子感兴趣

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

生成图片，分享到微信朋友圈

【学术人生】一位外国小哥把整个 CNN 都给可视化了，卷积、池化清清楚楚！网友：美得不真实...

更多学术人生专栏文章，

请点击文章底部“阅读原文”查看

您可能也对以下帖子感兴趣