CVPR2019 | 人脸聚类——Linkage Based Face Clustering via GCN

Eudora 极市平台 2021-09-20

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“阅读原文”立刻申请入群~

CVPR2019 accepted list ID已经放出，极市已将目前收集到的公开论文总结到github上（目前已收集343篇），后续会不断更新，欢迎关注，也欢迎大家提交自己的论文：
https://github.com/extreme-assistant/cvpr2019
今天分享一篇人脸聚类的CVPR论文~

作者 | Eudora

来源 | https://zhuanlan.zhihu.com/p/60796909

做过聚类的小伙伴通常都会有一个头大的问题，就是“如何确定距离”。这个距离是用于确定两个节点是否有连接的，它为什么那么让人头大呢？因为距离阈值设置小了，很多linkage就被断开了，导致较低的recall；而设大了，就有大量错误的linkage，precision就没法保证了。

本次介绍的工作主要就是为了解决这个问题，这是CVPR 2019的一个文章“Linkage Based Face Clustering via Graph Convolution Network”，就是通过利用GCN来识别graph的linkage关系的！链接如下：

https://arxiv.org/pdf/1903.11306.pdf

下面主要从以下几个方面来介绍这篇文章：

简介
方法介绍

Framework overview
Instance Pivot Subgraph (IPS) &　GCN

结果分析
Pros & Cons

1. 简介——人脸聚类存在的问题，以及文章的解决方法

人脸聚类中一个主要的难题——link的判断，在figure 1给了很清晰的阐述：

（a）文中focus的问题是要判断两个节点i和j是否有link。

（b）朴素的想法是判断i、j之间的距离是否小于一定的阈值，如果不是的话，则两个节点之间不会有link。

（c）ARO方法通过人为设定的规则来确定是否应该有link，这种手工设计的方式还是不够准确。

（d）文中提出的方法是通过GCN获取i、j 的neighbor信息，并学习两者之间是否有link。

这种方法不需要依赖于一个全局的阈值如（a）或者人为设定的局部阈值如（c），可以让算法自己来观察当前的context，从而确定结果，这会使得linkage更加robust。

2. 方法介绍

（1）Framework Overview

该文章提出的方法主要包括以下几个步骤：

(a) 首先，是通过CNN来提取feature，这时候我们可以看到，feature虽然是有分开大致的group，但是对于一些比较困难的类来说，feature会分布得很散（这个对应于实际情况中的遮挡、模糊等情况）；另外常见的困难情况，图中没有画出来——有些类别之间会非常的相似，有一些overlap的部分。

(b) IPS：对于每个样本点，构建其对应的子图，文中称为Instance Pivot Subgraph （IPS）。对于这一步我们可以看做是对每个样本找出它的n-hop neighbor，为了给后面的节点分类提供context信息。

(d) 连接该有的link，并找出其中的连通图，这样就得到聚类的结果了！

（2）Instance Pivot Subgraph （IPS）& GCN Node Classification

IPS+GCN是该文章的重点模块。

IPS的建立方式有一下几个步骤，如下图：

（a）首先，对于pivot node找出其子图，文中设定的子图节点包括pivot的1\2\3- hop neighbors；
（b）接着，对节点特征做normalization，也就是每个节点的feature都减去pivot的feature，这步可以理解为以pivot为中心，观察其附近节点的变化（context）；

（这点非常重要，相当于定义了图/类的中心，后面相当于对节点进行二分类，使得识别的难度大大降低。）

（c）对子图中的每个节点，连接其u近邻。

（这一步也就得到了GCN需要输入的邻接矩阵，可以直接应用GCN对子图的节点进行分类了。）

3. 实验结果分析

（1）方法比较，文章提出的方法，可见对于比heuristic的方法有比较明显的提升的。

（2）聚类中常见的Singleton对效果的影响。

（3）Multi-view clustering

该方法可以直接应用于Multi-view clustering上，可见也是有不错的提升的。

文章不仅验证了该方法在同质数据上的提升，还给出了异质数据上的结果，这也是不错的一点。

4. 总结

Pros:

（1）用GCN来解决Clustering中hard core的linkage问题，方法比较新颖——GCN中利用到了数据的局部信息，能够更准确地判断节点之间的关系；

（2）构建IPS的想法很好，巧妙地利用了GCN做节点分类的特性，并且使用Pivot Normalization很好地定义了节点的主次关系，能更好地进行分类。

Cons:

（1）在scalability和efficiency方面尚有欠缺，文中对于每个样本都会建立一个IPS，并在上面应用GCN，虽然使用的GCN计算量不大，但毕竟在大规模数据上还是吃不消的，这个方面还是有比较大的扩展空间；

（2）看到文章中提到Singleton的问题时，我是挺期待作者能描述一下他们是如何把这些singleton归类的，毕竟在实际问题下，这种情况实在是太太太常见了！

据我所知，近期还有不少GCN + Clustering的工作会陆续出来，坐等！

*延伸阅读

CVPR2019 | 03-28日更新11篇论文及代码汇总（1篇Oral，含目标检测、人脸聚类、VQA等）

点击左下角“阅读原文”，即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

觉得有用麻烦给个好看啦~

：，。视频小程序赞，轻点两下取消赞在看，轻点两下取消在看

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……

为什么京东员工强烈推荐京东plus会员不要直接在平台上买东西？

别太贪婪，这些技能让你一辈子满足

CVPR2019 | 人脸聚类——Linkage Based Face Clustering via GCN

1. 简介——人脸聚类存在的问题，以及文章的解决方法

2. 方法介绍

3. 实验结果分析

4. 总结

CVPR2019 | 03-28日更新11篇论文及代码汇总（1篇Oral，含目标检测、人脸聚类、VQA等）

CVPR2019专题直播 | 王鑫龙：联合分割点云中的实例和语义

CVPR 2019 Oral | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器

您可能也对以下帖子感兴趣

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……

为什么京东员工强烈推荐京东plus会员不要直接在平台上买东西？

别太贪婪，这些技能让你一辈子满足

生成图片，分享到微信朋友圈

CVPR2019 | 人脸聚类——Linkage Based Face Clustering via GCN

1. 简介——人脸聚类存在的问题，以及文章的解决方法

2. 方法介绍

3. 实验结果分析

4. 总结

CVPR2019 | 03-28日更新11篇论文及代码汇总（1篇Oral，含目标检测、人脸聚类、VQA等）

CVPR2019专题直播 | 王鑫龙：联合分割点云中的实例和语义

CVPR 2019 Oral | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器

您可能也对以下帖子感兴趣