低碳AI好科技(3)AI一眼识别"你算什么鸟"?
《追AI的人》第3期直播《国际AI视觉大赛冠军方案分享》圆满结束,AAIG的三位学霸做客现场,畅聊顶会Paper的获奖方案。
接下来,我们将用文字分享第三个议题《AI一眼识别“你算什么鸟”》,共计4214字。
🔻点击查看过往议题:
议题1:低碳AI好科技(1)顶会冠军Writeup:目标检测比赛的常用方法有哪些?
议题2:低碳AI好科技(2):如何降低超30%的算法调用成本?畅聊多专家结构
三个学霸的顶会Paper中奖座谈会:《追AI的人》直播第3期来咯!
胡云青
浙江大学计算机学院DMAC实验室博士生,阿里安全图灵实验室实习生。研究方向和感兴趣方向包括细粒度、多标签、小样本等图像识别,以及多模态图文理解等。
二、实验结果与结论
细粒度图像识别
主流方法
与之相对应的,则是弱监督方法。它给每一个图提供的监督信息只有一个图像的类别标签,这和之前的强监督方法相比,其监督信息就更为简单,所耗费的人工成本也更低。
视觉Transformer
架构
定位和放大
实现
对比
我们这边还和4月份的论文进行了对比,也就是TransFG的工作,这里是主要的步骤以及思想。从其架构图可以看到,TransFG的主要目的其实是过滤前N-1层的patch token,但我们认为只过滤而不进行增强,对整体的分类性能帮助并不大。
实验结果
我们主要是在三个公开数据集上进行实验,CUB是200类的鸟类数据集,iNaturalist是一个包含了5000多类自然物种的大型数据集,Stanford Dog是一个狗类数据集。
结论
我们从序列学习角度出发,重新定义细粒度图像分类任务的输入形式,基于视觉Transformer,我们融合多尺度和局部信息,从而对整体分类性能进行有效提升。
关注AAIG公众号收获更多干货
PPT原件下载
请添加【AAIG课代表】微信号
三个学霸的顶会Paper中奖座谈会:《追AI的人》直播第3期来咯!
(下)算法黑箱到底要不要打开?万字长文讲述:如何构建更合理的算法透明规则
算法黑箱到底要不要打开?万字长文讲述:如何构建更合理的算法透明规则(上)
阿里AI黑科技成团出道,可防火防伪防疫还能反诈鉴黄与打假……
阿里建全球最大奢侈品商标数据库:无偿提供给全球科研团队使用识别假货
一场猎杀AI的残酷游戏:把枪口对准人工智能,是为了吓退黑暗丛林中的对手
为AI攻防测能力,清华联合阿里、RealAI发布全新测试基准平台Adversarial Robustness Benchmark
阿里新一代安全架构核心AI技术夺冠,机器阅读理解准确率战胜人工
治理重构,塑造平台经济的健康生态——《中国平台经济健康指数》报告发布
给AI系统做“安全体检”,阿里安全提出自动化AI对抗平台CAA | AAAI 2021
给图片打「马赛克」可骗过AI视觉系统,阿里安全新研究入选ICCV 2021
「启发式领域适应」成果入选NIPS2020,新一代算法「鉴黄师」诞生
4项新一代安全架构核心AI技术沉淀的论文被国际会议ICASSP收录
张钹院士解读AI安全治理三大痛点+信通院AI数据安全治理的七条建议
准确检测DeepFake视频,阿里新算法从多个人物中识别被篡改的人脸
阿里AI技术获国际视觉大赛双冠军 “低碳AI”降低30%算力成本
阿里巴巴副总裁陈龙:数字科技是绿色低碳发展的催化剂、连通器、放大器
为数十万盲人修建网络盲道:阿里的追光者每天为数亿张图片把脉,帮助盲人“听图”
抱大腿攻击是什么?AAIG CUP暨第三届 Apache Flink 极客挑战赛启动!
更多人工智能治理和可持续发展
技术干货+产业实践分享
点击下方名片关注和星标
【阿里巴巴人工智能治理与可持续发展实验室】