查看原文
其他

谷歌:图像识别你们都学会了,那我识别个视频给你看看

2017-03-21 慧天地


点击图片上方蓝色字体“慧天地”即可订阅

(更多精彩,请留意文末推荐)




谷歌在Google Cloud Next ’17 大会上,发布了包括新客户、新合作伙伴、新产品开发等一系列消息,再度发力云服务。

在这次大会上,谷歌宣布收购著名数据科学社区 Kaggle ,引起业界震动。

但庖叔更关注的,倒是另一个重磅技术的发布:视频内容识别

庖叔还记得很多年以前,第一次看到把一张图片拖进谷歌搜索框,就能识别出图片的内容,并搜索出相似图片时的震撼。

而如今,视频居然也能被识别了?


这就是谷歌云视频识别平台,将视频上传就能进行识别。

废话不多说,来看看识别的效果。

测试的Demo是一部场景丰富的广告片

识别的过程大概是这样的

视频的镜头在不停切换,右下角的场景标签也在实时变化。

庖叔截几张大图让大家看看识别结果

此时的画面是这个场景

实时识别出来的结果显示:92%的可能是野生动物(Wildlife),91%的可能是动物(Animal),81%是动物园(Zoo),78%是旅游胜地(Tourist destination)。

除了动物园和旅游胜地不一定准确,前两个标签正确无误。

镜头切到特写,识别结果实时变化为:

后两个标签变成了:90%的可能为老虎(Tiger),68%的可能为陆生动物(Terrestrial animal),非常准确。

场景转换。

大象(Elephants)、长颈鹿(Giraffe)全都无压力识别。

虽然还是Beta版本,但感觉可用度非常高。


感兴趣的朋友可以点开视频看完整的识别过。

(建议在wifi下观看)

https://v.qq.com/txp/iframe/player.html?vid=h0384t2ehec&width=500&height=375&auto=0

关于视频识别的技术原理,谷歌没有透露更多的信息。但我们可以用图片识别的原理来理解视频识别。因为视频本质上也是若干帧图像的连续播放。

当我们要识别一张图片的时候,简单来说,要分以下几个步骤:

先用算法算法对图片进行特征提取。提取前也可能会对图像进行压缩、颜色简化等预处理。

将提取的特征进行编码。

编码后与数据库进行比对,给出相似图像。也可以是给出相似度、检索词等。

说起来很简单,但每一步都涉及到很复杂的算法。海量的数据如何编排才能达到最快的检索速度。这些都是图像识别的核心技术。

等这套系统推广开来,最直接的好处就是,我们可以用视频内容的关键词来搜索视频了。

谷歌还将此技术以 API 的形式开放,以后我们还能见到更多视频识别奇思妙想的运用。

来源:庖丁技术(版权归作者及刊载媒体所有)


推荐


点击下文直接阅读

地球卫星图像结合机器学习,帮助人们更好识别与预测贫穷区域

科技前沿|语音识别准确率达97%,我们离对话交互还有多远?

科技前沿|计算机语音识别率首次媲美人类

深度学习在雷达遥感中大有可为

【慧天地】敬告


【慧天地】是服务测绘地理信息行业的公共公益平台,旨在:传递政府声音;发现行业亮点;增强学术交流;共享优质资源;关注本硕博学子的学习、就业;重视地理信息文化的传播、弘扬。【慧天地】高度重视版权,对于原创、委托发布的稿件,会烦请作者、委托方亲自审核通过后才正式推发;对于来自网站、期刊、书籍、微博、微信公众号等媒介的稿件,会在作者栏或者文章末尾显著标明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的优质作品,转载时如出现侵权,请后台留言,我们会及时删除。先做人,后做事;心有多大,舞台有多大。感谢大家一直以来对【慧天地】的关注和支持!

❤ 慧天地 ❤

有兴趣加入【慧天地】交流群的朋友,请加赵楠(微信号zn846546896)为好友。

欢迎大家推荐精品稿件,投稿邮箱:geomaticshtd@163.com

       (☆V☆)



编辑:胡方霞  杨长龙

审核:朱林烨  韩磊

指导:万剑华教授(微信号wjh18266613129)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存