查看原文
其他

Image Q:大数据时代,武汉这家企业如何挖掘数据『石油』的深层价值?|裸泳投资欲

武汉投资事儿尽在 裸泳 2020-09-09

相似量级下,视频、图像、音频所含的信息量远远大于文本。然而在这个大数据行业疯狂成长的时期,想成为不可替代,注定要做深入到领域的知识体系构建。


                                                                                              记者:何婧/主编:张浩

 深度好文/共3185字/阅读6分钟


项目名称:Image Q 武汉烽火普天信息技术有限公司

主营业务互联网大数据语义分析应用平台

融资情况2016年获湖北高投则本经营有限公司、武汉高投金运激光产业投资基金A 轮2700万融资

关键词:大数据 语义分析 自然语言处理 烽火科技 国内领先大数据服务公司

受访人:Image Q首席数据科学家胡华


 


2012年,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将『大数据战略』上升为国家意志。

 

紧接着马云在2016年的一次演讲中提出:过去的发展是基于石油和煤,未来技术的发展基于新的能源,那就是数据。』也就是在这一年,全球数据呈现井喷式增长,大数据的服务也从单纯的底层架构类,逐渐深入到各个垂直领域。

 

Image Q则在这股『大数据浪潮』中应运而生。


作为武汉烽火科技集团内部孵化项目,依托烽火科技六大数据中心,获得政府及运营商的一手数据源,同时研发出拥有自主知识产权的ImageQNLP语义分析技术。成为了国内领先的互联网大数据语义分析应用服务商,为各个行业提供定制化的大数据服务。

 

与同行不同的科大讯飞做语音的理解,商汤科技做视频、图像的理解,而Image Q主要做文字的理解。



将客观理性的知识感性化,而不是将信息直接『扔』给用户


『人类理解信息一定是感性的。』

 

如果单纯的将『干货』知识点罗列出来,任何一个人都很难去理解消化。一个人每天如果阅读超过7000条信息,大脑就会过载甚至崩溃。

 

所以就像公安部门的卷宗中的各类线索,并不会直接对线索进行罗列,而是通过一系列的形容描述。『可以说一个文本中有80%都是无用信息,只是为了帮助人类去阅读。Image Q将这其中20%的有用信息提取出来后进一步做可视化加工,帮助用户更方便快捷的去理解。

 

Image Q从2009年成立以来,就致力于通过数据采集、数据治理、数据挖掘、智能应用、可视化处理,将海量的原始数据变为可利用的精准数据。并且最终数据的呈现是以图表的形式,将客观理性的知识感性化,让用户更方便快捷的理解信息,而不是将信息直接『扔』给用户。


Image Q目前主要面向4类客户:

1. 政府企业:依靠具有央企属性的烽火科技集团,抓取互联网大数据以及政府、运营商提供的数据,以此辅助政府及企业的工作和决策,有效其社会治理能力和决策力。


2. 媒体:与湖北日报、重庆、江苏等地省报媒体深度合作,大多是做媒体文本主题的划分或热点、爆点的追踪。


3. 公安:因有大量的笔录、卷宗等文本数据此前并未被很好的开发利用,因而这块是Image Q主要用户群体之一,目前与包括湖北、江苏、湖南在内的6家公安系统已达成合作。主要帮助公安部门寻找线索加快破案进度。


4. 金融:对个人的消费信息进行收集分析,来佐证银行的FICO体系(银行信用体系),或用于金融公司做贷款风险评估、投融资分析等业务。


媒体客户案例(来自网络)


盈利手段则是以B2B的模型做定制化服务,随着客户的发展迭代,提供一次性开发服务,同时根据模型维护、迭代需求,收取一定的服务费。

 

Image Q首席数据科学家胡华告诉裸泳,客单价格需要根据挖掘的数量级来确定,一般都在百万级以上。


目前团队有近70人,CEO金俏是哈尔滨理工大学计算机及应用学士,武汉大学工商管理硕士研究生,长期致力于信息技术及应用专业工作。首席数据科学家胡华是武汉大学信息管理学院情报学博士,美国亚利桑那大学人工智能实验室项目组成员。CTO金勇是加拿大新布伦瑞克大学计算机科学博士,曾就职于加拿大国家研究院从事相似度分析以及深度信念网络等相关研究。首席架构师杜鲁拥有9年Java从业经验,曾负责Bank Mandiri和中国建设银行等系统研发项目。

 

据悉,Image Q在2016年底获得了2700万的A轮融资,投资方为湖北高投资本经营有限公司和武汉高投金运激光产业投资基金。此次投资主要看中了Image Q在大数据领域的技术优势、产品研发和团队潜力。


科大讯飞做语音理解,商汤科技做视图理解,而Image Q主要做文字理解


最早提出『大数据时代』的是全球知名咨询公司麦肯锡,实际上大数据在多个领域存在已有时日,只是因为近年来互联网与信息行业的迅速发展引起了人们的注意。随着社会高速发展和信息流通,大数据作为这个时代必然的产物,将会越来越多的应用到不同的领域,行业的决策将日益基于数据和分析作出,而非感性和直觉。

 

大数据技术即是让以前必须要超级计算机才能完成的工作,现在只需要多台普通服务器就能完成。提高了整体的运算率和处理能力。再结合数据挖掘和人工智能应用到不同场景中让数据产生价值。


近年来的代表大数据企业商汤科技


目前国内做大数据的公司可分为两类:

一类是拥有获取大数据能力的公司,如百度、腾讯、阿里巴巴等互联网巨头以及华为、浪潮、中兴等国内领军企业。另一类则是像Image Q这样初创的大数据公司。


在另一个层面与之不同的是,『科大讯飞做语音的理解,商汤科技做视频、图像的理解,而Image Q主要做文字的理解。』

 

Image Q利用NLP语义分析技术让计算机理解文本符号背后的知识,根据知识点之间关联进行知识推理,进一步给计算机构建不同行业的知识体系。


『两个人能顺畅沟通不是因为都会说话,而是因为有相同的知识背景。』胡华说。


对计算机而言,所谓的『知识背景』就是知识图谱和知识库。机器基于大数据库和行业语料库,再通过知识图谱进行关联学习,就能为各领域用户高效的提取文本中的精准信息协助其进行决策。


『我们希望为客户节约80%机械性劳动时间 把精力集中在那20%具有创造性的工作上,进一步提高自身竞争力。』


公安行业中经常需要查看几十万卷宗,以前需要10人左右的工作小组连续工作一个星期的工作量,现在Image Q可以用一台计算机在一个小时之内完成。


完善一个行业的知识图谱并非易事


随着文本信息的电子化,每个行业都有大量的沉睡文本可挖掘。胡华表示,只要是有文本数据需要挖掘的Image Q都可以合作。但现阶段Image Q瞄准于政府、公安等几个行业,因为完善一个行业的知识图谱并非易事。


原因是,文字是一种符号,任何一个字除了本身的字面意思外都有相应的衍生意义。让计算机理解这些符号很容易,但要读懂背后的内涵却很难,因为同一个词在不同行业、不同环境甚至不同地域都有不一样的含义。


例如,手机一词最开始出现时只代表『用于联系他人的通讯工具』,而随着手机功能的增加其内涵也在不断的扩大。

 

或者将『手机』一词放在电影行业,它就是一部由冯小刚导演、葛优主演的电影。由此可见符号的内涵是在不断进化和随场景变化的。



如果说建立行业图谱的难度是Image Q的壁垒,那么机会也恰恰来源于此。

 

胡华用『一个偏科的小朋友』来形容Image Q。


『更多公司偏向于利用大数据做搜索引擎等通用类平台,毕竟通用技术更符合大众。所以在差异化领域中,与Image Q竞争的公司很少。』 

 

并且Image Q着重于文本数据的分析挖掘,但并不限于文本数据。语音以及图像通过自然语言处理技术转化为文本数据后,一样可以进行挖掘与分析,同样视频的转化也在推进当中。


『这是一块非常空白、不成熟的市场,现在Image Q的任务不是占有市场而是去开拓。』胡华表示,『而仅仅图像处理的市场就是千亿级的。』


通用技术容易成为巨头,但也容易被替代


做垂直领域的语义理解虽然目标客户不及通用型产品多,但其不可替代性却是通用型数据分析产品无法比拟的。


例如同样做大数据分析的商汤科技,利用人脸识别、视频分析及图像对比技术,着重应用在金融与安全领域。



『这类型的技术有领域性,但没有知识量。』胡华说。


『这样的技术可以做到脱离业务,但当出现更精准的类似技术时,也很容易被替代。』

 

Image Q从2015年开始一直专注于做自然语言处理,到现在积累了大量的行业知识,来辅助这个只有语言理解能力的『小朋友』去构建不同行业的知识库。

 

『Image Q所做的文字的知识构建是深入到行业当中的,随着各个领域知识库的善,Image Q的业务可能只会越来越难被替代。』


- End -




精彩文章回顾 ☟


协作机器人会在武汉突破么? | 靠智能导游切入景区经济是个好生意吗? | 作为投资人,无形的东西比有形的东西更重要 | 打破刚兑,私募才有春天 | 踩上VR第一波浪潮的中国游戏开发商 | 发乎情的咖啡,如何不止于赔 | 雄安县永远也不会成为下一个陆家嘴 | 楚商集团李璟璟:“走心”投资,“掘金”医药 | 枫红资产万杰:理工男的并购经 | 光谷和硅谷的差距,不在产业,而在金融





原创内容,未经同意,严禁转载。

裸泳已进驻今日头条、新浪、网易、腾讯快报、搜狐、九派等,敬请关注。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存