特辑 | 十位大咖热议跨语言大数据:任何人不该拒绝大数据时代到来
【编者按】7月30日,全球首款跨语言大数据产品“译见”发布会在京举办。发布会以“绽放”为主题,分为两场高端访谈及主题发言等环节,与会嘉宾思维碰撞,共话大数据的发展与未来。
活动以绚目的激光秀表演开场,博得了现场嘉宾的阵阵掌声。随后,进入第一场高端访谈环节,美女主持李扬薇邀请中国出版集团副总裁潘凯雄、清华大学数据科学研究院执行副院长韩亦舜、思科Cloud & XaaS大中华区总经理高亚滨三位嘉宾围绕“跨语言大数据”这一新生概念进行了观点碰撞。
活动由北京卫视《北京新闻》主播李扬薇主持
高端访谈一:如何应对大数据时代的到来?
中国出版集团副总裁潘凯雄认为,对于目前市场上的大数据平台来说,有两个东西很重要:第一,要有巨大的数据支撑,如果没有一定量的数据支撑,发布的东西就是很苍白的,是立不住脚的;第二,对庞大而杂乱的数据应该如何梳理?就需要有将数据和人文结合的本事,如果缺少这两个本事,一定会陷入这个大数据当中难以自拔。
中国出版集团副总裁潘凯雄
潘凯雄表示,利用大数据来服务于出版业,也要遵循这两点,一方面一定要获取大数据,另一方面要用清醒的头脑和人文眼光来使用这些数据。这样,这个数据才是有意义的。
韩亦舜:任何一个人不应该拒绝大数据时代的到来
清华大学数据科学研究院执行副院长韩亦舜从专业的角度解读了大数据对于我们的生活以及整个社会的产业所带来的影响和变革。他提出,大数据已经慢慢走近人们的生活,我们任何一个人在心理上不应该拒绝大数据时代的到来,应该用大数据积极改进我们的现在,迎接未来时代对我们的挑战。
清华大学数据科学研究院执行副院长韩亦舜
对于大数据这个概念的理解,韩亦舜认为,应从两个维度来理解大数据:一个是技术手段,一个是思想方法。大数据在工具手段方面对各个行业都有推动作用,在思想方法上对各个领域都有引领作用。作为工具手段来说,例如在出版行业,微小说、各种新兴的传媒、微视频等等都属于出版的不同形式。作为思想方法,它带来了一些全新的视角,比如译见大数据平台所拥有的数据资源是否可以加工出来呈现给我们的服务对象。这是一个新的推动作用。
思科Cloud & XaaS大中华区总经理高亚滨
思科Cloud & XaaS大中华区总经理高亚滨分享了她对跨语言大数据的看法,她认为IT行业跟传统行业与大数据息息相关,这可能是第一个感受到大数据冲击的一群人,大数据正在越来越紧密地和各行各业结合起来。那么,如何理解大数据?高女士分享了三个关键点:
第一,这个数据足够大,有足够多的数据,也就是有非常多的地方放这些数据。比如IT的存储行业,从存储芯片、经源等等行业,非常敏感地感受到全球数据量的增长,这是非常可能的指标。
第二,数据有了,我要把它用起来,这里面又有关键的行业,这个数据能不能按照我想的传输方式,传统路径到达我想要的地方。
第三就是网络,让数据变得更加有用,就要多多利用计算机,利用计算平台。数据有了,就要靠计算平台,对计算的需求能帮助我们把数据真正用好。
高端访谈二:如何挖掘大数据的商业价值?
在第二场高端访谈环节,约克大学正教授及终身教授王晓刚先生、北京腾云天下科技有限公司首席布道师鲍忠铁先生、建飞科联科技有限公司徐屾屾先生就“大数据海外市场与商业价值挖掘”主题进行了探讨。
多伦多约克大学教授王晓刚在高端访谈,以医疗行业的胎儿脑缺氧研究为例,指出大数据有一个实时分析概念,即在很短时间内做出判断,同时,不仅要算出来,还要在实时的情况下在规定范围内要得出一个结论。也就是说,必须用很简单的办法算出很精准的东西,这是大数据一个新的挑战,要实时算出来,这也是大家进军的一个方向。
多伦多约克大学教授王晓刚
北京腾云天下科技有限公司(TalkingData)首席金融行业专家、首席布道师鲍忠铁在高端访谈时提到,在中国的行业里最早使用大数据的案例是用于商业情报分析,应用场景非常广泛,造成两三年内许多机构的对外投资都是世界最多的。我们可以利用大数据,针对不同地区所投资的产业,特别是对信息采集容易中断的非洲或南美洲地区进行深度、精细的情报分析,对整个投资在国外的销售情况和企业国外发展情况,甚至人员在国外的安排情况都有一些助力。
北京腾云天下科技有限公司首席金融行业专家、首席布道师鲍忠铁
北京维太格科技有限公司CEO徐屾屾在高端对话环节表示,在4G时代所有通讯公司已经获得了传统的数据能力,数据的深度和广度都是全球的。通过数据分析,通讯公司都在为用户提供更加个性化的通讯服务和通讯产品。他相信未来最大的发展趋势是融合,美国一个非常有名的通讯公司已经把自己触角伸展到互联网之外。如果把用户领域和市场数据进行融合,产生更加精细化的数据并进行分析,就能更全面地了解用户,以此更好地为用户提供服务。
北京维太格科技有限公司CEO徐屾屾
他还提到了互联网公司正在向运营商领域进行拓展,并举例称,前两天Faecbook说他们正在做无人机,他们想让无机人带着APP在全球飞来飞去,为全球提供免费的wifi网络,而这个想法很早Google就已经提出了。
他介绍说,全球的运营商都在架设新的移动物联网,通过这些物联网能够更加清楚地了解人与物、物与物之间的联系是怎样的。通过这些信息分析,运营商能够更好去连接人和人,人与物,人与服务之间的关系,他相信大数据能够提供更好的连接服务,创造更大的价值。
主题发言:跨语言大数据带来新的机遇
ROOBO联合创始人兼CEO刘颖博在作主题发言时表示,大数据已经火了很多年,这个概念也已经存在了好久,一直感觉它是深不可测的。
ROOBO联合创始人兼CEO刘颖博
从互联网跳到智能硬件行业的刘颖博,对智能硬件行业跟大数据的关系颇多感触。他认为,从今天开始,我们要把人们从纯粹的互联网中拉到物理互联网里。物理互联网基础就是智能互联网硬件,于是就有了“IoT”的概念,也就是万物互联的概念。
他说,在IoT这个世界里,一切都是入口。手机作为一个入口,已经延伸到传感器身上,各种交互方式、各种场景,以此造成一个无限可能性,这给大数据造就了一个特别天然的舞台。
他表示,在整个IoT整个世界里,数据根本就不是我们想象的“快速增长”,而是“快速爆炸”的,万物互联时代是大数据天然的战场。这个数据到底有多大?比我们互联网看到的数据大得多。
他还表示,提到共享和共赢,就想到最大最难的一件事情——跨语言处理。ROOBO虽然是一个创业公司,但已经启动了全球化的进程,在东欧、西欧、北美、韩国、日本等等都有市场和人力。这就面临一个问题——是否能处理好不同语言的人工智能对话?
他介绍说,他们的人工智能对话可以做中文、英文、俄文等这样一系列语言,但这里面也有很多困难,它绝对不是简单的翻译,因为这是完全不同的语境的语言处理和语言挖掘过程。如何克服这些困难?这就需要合作共赢。他认为,一家公司不能单打独斗做大做强,必须要跟各种各样的类似于中译语通这样的顶级合作伙伴一起把行业吃透。只有这样,才能在大数据、智能硬件、人工智能这些未来的红海里面,继续生存下去。
虎扑体育营销副总裁曹蕾在主题发言中以虎扑体育与大数据的关系为例,分享了大数据对体育传播的颠覆影响。曹蕾表示,虎扑通过大数据分析发现PC与移动端的运动人群分布不同。他还与大家分享了数据所发现的一系列有趣现象,例如,从跑点数据来看,很多人认为女孩子非常爱美,她们在运动准备中对装备花销费用是非常高的。但是从数据调查中来看,真正爱美的是男生,比女生要高很多;跑者中女生大多是单身,爱跑步的男生大多是已婚的大叔;足球喜爱者偏成熟一些,篮球爱好者大多数是小鲜肉;广东对体育成熟度非常高,上海对足球偏多一些,北京对篮球偏爱更多一些;对运动人群也做了区分,发现爱自拍在运动人群当中,不单单是女生的特权和爱好,在男生当中也排到第二的位置。
虎扑体育营销副总裁曹蕾
曹蕾称,这些数据表明,许多真实现象和我们潜意识中的认知是不一样的,大数据真的能颠覆我们很多对传统体育的观点和看法。
他表示,很多的体育需要用大数据来解释,很多领域也都有大数据,将来会着重通过四个方向在大数据上与中译语通合作:
第一,通过大数据开发一些结果推动对产业做一些贡献,同时对体育行业做一个非常深的行业研究。
第二,在大块的校园阵地针对校园人群、草根人群做非常详细的分析。
第三,针对职业体育,接下来会做很深的研究。海外足球希望到中国做宣传,中国市场的声音对他们的数据,对他们的球队,对这些俱乐有什么样的想法?对他们抱有什么样的态度?我们未来都可以用大数据告诉他们,也是他们在中国发展非常好的工具。
第四,针对中国的人群和地域去发展,不同地域的人群差异是非常大的。中国目前比较发达的区域是北上广深,除了这些地区以外,其他地区的体育产业、体育项目未来可以怎么做?可以做什么样的产品,为他们提供怎样的服务?对此他们将做一个非常详细的调研。
万方软件董事长吴广印结合大数据和科技做了主题发言,他认为,大数据主要解决从信息服务到知识服务的最大理念。大数据知识服务应转化成个性化服务,通过访问语言分析人的爱好和能力,其中,分析人有什么样的能力是最重要的层次。
万方软件董事长吴广印
在各个产业逐渐被大数据渗透的时代背景下,吴广印肯定了中译语通的“跨语言大数据”的整合理念,他认为,当前中国突飞猛进的发展、日益增强的国际沟通和全球数据的获取所面临的最大问题之一就是语言问题。因此,“跨语言大数据”在这个时代显得格外重要。
吴广印提出,我们需要构建科技服务联盟,建立多语言智库,在全球范围内构建智库,避免误判。现在我们需要世界了解中国,我们需要给世界提供中国的服务。
北京联讯维康科技有限公司CEO王彦在主题发言中表示,译见大数据平台涵盖了面向医疗的大数据,由于医疗大数据80%都是非结构化的,这就体现出了译见的优势。译见大数据是全球化的跨语言数据平台,不仅限于国内,这也是医疗行业将来借力这样一个大数据平台的非常差异化的优势。
北京联讯维康科技有限公司CEO王彦
王彦还特别提到了“开放”,他表示译见大数据的开放能力是面向全球获取数据并进行挖掘的能力。他说,在整个互联网领域来看,医疗的数据量是非常庞大的,比如美国国立图书馆从1996年到现在的文献和资料,搜索引擎可以提供600万条的记录,这些都是开放的数据;如果再加上医疗的研发、保健领域,这些数据其实已经是非常海量的数据,只不过还没有加以很好地分析和挖掘。
王彦认为,译见的大数据平台可以为医疗机构提供完整的数据分析工具以及动态分析能力,还能在数据决策层面帮助医院管理者快速解决决策问题、临床问题等。但是仅仅改变医院医疗体系是不够的,这个过程也是漫长的。北京联讯维康科技有限公司与中译语通一致认为要建立医疗产业的联盟,从推动数据上下游的建立来激发大数据的价值和发挥。
据了解,目前跨语言的大数据市场还处于空白,但是面临着跨国业务市场需求的与日俱增,它正孕育着一个前景无法限量的巨大商机。译见由此而生,它可以为企业的品牌、产品,竞品进行监测和分析、行业分析以及海外商机的挖掘,热点事件的发现和重大热点事件分析,同时也可以为政府、企业、高校、媒体、科研机构、公关公司、数据公司、咨询公司、译见的潜在用户等进行跨语言的政策信息监测。
推荐阅读
您对跨语言大数据的见地,欢迎与我们分享交流。来稿请致:media@yeeworld.com。