查看原文
其他

[独家]大数据版穹顶之下:清华人气男模解码雾霾分布

2015-05-15 大数据文摘


点击标题下「大数据文摘」可快捷关注

大数据文摘原创内容,欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权。

【本期嘉宾】


【导读】:柴静的一部穹顶之下将对雾霾的讨论推到风口浪尖,与此同时在太平洋的另一端,一群来自中国大陆的合伙人也在针对雾霾展开一场大数据战场的较量。


怎样的“个人恩怨”引发了针对雾霾的创业?又是怎样的机缘巧合让三位创始人一拍即合?清华男模、国旗仪仗队成员、单车骑行西藏、阿拉斯加极地穿越……大数据原点栏目本期为您专访佳格霾图的情怀团队,直击他们的创业点滴,用大数据解密雾霾。


未来的“雾霾预警图” — 佳格“霾图”

佳格“霾图”是王蕴刚及佳格公司设计的一款基于环境大数据,对大气污染进行实时监测预警的产品。“霾图”用地图的形式实时展现我国任一地区的大气污染数据,并预测未来五天的空气质量。佳格“霾图”的实时数据目前每小时更新一次,空间精度为五公里。佳格计划将来做到每二十分钟更新一次,空间精度达到一公里。

用大数据直面雾霾这块“硬骨头”不仅需要充分准确的数据源、优秀的数据处理和可视化能力,更重要的是一种可以时刻激励自己奋斗下去的情怀,而王蕴刚的创业就始于这样一种情怀。


佳格霾图截屏


跟雾霾有“私人恩怨”的不只是柴静

很多创业者的创业灵感都来自一个不经意的“灵光一闪”,而佳格(GAGO Inc.)创始人王蕴刚对于空气的“情怀”却是从初中就开始酝酿了。


王蕴刚的初中同桌因为一次煤气中毒意外去世,那是王蕴刚第一次了解到死亡的无情,也是他懵懂的跟“有毒气体”结下梁子的开始。“很想知道这种无色无味的气体是怎么夺走人的生命的。”这个‘私人恩怨’ 到了高中进一步深化,“北京的沙尘暴那几年特别严重,沙尘过境的时候天空瞬间会变成橘子皮的颜色,坐在教室的倒数第二排都看不清讲台上的老师。” 王蕴刚如今说起自己的家乡还会苦笑,“特别恨空气污染,把我的家乡(北京)变成这个样子”。因为这个“私人恩怨”,王蕴刚高中毕业后毅然报考清华大学环境工程专业,并选择了当时并不热门的大气污染方向。


本科从清华毕业后王蕴刚选择去美国深造。从Texas A&MUniversity的研究生到Clarkson University的博士再到加州大学伯克利分校Lawrence Berkeley国家实验室的博士后,王蕴刚花了近十年的时间研究美国、加拿大以及墨西哥的大气问题。采访中他对于大气遥感知识和相关的国内外学派以及理论信手拈来、如数家珍,这为之后的创业打下了坚实的基础。


在美国做“中国合伙人”

与雾霾的斗争是一件艰苦的事业,一个人“单打独斗”总会有动摇的时候。“创业当中最难的是找到一个真正跟自己合得来的合伙人,这会是你动摇时候最坚强的后盾。” 王蕴刚在回忆自己的创业之路时把合伙人放在一个特别重要的地位上,他跟另外两个合伙人的创业之路也是一个发生在美国的“中国合伙人”故事。


博士后毕业的王蕴刚在一家全球环境咨询公司任空气污染与气候变化高级工程师。多年的海外留学跟科研经历并没有让他忘记跟大气污染的“私人恩怨”,创业的欲望一直在,他需要找到志同道合的人跟他一起迈出第一步。


王蕴刚的第一位合伙人是自己的高中同校师兄,也是在伯克利熟识很久的朋友张弓。张弓的本科就读于南京大学环境系,硕士就读于北京大学地理系,之后在美国犹他州立大学攻读遥感与卫星大数据的博士。两人相遇时张弓在湾区环境研究所工作,从业于同一领域并是校友的他们经常一起交流想法,渴望把复杂的科研成果转化成真正通俗易懂的产品供人使用。甚至还产生过把学术论文翻译成更通俗的语言发到微信上给更多人看的想法。


2013年1月,美国驻北京大使馆的PM2.5浓度监测数据爆表,纽约时报连续报道这件事。“我第一次看到对一个城市的空气质量的形容不仅仅是bad,还是crazy bad”, 王蕴刚一方面心里很痛,但一方面也觉得创业的时机到了。经过对政府政策,市场现状,盈利模式等多方面的深入考察,王蕴刚于2014年决定将公司定位成2B的经营模式,即向政府以及企业提供佳格“霾图”。 2B的经营模式对数据分析以及用户体验有了更高的要求。

第三位“合伙人”刘志成的加入解决了这个燃眉之急。刘志成是大数据可视化的专家,斯坦福的博士后毕业后在全球最大的数据可视化公司做核心产品的研究科学家。刘志成的入伙完善了佳格的创始团队。这个平均学历是博士后的环境大数据专家团队组成了佳格最核心最早期的“三人帮”。


佳格三位合伙人合照


佳格的运作模式

在中国环境方向做2B模式有两种可行的方向,一是跟国内行业的前辈公司合作,做软件产品出来,让感兴趣的环保机构来定制、购买以及使用自己的产品;二是直接跟政府环保部门合作。当佳格刚刚推出“霾图”的想法的时候,国家地方环保局对此已经表现出了浓厚的兴趣。


国内地方政府对佳格霾图的青睐与当时环保局一个新的政策有关:在未来五年内在全国范围内推行大气污染预警系统。国内的大气污染的数据来源主要是通过地面监测站点,而目前中国的地面监测站点还非常不完善,尤其在西部地区非常少,短时间内要进行大气污染预警在这些地方难度很大。佳格“霾图”可以作为地面站点采集到的数据的很好的补充,节省政府基建费用。这也是国内目前非常流行的 PPP(private public partnership)模式。


从不同的国际卫星拿到数据源

做环境大数据,首先要拿到准确的数据源。佳格霾图的数据源主要来自几个不同国家的极轨卫星,静止卫星和激光卫星。据王蕴刚叙述,这些卫星数据是公开的,它一直在往地球发射信号,理论上只要有接收器就可以搜集卫星数据,并且全球无死点,各地数据都是可以拿到的。

极轨卫星每天两次飞越地球表面上的同一个点,而且总是在同一个钟点(极轨卫星所在的瞬时轨道平面与太阳始终保持固定的取向,可以使得卫星所经过地点的地方时基本相同,卫星遥感探测资料具有长期可比性。由于这种卫星轨道的倾角接近90°,卫星近乎通过极地,所以称它为“近极地太阳同步轨道卫星”,简称极轨卫星。)。它的优点是空间分辨率高;不同于极轨卫星,静止卫星则定点在某个地方,每二十分钟提供一个采样点,优点是时间精度很高;激光卫星,则能给大气污染物垂直方向分布有一个测量,人的呼吸空气是地表空气,而前两种卫星测量大气高度相对较高,所以这个卫星可以纠正之前的数据。

三种卫星的数据融合后,再加上地面数据进行矫正。地面数据首先包括从交通部门拿到的车流量数据。王蕴刚举了个例子,“比如某个地方车流量很大,该地区空气质量就会比较差”。除此之外,地面数据还包括了地形数据,气象数据等。


佳格霾图的数据存储、整合及算法

佳格在初期从Amazon WebService (AWS)租了入门级的服务器来存储数据。随着产品的不断开发,此存储器已远不能满足数据的需求量。现在佳格使用的是AWS的升级扩容版的服务器,但是存储量依然不能满足实时的需求 - 只留存三十天的数据,并且只储存处理过的数据而不是原始数据。从卫星和地面收集的原数据量极大,实时的话每小时就可以达到数十GB左右的数据。未来佳格将会把服务器搬回国内,使用国内的数据服务器来存储佳格所需的环境大数据。


对采集到的大量数据,需要进行整合处理才能用来生成佳格霾图。佳格霾图的数据算法主要包含两个任务:


(1)数据同化和实时展示任务。佳格可以拿到的卫星数据主要分两种,一种是时间分辨率高的数据,一种是空间分辨率高的数据,佳格需要把这两种数据进行融合;同时卫星并不会直接给出PM2.5的测量数据,而是一类的光学指标,其中包括大气气溶胶光学厚度(aerosol optical depth)。佳格利用基于不同城市的自主研发的算法将这个变量计算出准确的PM2.5浓度值,并在“霾图”上实时展示。

(2)预测任务。现今国内空气质量预测主要有两种传统方法:第一种是根据大气物理化学(污染物的沉降,运输和扩散以及二次气溶胶反应)的经典算法跟污染物排放清单的集合对未来大气情况进行推测;第二种则是基于数理统计模型方法,比如拿到过去十年的数据,通过对时间序列的季节性,趋势性进行分析来做预测,最终辅以人工判断。这两种方法主要使用的都是地面监测点提供的数据,并没有用到卫星数据。同时国内排放清单数据存在时效性弱的弊端,并且地面监测点分布不均且数据容易受到人为因素的影响。这样所得到的预测结果存在着极大的偏差和局限,准确度较低。

相比这两种传统方法,佳格所开发的预测方法和模型具有自己的特点:首先,佳格做预测的数据是更精确均匀的卫星数据。其次,佳格运用模型最优化方法,综合考虑多种国际上最先进的气候预测模型,通过算法选出动态的最合适的预测模型,用于预测未来五天内的空气质量情况。


佳格的未来 - 用大数据“雪中送碳”

“通过卫星大数据其实可以解决很多环境问题”,王蕴刚希望未来的佳格能够用大数据解决更多人们关心的问题。除了“霾图”,王蕴刚认为农业也是一个很有发展潜力的方向,卫星数据可以反应出地表植被,花期,作物何时成熟,土壤肥度,何时降水,地下水分布等农民关心的问题。“希望我们能够通过大数据产品解决农民耕种的实际问题,像何时耕种,种什么更高效,提高农作物产量等等,相比‘锦上添花’的产品,我们更希望自己能够‘雪中送炭’。”


小编的话:王总充满磁性的声音、幽默的语言、清晰的逻辑让两个小时的访谈轻松愉快。王总采访间隙中还和小编们爆料曾经“清华人气男模”以及“国旗仪仗队队员”的难忘经历,并和小编们分享了即将做爸爸的喜悦。这让小编们深切体会了一把这位曾经的“人气男模”、现今的佳格公司创始人、未来的“好爸爸”的个人魅力。


另外王总一直强调跟几个价值观合拍的合伙人一起做一件有意义的工作是特别幸福的事情。这一点小编们也深有体会,大数据文摘聚合了一批对大数据感兴趣、来自世界各地的志同道合的小伙伴,跟原点栏目一起工作的每天都充满乐趣,也欢迎对大数据及创业感兴趣的各位读者加入我们。回复“志愿者”可了解更多信息。


采访结束之时,王总还特意让小编带给大数据文摘原点栏目的读者一些自己的创业及工作上的启发。小编在此原文附送。

王蕴刚任清华国旗仪仗队成员照


王蕴刚给读者的话:

给创业者:

首先,创业当中最难的是找到一个真正契合的合伙人,现在回头看创业这条路很难,特别是当还没有完全退出自己之前工作的公司的时候,很多诱惑,有时候会想不如继续呆在原地,这个时候合伙人就是自己坚强的后盾;其次,创业公司早期人数不要多,2、3个人互相支持,是比较合理的方案;最后,我觉得创业不分老幼,如果觉得自己目前已经准备好了了,觉得能够很好的时间管理,就可以了,逼自己一下,人的潜力是很大的。

给大数据行业专家、工作者及爱好者:

大数据是一个比较新的行业,但是这个行业往前发展的前景非常光明,就像第四次产业革命,堪比瓦特发明蒸汽机,会颠覆很多传统行业,如果你们能坚持在这个行业,以后会有非常好的发展,如果想创业,目前也是一个非常好的创业时机,可以出来试试看。佳格目前在擂鼓征召海内外各类大数据行业技术人才,有感兴趣的朋友请直接与佳格取得联系。


给投资人:

佳格公司目前处于天使轮融资阶段,我们欢迎价值观以及专业背景与我们锲和的投资人入伙一起做些能写进未来史书的事情。


采访撰稿|阚玺 魏子敏 于丽君

感谢佳格(GAGO Inc.)提供相关资料及图片

大数据文摘原点栏目
“原点”
坐标中的定位点、起点,万事开头难,但只要起步,一切皆有可能。2015年初, 大数据文摘“原点”栏目成立。这是针对大数据初创公司的采访栏目。通过在线采访的方式,对与大数据相关的初创团队进行采访,介绍项目、技术、商业模式。初期,我们的采访对象是美国等发达国家的大数据相关的初创企业,他们一般已经获得天使或A轮投资。

我们希望通过“原点”,为读者打开一扇门,看到国外“大数据”初创公司是如何启动、运营的,看到这些创业公司后面的人、团队有着怎样一种情怀。同时我们也会真诚帮助那些愿意在“大数据文摘”平台接受采访、分享创业经验的企业。只要你的公司有价值,愿意与读者分享。我们就愿意免费采访您。

大数据文摘从2013年7月成立至今,每日坚持分享优质文章,从未间断。已有读者超过15万,是微信上最有影响力的大数据自媒体。原点栏目组由在北美各大应用领域(医疗,电商,咨询等)从事与大数据相关工作的具有高学历及数据专业背景的成员组成。

我们欢迎更多乐于分享的创业公司与我们邮件联系,邮件中请附上您的公司简介及相关诉求,邮件发送至origin@bigdatadigest.cn
原点栏目成员
有意联系栏目组成员的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢。

原点栏目主编。美国伦斯勒理工学院决策科学专业博士学位。现任RetailMeNot, Inc.的资深决策分析师,负责运用统计测试及最优化分析提供产品方案的决策建议。希望通过原点平台与致力于大数据领域创业的朋友互相交流学习。
刘小娇
盖洛普咨询高级统计分析师及品牌战略咨询师、《阿里商业评论》特约撰稿人。现居美国华盛顿特区。任盖洛普多项全球调查及美国居民幸福指数实时调查首席分析师。合作撰文内容涵盖政治、经济、国际金融、健康等领域。从事各项数据分析及可视化工作。如有对移动医疗领域、统计建模、大数据应用及可视化感兴趣,有志创业的同仁,请给她留言。
魏子敏
香港中文大学新闻学硕士。硕士期间利用大数据分析媒体报道的政治偏向,2012年美国大选期间参与美国加州民主党竞选工作,搜集选民数据并统计数据反映的政治走向。希望使用更科学的数据做更好的新闻,望与更多志同道合的朋友共同交流进步。
于丽君
本科硕士毕业于清华大学数学系,硕士研究课题为图像修补问题建模,目前为美国Case Western Reserve University应用数学在读博士,研究方向为贝叶斯方法反问题建模,博士研究课题为利用MEG(脑磁成像技术)时序信号对大脑活动进行定位,对数学建模、机器学习、人工智能以及图像处理等方面有广泛兴趣,希望可以通过原点栏目组,结识更多相关领域的朋友以及有志于创业的同仁,互相交流进步。
郭曼桐
清华新闻与传播学院2005级本科,毕业后在新华社工作,主要参与CNC World英语台的电视节目制作。曾被新华社派驻至美国华盛顿任驻外记者。曾参与美国大选、美国政府关门风波、IMF和World Bank年会等报道。
原点栏目采访联络人, 04年兰州市高考理科状元,清华数学本科,美国马里兰大学数理统计博士。博士论文研究眼动数据(eye tracking)在医疗、市场营销方面的应用;同时关注HIV药品的临床数据分析。目前在美国某大型银行做量化分析,构建房地产贷款的信用风险预测模型(credit risk model)。期待通过原点认识更多有志于大数据相关产业创业的朋友。同时现正组建自己的团队,为顾客提供大数据咨询服务(分析,建模,解决方案,模型测试等),有项目需求者请联系: smallbear@bigdatadigest.cn.

大数据文摘精彩文章:

回复金融 【金融与商业】专栏历史期刊文章

回复可视化 感受技术与艺术的完美结合

回复安全 关于泄密、黑客、攻防的新鲜案例

回复算法 既涨知识又有趣的人和事

回复谷歌 看其在大数据领域的举措

回复院士 看众多院士如何讲大数据

回复隐私 看看在大数据时代还有多少隐私

回复医疗 查看医疗领域文章6篇

回复征信 大数据征信专题四篇

回复大国 "大数据国家档案"之美国等12国

回复体育 大数据在网球、NBA等应用案例

回复平安 中国平安相关大数据案例、新闻

回复志愿者了解大数据文摘及如何加入

大数据文摘ID:BigDataDigest

专注大数据,每日有分享

覆盖千万读者的WeMedia联盟成员之一

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存