#榜样的力量#天玑数据大脑疫情风险感知预警平台“智疫通”丨数据猿新冠战“疫”公益策划
“该项目案例由中科天玑数据科技股份有限公司(简称:中科天玑)提交申报,参与数据猿推出的《寻找新冠战“疫”,中国数据智能产业先锋力量》的公益主题策划活动。
大数据产业创新服务媒体
——聚焦数据 · 改变商业
疫情期间,大数据、人工智能、5G等数字技术的应用,成为抗击疫情的“新式武器”。天玑数据大脑疫情风险感知预警平台“智疫通”为公众提供疫情趋势智能预测、智能问答、态势分析、风险感知、信息速递等各类相关权威内容及助理服务。
“智疫通”能够近乎真实反映流行周期内的疫情速度趋势,及时了解话题态势和热点关注,溯源传染源聚集地和潜在受感染者,在疫情期间被广泛应用,为科学防治、精准施策提供数据支撑,服务于国家政府部门和大众。
目前,“智疫通”已通过发布疫情预报、政企合作、实践教学等形式对外推广。
项目开发起止时间:2020年2月4日启动,2月8日上线。
应用场景
一是对互联网海量多源异构数据实时采集、分析、监测,采用自主研发的自增强泊松过程模型预测疫情态势,基于深度语义匹配技术支持疫情防护知识传播,对病患行为轨迹、治疗药物研究等维度进行时空关联图谱分析,为有关部门提供疫情传播规律与风险感知预警,助力精准复工复产;
二是依托“天玑数据大脑智能机器学习平台”及相关教学资源,培养学生成为大数据分析人才,科技助力“复学复课”;
三是支撑安防等部门对互联网舆情有效监测,通过自然语言理解算法和模型,应用互联网海量多源异构数据的深度分析与挖掘,形成人脑决策和计算机智能共生的大数据分析环境及工具系统,萃取重大战略情报;
四是为行业开发者提供开放式应用开发平台,在金融、能源、工业制造等传统行业,依托该平台快速构建智能算法和模型,提升传统行业效能,构建大数据智能技术生态,加速企业在各业务场景的落地,赋能大数据企业复工复产。
面临挑战
疫情过后,经济增长会面临更大的压力。整个社会将重新审视数字技术的价值和企业的社会责任感,中科天玑作为大数据企业更感受到了技术创新的紧迫性和使命感。大数据、人工智能不仅仅在应对突发公共事件,公共安全治理、提升城市运行效率,医疗技术攻坚等关键领域大有可为,在更广阔的产业领域,在帮助各行各业智能化升级方面,更将发挥核心引擎的作用。如何将积累的大数据、人工智能技术快速应用到疫情场景,将大数据赋能防疫及重大灾害,是疫情带给科技企业的灵魂考题。
一是全新的理论挑战。面对突如其来的新型病毒肆虐,在疫情初期医学对病毒的研究尚未得到权威结论的情况下,经典传染病传播模型SEIR并不能完全准确的反应疫情走势。因此,何种理论模型能够基于现有数据以及病毒特点进行疫情精准分析,是研发过程中亟需解决的问题。经过多番论证及优化后,团队提出自增强泊松过程(Reinforced Poisson Process)模型对此次疫情传播趋势进行分析和预测。
二是全新的团队协作。疫情爆发初期正值春节假期,但为公众和政府提供风险预测预警刻不容缓。中科天玑产品研发团队从正月初六就开始连轴转,从最初的设计构想不断完善成为精准可用的疫情风险感知预警平台,向社会展示了科技型企业赋能抗议及重大灾害中的积极作用。
三是全新的用户领域。中科天玑长期服务于党政军行业用户,“智疫通”抗疫平台将原本应用在宣传、网信、安全、政法、军工等领域的大数据智能技术快速应用到疫情场景,面向公众和政府提供准确可靠的信息服务,并根据疫情演变情况,进一步研发拓展其功能,数据不仅覆盖国家卫健委、各地卫健委、权威媒体官网的公开信息,更依托“天玑数据大脑”,不断学习矫正,确保数据信息安全可靠、实时全面。
实施过程
天玑数据大脑在基础设施平台层面,把共性技术整合成技术平台,从数据采集、存储、治理到算法模型,打造云、大数据、智能服务的融合共性平台,支撑企业级大数据智能应用。
“智疫通”基于天玑数据大脑,整合天玑数据采集平台(WDE)、大数据存储管理平台(BDE)、智能机器学习系统(BDA)、舆情监测系统(TechRoute)和智能情报分析系统(GoIN)等技术,提供“智能预测”、“智能问答”、“态势分析”、”风险感知”、“信息速递”等服务,帮助国家政府部门和大众针对疫情感知、分析、预测、行动,根据疫情发展态势采取有效防控防护措施并进行实时调整,随时获取相关指导信息。
可视化智能机器学习系统(BDA)是集数据预处理、模型训练、预测、评估、应用发布为一体的一站式大数据智能分析挖掘平台。“智能预测”功能基于天玑智能机器学习系统(BDA)生成,采用自增强泊松过程(Reinforced Poisson Process)预测模型对此次疫情传播趋势进行分析和预测。
该预测模型根据以下三个微观机制的影响来建模个体被病毒感染并发病这一疫情传播的动态过程:1)病毒传染性,即病毒自身的传染性对最终的感染人数起决定作用;2)级联传播所带来的自增强效应,即病毒当前的感染人数越多越容易进行新的传播感染;3)病毒传播的时效性,即随着时间推移,病毒感染人群继续感染他人的可能性会下降。例如,对于某个传染病 d,其感染人群动态过程建模为一个速率为:
图2:全球疫情趋势天玑智能预测
如图2所示,以6月17日数据为例,实际总确诊数为83293,预测总确诊数为83309,误差率为0.02%,近乎真实反映了流行周期内的疫情速度趋势。BDA平台将根据数据变化情况不断调整算法、迭代优化模型,为公众提供更加智能与精准的预测结果供参考。
“智能问答”功能基于深度语义匹配的信息检索技术,面向大众科普问答有关病毒传播、实时情况、医学信息、防护知识等。疫情期间,各类信息和人们的生活息息相关,如个人防护指南、确诊治愈人数、工厂复工复产等指导信息。帮助用户快速从大量疫情信息快速方便获取需要的信息是Infobot的设计初衷。Infobot是信息驱动的对话机器人定制系统。通过该系统用户可以快速根据自己的数据构建对话机器人。支持的用户信息形式更为丰富:无结构文本、历史问答、表格等,从而支持文本检索、搜索问答、FAQ、表格问答等多种对话形式。
疫情期间,利用疫情数据和Infobot定制出NCP问答机器人小天,用来帮助人们快捷准确获取回答疫情相关信息。从卫健委采集疫情数据形成表格,基于表格问答技术,帮助用户快速了解各地疫情情况。从权威网站采集大量问答对,涵盖个人防护的各种细节,帮助群众做好个人防护。从权威新闻网站100多万新闻数据,进行全文索引查询,并加入深度语义匹配,帮助用户快速获取疫情相关消息。
图3:天玑疫情智能问答助手
“专家预测”功能收集整理各大权威专家与机构发布的疫情相关预测;“模拟预测”功能基于经典传染病传播模型SEIR原理,通过网民自行调节“人员接触”参数,模拟可能的疫情结果,直观感受隔离对疫情防控的影响,并可针对“感染增速何时下降?”提出自己的观点。
图4:模拟预测与专家预测观点
“态势分析”功能针对疫情期间的舆论话题进行分析,包括整体态势、媒体态势分析及网民态势分析模块,通过“天玑数据大脑”对海量网络信息进行实时的自动信息采集、分析、汇总、监测、并识别其中的关键信息,及时了解话题态势和热点关注。
图5:态势分析
“信息助理”功能针对网友关注的疫情防护与保障,推荐实用工具与资讯。其中“工具推荐”提供第三方疫情防控工具服务,如天玑疫情智能问答助手、新冠肺炎小区查询、个人防护能力测试等;“热点关注”展示最近一段时间内网络关注热门话题,为政府及企业能够及时掌握当前热点话题风向提供支撑;“疫后保障”功能展示政府及社会各界出台的各类利民、优惠政策、企业复工保障等内容;“个人贴士”功能展示个人防疫知识、健康习惯建议、自我心理调节、远程办公技能等内容。
图 6:信息助理
天玑智能情报分析系统(GoIN)通过对覆盖政治、军事、经济、社会等方面的大数据关联融合,辅助用户从大数据中萃取重大情报,实现人机协同的情报深度可视化分析、快速研判、智能生成与协同决策。“智疫通”基于GoIN对全国疫情发展态势、不同时空的演化对比、确诊患者行为轨迹、治疗药物和研究单位进行时空关联图谱分析,综合分析确诊病患、疑似病患和密切接触者的行动轨迹,准确刻画跨地域漫入、漫出的不同类别人员的流动情况,追踪高危聚集地和潜在受感染者,进行疫情传播规律与风险感知预警,指导防控和复工复产,加快产业经济复苏。
首先,将各省市公布的患者行为轨迹数据拆分成省份、城市、患者、轨迹事件、活动地点五类节点进行处理。截止到2020年2月18日,共收集数据包含30个省份(湖北省未公布)、316个城市、4159例确诊病例、17417条轨迹事件、4416个活动地点。该五类节点之间存在如下四类关系:1)患者与轨迹事件;2)患者与活动地点;3)活动地点与城市;4)城市与省份。
根据收集到的数据,采用PageRank算法展开多维度分析。
一是进行节点重要度分析,以反映地区疫情的严重程度。在省份层面,黑龙江省、河南省、重庆市、湖南省这些省份排名靠前。以黑龙江省为例,如图7所示,可以看到黑龙江省下属的地级市的患者活动地点(蓝色点)都较多,并且有四个地级市(哈尔滨市、双鸭山市、牡丹江市、七台河市)的患者都在“哈尔滨冰雪大世界”活动过。
图7:黑龙江省各市的患者信息
在城市层面,黑龙江省哈尔滨市、湖南省常德市、河南省商丘市、湖南省株洲市排名比较靠前。在患者活动层面,珠海站、湖南省株洲市腰潞镇横屋村,黑龙江省双鸭山市友谊县宝盛超市、黑龙江省哈尔滨市九丰家园、惠东万科双月湾、广州南站等地点排名靠前,这些地点确诊病例患者活动较多,可能出现聚集性疫情。
图8:腰潞镇横屋村患者信息
二是进行社区发现分析,聚类出“中山大学附属第五医院”、“友谊宝盛超市”和“苗姓、冉姓家庭”三大社区,患者活动地点与节点重要度分析结果相印证,证明病毒的社区性和家庭性传播是值得注意的。
图9:友谊宝盛超市社区
“智疫通”同时对疫情变化进行时空分析。基于2019年12月1日至2020年2月20日的全国疫情数据进行分析后发现:1)从全国疫情变化层面,可看出疫情是由武汉向周边城市逐渐扩散;2)从湖北疫情变化方面,武汉周围城市疫情最严重的;3)将疫情严重的湖北与浙江疫情变化进行对比,发现两个省的疫情模式完全不同。湖北主要从中心城市武汉向外发散,浙江主要从沿海城市温州向内发散。
研究单位和药物关联也是重要的分析方向。在研究单位活跃度层面,较为活跃的有华中科技大学同济医学院(一共进行了15项临床课题研究)和浙江大学医学院附属第一医院(一个合作课题和8项独立研究)。在研究单位间的合作层面,当前研究合作较密切的有湖北、天津、北京等地中医院。在治疗药物及其手段方面,发现研究课题中最受关注的的药物或手段主要有三类:氯喹类药物(至少有15项课题围绕该类药物开展)、洛匹那韦/利托那韦片(围绕其开展的课题研究至少8项)、中医药相关药物的研究:包括金银花,双黄连口服液,连花清瘟颗粒等(围绕其开展的研究至少有10项)。分析发现氯喹和金银花是研究药物的两项重要成分。
图10:研究单位合作
图11 :治疗药物及其手段
应用效果
目前,根据“智疫通”平台发布的多期全球疫情趋势智能预测日报,内容涵盖疫情快讯、趋势预测、热点关注、互动话题,服务于大众。此外,推送多期疫情舆情分析报告和简报给政府主管部门,并配合对疫情传播过程中的线索做专项分析,为政府提供疫情防控决策参考。
“智疫通”与中再集团合作,推出“再·医”平台疫情预测研究与舆情态势分析功能,“再·医”平台依托国家卫健委、国资委、国家疾控中心、国家气象局、中国人寿、丁香医生及多家国内科技企业,充分发挥政企协同优势,汇聚疫情防控、疫情预警、疫情地图、实时播报、辟谣与防护、在线就医诊疗等方面的数据和专业服务能力。其中,“共抗疫情”频道开辟“风险自评、疫情动态、疫情预测”栏目,帮助海外国人提升疫情风险防控意识,增加风险抵御技能,提供更全面的智能化疫情防控服务,共同守护“一带一路”沿线国家国人的健康。
在“停课不停学”背景下,山东财经大学应用“智疫通”将疫情大数据建模与预测融入远程实践教学,组织近百名师生进行线上模拟预测与分析实战,产生良好的示范作用,促进校企融合“复学复课”,为进一步建立长效合作机制,服务社会提供了契机。
将来,“智疫通”还将根据疫情演变情况,进一步研发拓展其功能,为公众提供更全面的风险感知预警服务,数据不仅覆盖国家卫健委、各地卫健委、权威媒体官网的公开信息,更依托“天玑数据大脑”,不断学习矫正,确保数据信息安全可靠、实时全面。
关于中科天玑
中科天玑数据科技股份有限公司成立于2010年1月,是中国科学院计算技术研究所(简称“中科院计算所”)控股的大数据方向高新技术企业,是中科院计算所加速大数据技术成果转化,在大数据方向唯一的产业化平台。公司以大数据智能计算引擎、人工智能算法为核心,围绕大数据平台、自然语言处理、机器学习、知识图谱、人工智能等方面不断拓展。
中科天玑是大数据分析系统国家工程实验室的重要共建单位和示范应用基地,承建的大数据引擎及情报分析系统实验室致力于推进大数据基础设施、大数据分析和情报大数据示范应用三大方向技术研究和大数据产品的定型推广。
中科天玑技术力量雄厚,专业人才济济,博士、硕士人数占总人数的35%以上,核心成员承担过国家863计划、国家973计划、国家自然科学基金及国家信息安全重大专项等多项重大课题的研究,并多次荣获国家重大奖项。
中科天玑始终践行“深挖价值、服务国家、惠及大众”的愿景,致力于打造安全可信、智慧敏捷的大数据基础平台产品和行业大数据应用系统,建设情报大数据分析第一品牌,为用户提供大数据整体解决方案,助力中国大数据产业创新发展。
点击文末左下角“阅读原文”,还可了解更多关于“智疫通”的信息。
—— / END / ——
职位热招中
资深银行行业BD-华北/华东JD、资深非银行业BD-华东/华南JD、数据分析师JD丨点击“这里”了解详情
大数据架构师、Java架构师丨点击“这里”了解详情
大数据运维支持工程师、大数据研发工程师、SDK研发工程师、数据分析师、销售经理(上海、北京、深圳)、高级数据产品经理、测试开发工程师丨点击“这里”了解详情
均为实习生招募—研发类:数据研发工程师、JAVA工程师、前端工程师丨算法类:机器学习算法工程师丨产品类:数据产品经理丨点击“这里”了解详情
均为市场及品牌岗位:数据品牌管理、数据中台整合营销、数据中台内容运营、数据中台渠道策略运营丨点击“这里”了解详情
社招:JAVA开发工程师丨校招:数据开发工程师、JAVA开发工程师丨点击“这里”了解详情
了解第一波招聘点“这里”
了解第二波招聘点“这里”
了解第三波招聘点“这里”
2019数据猿年度榜单: