聊聊深圳机场:推算「病毒式营销」效果的方法能用来推算病毒传播情况吗?
昨天有在深圳工作的朋友请我帮忙,问能否评估深圳机场病毒可能的扩散程度。
这是一个经典的机场商业问题的意想不到的应用。我们时常在市区看到提着机场免税店袋子的人。在深圳的情况下,袋子变成了可能携带的病毒。商业界所称的「病毒式营销」,这一次是李鬼遇上李逵——真正的病毒来了。
第一步:人流量——有多少人路过了这家店?
在机场确诊的这位姑娘,在一家名为「厉家菜」的餐厅上班。这家餐厅在哪里呢?在这里(高德地图提供):
在深圳机场的各登机口当中,除去东南角国际线一面,西南角一面,中央两侧,这家店位于前往剩下的三条指廊的必经之路上,是非常好的位置。
深圳机场的登机口大体均匀分布在十个面上:
指廊 | 登机口编号 | 数量 |
---|---|---|
东南(国际) | 1-9 | 9 |
西南 | 14-19 | 6 |
中央 | 20-26 | 7 |
东北 | 27-38 | 12 |
北 | 39-50A/B | 13 |
西北 | 51-62A/B | 14 |
厉家菜餐厅的位置通往约 39 个登机口,占总体的 75%。加上部分中央登机口的旅客可能会来食用,实际覆盖在 40 个以上。
那么,会路过这个断面的人流也就可以计算或者分析得出了。一般而言要快,可以估算;要准,可以用机场内 Wi-Fi 信号推算。实际情况中,一般是两者结合,可以对路过这家店的人做出一个准确的估计。
深圳一年国内线客流量 4500 万,一天是十万人左右。从这些登机口离开深圳的旅客占到约 70% 到 80%,在七万人左右的水平。
那是不是 10 天总共有七十万名密切接触者呢?那不一定。因为在机场商业的故事中,还需要考虑转化率。
第二步:转化率——有多少人进去坐了?
在这个案例中,转化率是可能被这位服务生感染而被列入密切接触者名单的人的比例。不妨将这个问题稍作简化为「进了店吃饭的人的比例」乘以「吃饭期间刚好是这位服务生服务」的比例。
有心人可以发现,这一比例和很多因素相关:例如最典型的时间、消费水平等。这要乘以一个系数。以这家餐厅的价格(人均 100 元左右)和风格(北京菜)而言,百分之五到百分之十就已经不错了(饭点可能略高)。当然,我们也可以通过 Wi-Fi 或者人脸识别等手段拿到更精确的测量数据。
再考虑一下当天的服务生排班,重点找出这位同事的时间点,可以进一步乘以 30% 左右(一般而言服务生 5 人,每位客人接触 1 到 2 名服务生计算)。
那么我们现在有 70000 乘以 30% 乘以 10% = 2100 人。十天总共有最多 21000 人。
21000 人的密切接触者还是不太好找,尤其是他们还分散在全国各地的情况下。
第三步:用户画像——吃了饭的人最有可能飞去哪里?
我刚刚提到了这家餐厅的两个特征:
它是一家主打北京风味的餐馆;
它的价格在深圳机场范围内处于中上水平。
那么什么样的人会进去吃呢?这是典型的用户画像匹配问题,只不过是倒过来用——以前是「已知用户性质求行为」,现在是「已知行为求用户性质」。
所谓的用户画像,实际上就是计算概率。这家店的旁边刚好有一家「潮汕传人」。可以有预见的是,不同的用户会在这两家菜之间做出倾向不一的选择——倘若你要飞到北京,你选厉家菜的概率是多少?假如你要飞到上海呢?这就是计算一系列的条件概率。
我们在这里需要用到贝叶斯定理:我们知道旅客当中吃了厉家菜的人数(吃了厉家菜的概率——刚刚的转化率),也知道旅客飞到上海的人数(前往上海的概率——由每日航班离港旅客统计可得)。我也知道假如一位旅客要飞到上海,他会吃厉家菜的概率(基于人口学分析得出),那么我们是可以用贝叶斯定理推算出,假如一位旅客吃了厉家菜,他随后飞到上海的概率。
当然,在这一次案例中,除了运用概率算法进行估计以外,通过对在餐厅门口的监控配合各登机口区域的监控进行同一人匹配,我们还进行了验算。通过估计和验算,我们可以得出这 2100 人大概都去了什么地方,会出现在哪一班航班的登机口。
第四步:宣传效应——吃完饭的人会不会和其它旅客分享?
我们还必须考虑一个因素:旅客可能会在吃完饭以后和其它旅客「宣传」这家餐馆——在这个案例中,就是旅客还没离开深圳,直接在登机口就把另外的旅客传染了。
这种情况毫无疑问可能发生:最近广东处在「龙舟水」,航班有着不同程度的延误,旅客会逗留在登机口区域一段时间等候航空公司的指示。这意味着人数可能多于我们的判断。当然,这也是可以估计、验算的。
最后一步:精准触达——向旅客发短信吧。
在机场商业的例子中,估计了旅客的用户画像以后需要向旅客推销这家餐馆;而在这个疫情防控的案例中,就需要通知这位旅客向居委会报备密切接触者了。
这毫无疑问需要一些平衡——如果进行极大规模(总共七十万人规模)的撒网,可能需要通知全国大量兄弟省市,成本就会非常高了;因此,在这个时候对问题的准确估计,是很有必要的。
由于我和朋友之间的君子约定,我不能公开任何结论。但是,这种基于数理统计的快速方法,在最后取得了和人脸识别人工筛查几乎相同的成绩。
因此——学好数理化,防疫我不怕(笑)。最后祝各位朋友身体健康,早日低风险 :-D。