其他
增强分析在百度统计的实践
01
1.技术层面,除了常规的分析范畴外,引入机器学习和AI能力,渗透到数据准备、数据交互、洞察获取、决策支持等一系列动作中,使得整个分析过程更加精细化、自动化。
2.业务层面,强调“分析平民化”,降低数据分析门槛,使得从数据中获得分析结果和洞察见解不再是专业人士的权利,普通业务人员也可以方便的参与进来。
△图1
△图2
02
△图3
△图4
1.预定义的事件及属性「predefined event/property」,以及自定义的事件及属性「customized event/property」,在百度统计业务里,预定义的内容包括固定的流量和访客相关维度,自定义内容是客户根据自身需要定义的事件,比如"登录"、"注册"。
2.扩展知识,主要是根据上下位关系对事件属性实体进行扩展。
3.同义词,包括通用同义词和业务同义词,其中通用同义词可以复用现有的训练结果,业务同义词需要结合业务场景进行构建,比如在业务文本语料上通过word2vec重新训练。
{
"order_by": [{
"type": "metric",
"value": "uv",
"desc": 1
}],
"st": "20200804",
"limit": 10,
"et": "20200810",
"where": [],
"select": [{
"type": "dim",
"event": "",
"value": "from_type"
},
{
"type": "metric",
"event": "",
"value": "uv"
}]
}
△图5
03
△图6
△图7
04
△图8
△图9
△图10
05
END