腾讯大数据
其他
Oceanus:基于Apache Flink的一站式实时计算平台
SQL的开发提供了一系列的辅助功能:1)语法高亮和自动补齐2)表名和字段名的快捷输入、模糊匹配3)常见函数的模糊匹配4)一键检查代码有效性5)一键代码格式化......
2018年12月25日
其他
腾讯数平精准推荐|斩获第14届国际文档分析与识别竞赛四项冠军
上周双十一全民狂欢节,当大家纷纷在剁手买买买的时候,腾讯数平精准推荐团队也发生了一件大事。北京时间11月9日,OCR领域的奥斯卡盛会——第14届国际文档分析与识别大会(ICDAR)在日本京都召开,揭晓了2017年ICDAR竞赛结果并颁发获奖证书。腾讯数平精准推荐团队自研了「时空上下文感知的OCR深度学习算法」,在最受关注的“Robust
2017年11月14日
其他
数据运营实战(一):细分目标人群,结合用户画像的实践
数据分析对于运营来说是一个数据抽象的过程。现实情况是连续的、复杂的、互相影响的,而数据抽象的过程,就是将这些复杂多变的现实情况简化为数字量,搭建数据模型,计算相关因子,推断事件归因,并推进自身改进优化。由于现实的复杂性,我们作为产品、运营或者数据分析师,在实际问题处理时,就需要做归因分析,需要屏蔽其他因子的干扰,因此我们常常使用用户分群。分群后,我们的用户群可能简化为:在每一个分群下,我们可以简化地对比某个因素对关键路径或者关键指标的影响因素。分群是手段,是工具,简单来说,分群分析就是通过聚类的方式,把相似的人群合并,考察同一事件或同一指标在不同人群上的表现,以推断并定位对该事件/指标有明显影响的因子。腾讯移动分析MTA在产品负责人郑灿双Johnnyzheng和顾孙炬raygu推动下,将用户精细分群与用户画像结合起来,助力精益化运营的深度与精度。那么,用户分群与用户画像如何结合使用?接下来,我们举个App案例进行说明:某电商App,现在面临的问题是用户成交量较低,与投放推广的成本相比,ROI较低。这个问题,我们应该如何分析?首先,我们想看看成交的这部分用户与大盘用户之间有什么区别。我们在用户中选出成交的用户,建立用户群对比大盘用户。这里,我们需要使用MTA自定义事件。设置“付款成功”为一个自定义事件,然后使用MTA中的用户分群功能,将自定义事件中满足“付款成功”的用户群筛选出来,命名为“成交用户”;我们还可以设置一个叫做“高价值用户”的用户群,将“付款成功”且付款金额>=100的用户筛选出来。*此处定义高价值用户为成交单价>100元的用户1、用户分群分析得到了三个用户群之后,我们使用数据分析工具,比如腾讯移动分析MTA,对比这三个用户群特点间的区别。以下为三个用户群特征的对比:从图中我们可以发现,大盘用户中男性较多,但实际成单与高价值用户中,都是女性偏多,且此部分用户对购物类App、金融类App的兴趣要明显高于大盘用户,表现出了较强的消费能力。现在我们的问题是投放回报率较低,ROI不符合预期。
2017年8月9日
其他
【重磅】新一代Angel正式开源,性能超越XGBoost和Spark
一把好的宝剑,经过千锤百炼,讲究的是刚柔并济,不但削铁如泥,也要有极好的韧性,百折不断。同样的,一个好的开源项目,也是如此。它不但需要有强大的功能和性能,也需要有良好的适配性,能形成好的生态。
2017年6月28日
其他
【重磅】腾讯移动分析MTA首推可视化埋点,助力移动APP数据运营
早几年,我们主要是在腾讯内部使用,支撑了腾讯的社交、媒体、游戏以及广告等业务。现在我们把腾讯的这种能力进行输出,输出我们的是平台跟能力,把我们的经验与教训输出给开发者,为开发者提供更多服务。
2017年6月12日
其他
2017年Q1季移动App使用情况分析
12岁下的小学生们喜欢QQ多过微信,相比垂直类的App他们更喜欢用浏览器去解决问题,对搜索类App使用率也是所有年龄段中最高。作业助手类的App在学生群体中最为流行,再也不用追着学霸抄作业了。
2017年5月23日
其他
微信小程序从使用到分析快速解析
在小程序上线3个月之后,小程序公布了几大主要新能力,再一次吸引着大家的目光,新功能意味着更低的使用门槛——个人注册、更多的流量通道——可借助线下已有二维码与APP链接、更多的触达手段——公众号绑定。
2017年3月28日
其他
腾讯上万节点大规模集群的跨城自动迁移
最后,是流量的异常监控。数据和任务都验证成功,迁移也就是成功的了。数据已经从一个城市整体迁移到另外一个城市,任务也一起切换过来。最后要考虑的是,会不会有异常情况导致我们的跨城流量出现异常上涨。
2017年3月23日
其他
从华为 Mate9看国产高端手机市场
Note7,致使国际高端手机市场呈现“半真空”状态。与此同时,国产手机品牌伺机而动,通过营造品牌形象、创新设计和配置升级、丰富价格区间等方法,形成对苹果、三星等国际手机品牌的压制。
2017年3月9日
其他
玩转小程序,更要懂你的用户 | MTA小程序分析正式开放
2016年12月28日,微信公开课在广州开课。张小龙在公开课上与大家分享了小程序的诞生场景和需求。与此同时,小龙还宣布小程序依靠微信平台、作为更轻的应用形态,将为用户带来更多便捷的服务。
2017年1月10日
其他
【解析】腾讯大数据第三代高性能计算平台Angel
这些技术使Angel性能大幅提高,达到常见开源系统Spark的数倍到数十倍(即处理同等计算条件下,Spark运行时间是Angel的数倍到数十倍),且Angel能在千万到十亿级的特征维度条件下运行。
2016年12月29日
其他
MTA | 微信小程序分析首发公测!
开发者通过自定义事件可以灵活追踪统计小程序中任意功能模块的使用情况。以阅读类应用为例,可以分别追踪书籍推荐和书籍搜索的使用情况,以对用户行为进行进一步分析,从而有针对性地优化产品。
2016年12月8日
其他
腾讯大数据官网再启航!携手KDD扛鼎大数据技术峰会
作为广大开发者忠实的合作伙伴,腾讯大数据在过去几年通过腾讯移动分析(MTA)、腾讯移动推送(信鸽)、腾讯分析(TA)等产品和用户建立了信任的基石。
2016年12月8日
其他
【揭秘】腾讯大数据98.8秒完成100TB数据排序的架构和算法
Partition和Sort阶段是并行执行的,待Sort完成后,输出多个排序文件,由于Shuffle的时候已经按照Range大小进行了排序,最终输出的排序文件在全局是有序的。
2016年11月15日
其他
腾讯打破2016 Sort Benchmark 4项纪录,98.8秒完成100TB数据排序
腾讯大数据团队官方公众号,关注大数据平台构建、数据挖掘、数据应用等。信息共享,促进行业交流。
2016年11月10日
其他
四两拨千斤:借助Spark GraphX将QQ千亿关系链计算提速20倍
)```当然,有个非常重要的Hint别忘记:partitionNum必须是平方数,才能达到最佳的性能。最终效果经过反复多次优化之后,在高配置集群的资源充足情况下,使用如下配置项:|配置项|配置值|
其他
PGXZ-腾讯全功能分布式关系数据集群
这里在大商户场景下,每天的数据有300W,在查询范围为一个月时数据量可能会达到9000W,也就是说我们需要面向一个9000W数据的排序结果数据,而且这个面向的是终端用户,用户能够等待的时间是有限的。
2016年6月7日
其他
面向高维度的机器学习的计算框架-Angel
未来,项目组将扩大应用的规模,同时,项目组已经在继续研发Angel的下一版本,下一个版本会在模型并行方面做一些深入的优化。另外,项目组正在计划把Angel进行开源,我们会在后续合适的时机进行公开。
2016年5月1日
其他
后Hadoop时代的大数据架构
computer)架构,是非常方便的数据仓库解决方案,SQL接口,跟各个云服务无缝连接,最大特点就是快,在TB到PB级别非常好的性能。它还支持不同的硬件平台,如果想速度更快,可以使用SSD。
2015年4月29日