其他
今日头条技术架构一览
今日头条创立于2012年3月,到目前已经8年时间了。从十几个工程师开始研发,到上百人,再到4000余人。产品线由今日头条,到抖音,西瓜视频,火山小视频等产品线。
▍一、产品背景
今日头条是为用户提供个性化资讯客户端。下面就和大家分享一下当前今日头条的数据(据内部与公开数据综合):5亿注册用户 2014年5月1.5亿,2015年5月3亿,2016年5月份为5亿。几乎为成倍增长。 日活4800万用户 2014年为1000万日活,2015年为3000万日活。 日均5亿PV 5亿文章浏览,视频为1亿。页面请求量超过30亿次。 用户停留时长超过65分钟以上
Scribe Flume Kafka
Hadoop Storm
用户订阅
标签
部分文章打散推送
关注、粉丝关系 关系 用户标签
自动候选 自动匹配用户,如用户地址定位,抽取用户信息 自动生成推送任务
自动选择候选文章 根据用户站内外动作
频率个性化 内容个性化 地域 兴趣
通道,首先速度要快,但是要可控,可靠,并且节省资源 推送的速度要快,有不同维度的策略支持,可跟踪,开发接口要友好 推送运营的后台,反馈也要快,包括时效性,热度,工具操作方便 对于运营侧,清晰是否确定推荐,包括推送的文案处理
▍三、头条微服务架构今日头条通过拆分子系统,大的应用拆成小应用,抽象通用层做代码复用。
系统的分层比较典型。重点在基础设施,希望通过基础设施提高快速迭代、容灾和一系列的工作,希望各个业务团队能更快做业务上的迭代以及架构上的调整。
▍四、今日头条的虚拟化PaaS平台规划
通过三层实现,通过 PaaS 平台统一管理。提供通用 SaaS 服务,同时提供通用的 App 执行引擎。最底层是 IaaS 层。IaaS 管理所有的机器,把公有云整合起来,头条有一些热点事件会全国推广推送,对网络带宽比较高,我们借助公有云,需要哪一种类型计算资源,统一抽象起来。基础设施结合服务化的思路,比如日志,监控等等功能,业务不需要关注细节就可以享受到基础设施提供的能力。▍五、总结今日头条重要的部分在于:数据生成与采集数据传输。Kafka做消息总线连接在线和离线系统。数据入库。数据仓库、ETL(抽取转换加载)数据计算。数据仓库中的数据表如何能被高效的查询很关键,因为这会直接关系到数据分析的效率。常见的查询引擎可以归到三个模式中,Batch 类、MPP 类、Cube 类,头条在 3 种模式上都有所应用。链接:http://uee.me/ddDhB架构师为你详解:Nginx 架构
DBA 职业发展之路 | 公益直播
等等,你确定不想看看 PornHub 用了哪些技术吗?
我在外包公司做增删改查有前途么?10 款最佳的 MySQL GUI工具,DBA 必备神器!
再见,微服务
可能是全网最好的 MySQL 重要知识点
资料下载点击上方文字可以直接进入小程序浏览,下载请在后台分别回复关键词DTCC、SACC、PG19即可直接收到完整版 PPT 下载链接
你「在看」吗?