查看原文
其他

干货 | 秒开率70%+,携程金融SSR应用性能监测与优化

建成 携程技术 2022-06-07

作者简介

 

建成,携程高级前端开发,对前端工程化、性能优化、效率提升等方面有浓厚兴趣。



背景


对于一款互联网产品来说,用户体验始终扮演着重要的角色,尤其是在后互联网时代,增量见顶,竞争方向逐渐转为存量用户,体验的好坏可能直接决定着一个用户的去留。


据统计,网页加载时间从 1 秒增加到 3 秒,跳出率就会提高 32%;如果页加载时间从 1 秒增加到 6 秒,跳出率就会上升 106%。


基于此,携程金融前端团队对内部SSR应用的性能实施了一系列的治理,本文将从性能监测、数据处理与分析、优化之路等方面来分享。


一、性能


用户体验是一个比较感性的概念,每个人的感受可能都不太一样,较难进行衡量。基于此,我们首先要把用户体验进行量化,使其可衡量和监测。


根据业内经验和相关分析,用户体验和页面首屏时间、页面累积布局偏移量有较强相关性,通过计算和监测这两个指标可以来衡量应用的用户体验。


二、性能监测


从技术方面来讲,前端性能监控主要有两种方式,一种是合成监控(Synthetic Monitoring,SYN),另一种是真实用户监控(Real User Monitoring,RUM)。


为了凸显用户真实的体验,我们采用了真实用户监控(即通过用户实际操作产生的一系列性能指标数据进行监测)。


2.1 页面首屏时间


页面首屏时间主要涉及到浏览器请求和渲染流程。


2.1.1 性能指标选定


为了能监测应用全链路性能表现,我们在整个链路中选取了最重要的几个节点,分别如下:



  • DNSDuration:衡量DNS时长

  • TCPDuration:衡量TCP链接时长

  • TTFBDuration:衡量浏览器接受到第一个字节的时长

  • RequestDuration:衡量SSR服务端处理时长

  • FCP:衡量携程端首屏时间

  • DOMContentLoaded:衡量去哪儿和携程金融app首屏时间(native loading隐藏时间点)

  • Load:衡量所有资源加载并执行时长


2.1.2 最佳表现(P90)


  • RequestDuration:300ms
  • FCP:800ms
  • DOMContentLoaded:1000ms


2.1.3 性能指标的收集


指标的收集会用到两个api,分别为监测Android的PerformanceObserver和监测iOS的 Performance.timing



// 创建性能监测实例function createPerformanceObserver(callback) { // Create the performance observer const po = new window.PerformanceObserver(list => { callback && callback(list)    })
return po}
// 性能监测处理函数function performationAduitCallback(list) { for (const entry of list.getEntries()) { if (entry.entryType === 'navigation') { // navigation const DNSDuration = entry.domainLookupEnd - entry.domainLookupStart const TCPDuration = entry.connectEnd - entry.connectStart const RequestDuration = entry.responseEnd - entry.requestStart const TTFBDuration = entry.responseStart - entry.startTime const DOMCompleteDuration = entry.domContentLoadedEventEnd - entry.startTime              const DOMLoadDuration = entry.duration
// FCP let FCPDuration = 0; if (performance && performance.timing) { FCPDuration = window.headReadyTime ? window.headReadyTime - performance.timing.navigationStart : 0;              }
const performanceParams = Object.assign({}, extraInfo, { DNSDuration, TCPDuration, RequestDuration, TTFBDuration, FCPDuration, DOMCompleteDuration, DOMLoadDuration,              })
sendPerformance(performanceParams) } }}
// 性能指标监测(安卓)function performationAduitAndroid() { try { const PO = createPerformanceObserver(performationAduitCallback)
PO.observe({ entryTypes: ['navigation'], }) } catch (e) { console.log('performationAduitAndroid error', e) }}



// 性能指标监测(IOS)function performationAduitIos() { const timing = performance && performance.timing if (!timing) { return  }
const start = timing.navigationStart const param = util.merge( {}, { DNSDuration: timing.domainLookupEnd - timing.domainLookupStart, TCPDuration: timing.connectEnd - timing.connectStart, RequestDuration: timing.responseEnd - timing.requestStart, TTFBDuration: timing.responseStart - start, FCPDuration: window.headReadyTime ? window.headReadyTime - start : 0, DOMCompleteDuration: timing.domContentLoadedEventEnd - start, DOMLoadDuration: timing.loadEventEnd - start, }  )
const performanceParams = Object.assign({}, extraInfo, param) sendPerformance(performanceParams)}


2.2 页面累积布局偏移量(CLS)


CLS (Cumulative Layout Shift) 是Web Vitals指标之一,主要用于测量整个页面生命周期中,布局移位的分值,以此衡量视觉稳定性。


2.2.1 性能指标的选定


衡量页面累积布局偏移量的指标只有一个,就是CLS。通过减少CLS,可以减少用户因为页面突然移位造成的误触概率。


2.2.2 最佳表现(P90)


  • CLS:0.05


2.2.3 性能指标的收集


CLS的收集同样使用 PerformanceObserver 这个api,这个api会有兼容性问题,只能应用于Android。


// 创建性能监测实例function createPerformanceObserver(callback) { // Create the performance observer const po = new window.PerformanceObserver(list => { callback && callback(list)    })
return po}
// CLS处理函数function clsAduitCallback(list) { for (const entry of list.getEntries()) { if (entry.entryType === 'layout-shift') { // CLS const CLS = entry.value ? entry.value * 1000 : 0 const CLSParams = Object.assign({}, extraInfo, { CLS }) sendPerformance(CLSParams) } }}
// CLS数据指标(安卓)function clsAduit() { try {        const clsPO = createPerformanceObserver(clsAduitCallback)
if (window.PerformanceObserver.supportedEntryTypes.includes('layout-shift')) { clsPO.observe({ type: 'layout-shift', buffered: true, })        }
window.addEventListener('load', () => { // 延迟1s取消监听 setTimeout(() => { clsPO.disconnect() }, 1000) }) } catch (e) { console.log('cls error===>', e) }}


三、数据处理与分析

数据收集好之后,还需要对数据进行加工处理,才能客观的反应出应用的性能状况。加工处理的方式如下:


3.1 百分位数


在数据分析中,我们通常想衡量大部分用户的性能表现,而所有统计的数据中会存在一些异常的数据,因此需要对原始数据取百分位数进行分析。目前金融内部会取P50和P90两个百分位数进行分析。


3.2 分端统计


金融大部分应用主要运行在携程端、携程金融端和去哪儿端,为了衡量各端的性能情况,我们将数据进行了分段统计。


3.3 秒开率统计


页面首屏时间能反映出大部分用户的性能表现;秒开率能反应出性能最佳表现的用户所占比例。通过这两个数据基本上能衡量出我们应用的性能状况。


秒开率计算方法 = count(固定时间段内页面首屏时间 < 1s) / count(*)


四、优化之路


通过上面的数据处理和分析,已经能准确了解到应用的整体性能表现以及各阶段性能情况,下面就有针对性地对各阶段进行优化处理。


4.1 DNSDuration


  • 选择性的使用DNS Prefetch


隐式 DNS Prefetch:浏览器会对页面中和当前域名不在同一个域的域名进行prefetch。因此显式DNS Prefetch应用于页面中未出现的域名。所以二级页面中的域名如果在首页中没有出现,可以选择使用DNS Prefetch。


4.2 TCPDuration


前端的能力很难对TCP连接阶段进行优化,但是可以利用TCP的一些特点,进行资源获取的优化。


  • 首页的html size小于14k


由于TCP Slow Start的原因,我们应尽可能的将首页的html size控制在14k以内,使首页数据可以在一个TCP包中发送到浏览器,加快渲染速度。


  • Http1 → Http2减小TCP连接次数和减少渲染阻断


应用HTTP2多路复用和浏览器渲染流程。


4.3 RequestDuration


  • 优化服务端接口响应时长
  • 非必要接口放到客户端异步请求


4.4  FCP


  • CSS做内联


4.5 DCL


  • Preload提升阻塞JS下载优先级
  • 将webpack打包出的Bundle JS同步变异步(Async)
  • 减小JS Size:抽离公共chunk
  • 高效利用缓存:根据改动频率split chunk + ContentHash + 缓存


4.6 onload(页面完全展示)


  • 接口数据缓存:与用户关联度较小的接口
  • 图片转webp
  • 图片size控制
  • 字体preload


4.7 CLS


  • 尽可能可以不发生移位
  • 发生移位的位置尽可能影响更少的区域
  • 移位的距离尽可能小,且使用动画
  • 骨架图


五、总结


通过以上的治理步骤,金融主要SSR应用的秒开率都提升到了70%以上,且做到实时监控性能变化,一旦性能出现问题,可以及时感知并采取措施进行解决。


相信通过以上的努力,可以给金融所有的用户一个良好的用户体验,从而助力产品发展。


【推荐阅读】




 “携程技术”公众号

  分享,交流,成长


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存