新一代Web技术栈的演进:SSR/SSG/ISR/DPR都在做什么?
在之前的一篇文章(可点击文末阅读原文查看)里,初步介绍了 Jamstack 这套建站技术栈的背景以及各方面优劣势。
所以这次这篇文章会更加深入,聊聊这套技术栈的演进以及业界的一些最佳实践。
在开始阅读之前,先解释一下文章里用到的英文缩写:
CSR:Client Side Rendering,客户端(通常是浏览器)渲染;
SSR:Server Side Rendering,服务端渲染;
SSG:Static Site Generation,静态网站生成;
ISR:Incremental Site Rendering,增量式的网站渲染;
DPR:Distributed Persistent Rendering,分布式的持续渲染。
从 SSR 到 SSG
SSR 这套技术栈相信很多人应该都非常熟悉了(如果你不熟悉的话可以先阅读相关文章),React/Vue/Angular 等等都从框架层面直接提供了支持,例如在 React 中你可以这样使用:
import React from 'react'
import ReactDOMServer from 'react-dom/server'
const html = ReactDOMServer.render(<h1>Hello, world!</h1>)
SSR 最早是为了解决单页应用(SPA)产生的 SEO、首屏渲染时间等问题而诞生的,在服务端直接实时同构渲染用户看到的页面,能最大程度上提高用户的体验,流程类似下面:
但 SSR 引入了另一个问题,既然要做服务端渲染,就必然需要一个实时在线的后台服务(通常是基于 Node.js 的服务)用来承载页面请求,那么:
1、需要服务器的计算资源和公网流量来部署这套服务,并且消耗的资源与页面的访问量成正相关,当页面的访问量突增时,渲染服务也需要进行扩容;
2、服务端只能部署在有限的几个地域,对于距离服务端较远的用户而言,加载速度跟静态资源的 CDN 相比,慢了一个数量级(通常是 1-5ms VS 50-100+ms);
3、日常也存在传统服务端同样的运维、监控告警等方面的负担,团队需要额外的人力来开发和维护。
有没有办法解决这些问题呢?
我们重新对 SSR 进行审视,服务端渲染出的页面,逻辑上讲可以分成下面两大块:
1、变化不频繁,甚至不会变化的内容:例如文章、排行榜、商品信息、推荐列表等等,这些数据非常适合缓存;
2、变化比较频繁,或者千人千面的内容:例如用户头像、Timeline、登录状态、实时评论等。
例如,在一篇文章的页面中,文章的主题内容是偏向于静态的,很少有改动,那么每次用户的页面请求,都通过服务端来渲染就变得非常不值得,因为每次服务端渲染出来大部分内容都是一样的!
我们完全可以将文章的页面渲染为静态页面,至于页面内那些动态的内容(用户头像、评论框等),就通过 HTTP API 的形式进行浏览器端渲染(CSR):
这样做有很多好处:
1、由于文章内容已经被静态化了,所以它是 SEO 友好的,能被搜索引擎轻松爬取;
2、大大减轻了服务端渲染的资源负担,不需要额外做一套 Node.js 服务;
3、用户始终通过 CDN 加载页面核心内容,CDN 的边缘节点有缓存,速度极快;
4、通过 HTTP API + CSR,页面内次要的动态内容也可以被很好地渲染;
5、数据有变化时,重新触发一次网站的异步渲染,然后推送新的内容到 CDN 即可。
6、由于每次都是全站渲染,所以网站的版本可以很好的与 Git 的版本对应上,甚至可以做到原子化发布和回滚。
这便是 Gatsby.js、Next.js 这样的网站生成器解决的问题,他们属于 React/Vue 更上一层的框架(Meta Framework),通过 SSR 把动态化的 Web 应用渲染为多个静态页面,并且对高度动态的内容也保留了 CSR 的能力。
从 SSG 到 ISR/DPR
细心的同学一定发现了 SSG 这样的模式,看似美好,但存在一个瑕疵:
对于只有几十个页面的个人博客、小型文档站而言,数据有变化时,跑一次全页面渲染的消耗是可以接受的。
但对于百万级、千万级、亿级页面的大型网站而言,一旦有数据改动,要进行一次全部页面的渲染,需要的时间可能是按小时甚至按天计的,这是不可接受的。
为了解决这个问题,各种框架和静态网站托管平台都提供了不同的方案,这里我们介绍 ISR 和 DPR 两种。
ISR:
Incremental Site Rendering
既然全量预渲染整个网站是不现实的,那么我们可以做一个切分:
1、关键性的页面(如网站首页、热点数据等)预渲染为静态页面,缓存至 CDN,保证最佳的访问性能;
2、非关键性的页面(如流量很少的老旧内容)先响应 fallback 内容,然后浏览器渲染(CSR)为实际数据;同时对页面进行异步预渲染,之后缓存至 CDN,提升后续用户访问的性能。
页面的更新遵循 stale-while-revalidate 的逻辑,即始终返回 CDN 的缓存数据(无论是否过期);如果数据已经过期,那么触发异步的预渲染,异步更新 CDN 的缓存。
这就是增量式更新(ISR)的概念,这个概念最早由 Next.js 在 9.5 版本中提出,下面是一个小 Demo:
https://reactions-demo.vercel.app/
在 Next.js 中,你可以使用 getStaticPaths() 来定义哪些路径需要预渲染,通过 getStaticProps() 来获取预渲染需要的数据:
// 定义哪些页面需要预渲染
export async function getStaticPaths() {
return {
// 只有 /posts/1 和 /posts/2 会被预渲染
paths: [{ params: { id: '1' } }, { params: { id: '2' } }],
// 其它页面,如 /posts/3,都会返回 fallback 页面,然后 CSR
fallback: true,
}
}
// 定义预渲染需要的数据
export async function getStaticProps({ params }) {
// 拉取对应的文章内容
const res = await fetch(`https://.../posts/${params.id}`)
const post = await res.json()
return {
props: { post },
revalidate: 60 // 数据有效期为 60 秒
}
}
但 ISR 存在部分缺陷:
1、对于没有预渲染的页面,用户首次访问将会看到一个 fallback 页面,此时服务端才开始渲染页面,直到渲染完毕。这就导致用户体验上的不一致。
2、对于已经被预渲染的页面,用户直接从 CDN 加载,但这些页面可能是已经过期的,甚至过期很久的,只有在用户刷新一次,第二次访问之后,才能看到新的数据。对于电商这样的场景而言,是不可接受的(比如商品已经卖完了,但用户看到的过期数据上显示还有)。
具体关于 ISR 的利弊,可以进一步看 Netlify 的这篇文章:
Incremental Static Regeneration: Its Benefits and Its Flaws:
https://www.netlify.com/blog/2021/03/08/incremental-static-regeneration-its-benefits-and-its-flaws/
DPR:
Distributed Persistent Rendering
为了解决 ISR 的一系列问题,Netlify 在前段时间发起了一个新的提案:
Distributed Persistent Rendering (DPR)
https://github.com/jamstack/jamstack.org/discussions/549
DPR 本质上讲,是对 ISR 的模型做了几处改动,并且搭配上 CDN 的能力:
1、去除了 fallback 行为,而是直接用 On-demand Builder(按需构建器)来响应未经过预渲染的页面,然后将结果缓存至 CDN;
2、数据页面过期时,不再响应过期的缓存页面,而是 CDN 回源到 Builder 上,渲染出最新的数据;
3、每次发布新版本时,自动清除 CDN 的缓存数据。
在 Netlify 平台上,你可以像这样定义一个 Builder,用于预渲染或者实时渲染。这个 Builder 将会以 Serverless 云函数的方式在平台上运行:
const { builder } = require("@netlify/functions")
async function handler(event, context) {
return {
statusCode: 200,
headers: {
"Content-Type": "text/html",
},
body: `
<!DOCTYPE html>
<html>
<body>
Hello World
</body>
</html>
`,
};
}
exports.handler = builder(handler);
https://docs.netlify.com/configure-builds/on-demand-builders/
当然 DPR 还在很初期的阶段,就目前的讨论来看,依然有一些问题:
新页面的访问可能会触发 On-demand Builder 同步渲染,导致当次请求的响应时间比较长;
比较难防御 DoS 攻击,因为攻击者可能会大量访问新页面,导致 Builder 被大量并行地运行,这里需要平台方实现 Builder 的归一化和串行运行。
总结
Jamstack 这套技术栈在国外的流行,很大程度上得益于近年来相关云服务和云平台的成熟:
新一代的 CDN 技术,包括更高级、更精细的缓存控制能力;
Serverless形态的计算服务(如云开发CloudBase提供的云函数与云托管功能),让 SSR 和 SSG 免于服务器运维的苦恼,开发者只需要重点关注前台逻辑; 越来越丰富的 BaaS 提供方,提供了包括数据存储、鉴权、电商、CMS、音视频、AI 等等“中台化”的能力,开发者只需要组合这些 BaaS 服务,专注于自身的业务逻辑即可。
Jamstack 非常适合以呈现内容为主的网站,如文档、博客、电商网站、论坛、官网等等,所以更多地应该将它视为“建站技术”,是目前诸多建站技术栈(LAMP、MEAN等等)的一个新生替代品。极低的运维成本、Serverless、快速、安全、且不损失网站的动态性,是它的核心优势。
当然它本身并不是完美的,SSG、ISR、DPR 这些解决方案,都或多或少有一些瑕疵和问题,它们本质上就是在平衡动态性、渲染性能、缓存性能这三个矛盾点,依然需要继续探索和演进下去。
另外,除了上文提到的 Netlify 和 Vercel 这两家小而美的平台以外,国外的几家大型云厂商(GCP、AWS、Azure)也提供了类似的产品,向 Web 前端开发者提供对 Jamsatck 等新生代技术栈的支持:
Firebase Hosting
Azure Static Web Apps
AWS Amplify
国内市场上,这块产品目前还处于缺位的状态,虽然底层的 IaaS 能力(对象存储、CDN、Serverless、网关等等)都趋近于完善,但还缺少能够把这些能力组合封装起来的一层,前段时间我也表达过类似的想法:
“经常看到有人讨论为啥国内没有netlify、vercel这样的web托管产品,其实在国内要做个类似的东西还真没那么容易,起码要打通 CDN、对象存储、Serverless、API网关,正式产品化的话还要考虑计费、安全、用户隔离等等,能完整提供这套基建的国内厂商就AT两家,并且边边角角上还缺了挺多能力的。”
Stark,云开发 CloudBase 团队高级前端工程师,Node.js Core Collaborator,知乎 JavaScript 话题优秀答主。
点击在看让更多人发现精彩