其他
前后端、多语言、跨云部署,全链路追踪到底有多难?
全链路追踪的价值
Aliware
端到端问题诊断:VIP 客户下单失败,内测用户请求超时,许多终端用户的体验问题,追根溯源就是由于后端应用或云端组件异常导致的。而全链路追踪是解决端到端问题最有效的手段,没有之一。
系统间依赖梳理:新业务上线,老业务裁撤,机房搬迁/架构升级,IT 系统间的依赖关系错综复杂,已经超出了人工梳理的能力范畴,基于全链路追踪的拓扑发现,使得上述场景决策更加敏捷、可信。
自定义标记透传:全链路压测,用户级灰度,订单追溯,流量隔离。基于自定义标记的分级处理&数据关联,已经衍生出了一个繁荣的全链路生态。然而,一旦发生数据断链、标记丢失,也将引发不可预知的逻辑灾难。
全链路追踪的挑战与方案
Aliware
多语言协议栈统一
透传协议标准化:全链路所有应用需要遵循同一套协议透传标准,保证链路上下文在不同语言应用间能够完整透传,不会出现断链或上下文缺失的问题。目前主流的开源透传协议包括 Jaeger、SkyWalking、ZipKin 等。
最大化释放多语言产品能力:链路追踪除了最基础的调用链功能外,逐步衍生出了应用/服务监控,方法栈追踪,性能剖析等高阶能力。但是不同语言的成熟度导致产品能力差异较大,比如 Java 探针可以基于 JVMTI 实现很多高阶的边缘侧诊断。优秀的全链路追踪方案会最大化的释放每种语言的差异化技术红利,而不是一味的追求趋同平庸。
前后云(多)端联动
异构协议栈打通
跨云数据融合
跨云上报
跨云查询
其他方式
全链路追踪接入实践
Aliware
Header 透传格式:统一采用 Jaeger 格式,Key 为 uber-trace-id, Value 为 {trace-id}:{span-id}:{parent-span-id}:{flags} 。
前端接入:可以采用 CDN(Script 注入)或 NPM 两种低代码接入方式,支持 Web/H5、Weex 和各类小程序场景。
后端接入:
Java 应用推荐优先使用 ARMS Agent,无侵入式埋点无需代码改造,支持边缘诊断、无损统计、精准采样等高阶功能。用户自定义方法可以通过 OpenTelemetry SDK 主动埋点。
非 Java 应用推荐通过 Jaeger 接入,并将数据上报至 ARMS Endpoint,ARMS 会兼容多语言应用间的链路透传与展示。
前端接入实践
登录 ARMS 控制台,在左侧导航栏中单击接入中心,点击选择前端 Web/H5 接入。 输入应用名称,点击创建;勾选SDK扩展配置项区域需要的选项,快捷生成待插入页面的BI探针代码。 选择异步加载,复制下面代码并粘贴至页面HTML中** **元素内部的第一行,然后重启应用。
<script>
!(function(c,b,d,a){c[a]||(c[a]={});c[a].config={pid:"xxx",imgUrl:"https://arms-retcode.aliyuncs.com/r.png?",
enableLinkTrace: true, linkType: 'tracing'};
with(b)with(body)with(insertBefore(createElement("script"),firstChild))setAttribute("crossorigin","",src=d)
})(window,document,"https://retcode.alicdn.com/retcode/bl.js","__bl");
</script>
enableLinkTrace:true // 表示开启前端链路追踪功能 linkType: 'tracing' // 表示生成 Jaeger 协议格式的链路数据,Hearder 允许 uber-trace-id 透传
Java 应用接入实践
登录 ARMS 控制台,在左侧导航栏中单击接入中心,点击选择后端 Java 接入。 根据需要选择手动安装、脚本安装和容器服务安装任意方式。 根据操作指南确保探针下载并解压至本地,正确配置 appName、LicenseKey 和 javaagent 启动参数后,重启应用。
非 Java 应用接入实践
登录 ARMS 控制台,在左侧导航栏中单击接入中心,点击选择后端 Go/C++/.NET/Node.js 等接入方式。 根据操作指南替换接入点 ,配置完成后重启应用。
全链路追踪只是开始,不是结束
Aliware
﹀
﹀
﹀