Created
March 14, 2018 16:13
-
-
Save iMega/0a86bb8f5ba2845a2c1855443b113284 to your computer and use it in GitHub Desktop.
Как отслеживать все поведение распределенной транзакции?
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
## 系统执行一条SQL,到底慢在哪里? | |
如何跟踪一个分布式事务的所有行为?使用 [opentracing](http://opentracing.io/)! opentracing 是一个标准的分布式 tracing 的协议。支持 Go, JavaScript, Java, Python, Ruby, PHP, Objective-C, C++, C# 等等许多的语言(暂时没看到 rust 的库)。 | |
[一些基本的概念](https://github.com/opentracing/specification/blob/master/specification.md#the-opentracing-data-model):一个 Trace 是由许多 Span 构成的一个有向无环图。Span 之间的边的关系叫做 Reference。 | |
Span 里面的信息包括:操作的名字,开始时间和结束时间,可以附带多个 key:value 构成的 Tags(key必须是string,value可以是 string, bool 或者数字),还可以附带 Logs 信息(不一定所有的实现都支持),也是 key:value形式。 | |
下面例子是一个 Trace,里面有8个 Span: | |
![](static/trace-span.png) | |
Reference 是记录 Span 之间的相互关系,目前定义了两种: ChildOf 和 FollowsFrom。ChildOf 很好理解,就是父亲 Span 依赖另一个孩子 Span。比如函数调用,被调者是调用者的孩子,比如说 RPC 调用,服务端那边的Span,就是 ChildOf 客户端的。很多并发的调用,然后将结果聚合起来的操作,就构成了 ChildOf 关系。如果父亲 Span 并不依赖于孩子 Span 的返回结果,这时可以说它他构成 FollowsFrom 关系。 | |
可视化之后,将得到这样的视图: | |
![](static/trace-relationship.png) | |
## 举一个栗子 | |
这里有一个很好的例子来说明,如何一步一步的支持 opentracing。 | |
首先,我们需要知道整体架构大概的样子,比如: | |
![](http://opentracing.io/documentation/images/OTHT_2.png) | |
这是一个 Web 请求的例子,客户端发起请求,经过认证服务,计费服务,然后请求资源,最后返回。 | |
接着,如果我们把 gRPC 和整个大致的流程串起来,可以看到一个大体的工作流程: | |
![](http://opentracing.io/documentation/images/OTHT_3.png) | |
如果我们继续细化组件内部的埋点,可能会变成这样子: | |
![](http://opentracing.io/documentation/images/OTHT_4.png) | |
又或者是这样子: | |
![](http://opentracing.io/documentation/images/OTHT_5.png) | |
具体的将以Go语言为例来说明。调研过 Go 语言的几个 opentracing 的实现,主要是 | |
* [Appdash](https://github.com/sourcegraph/appdash/) | |
* [Jaeger](http://jaeger.readthedocs.io/en/latest/) | |
* [LightStep](http://lightstep.com/) | |
AppDash是sourcegraph开源的一个实现,上手最容易,它有一个in memory的后端可以直接嵌到应用里面,零外部依赖,但是后端和界面的功能做的比较弱。 | |
LightStep是一个家做 tracing 的公司,后端以服务形式提供出来,各语言支持的库也挺丰富,但暂时没有具体测试过。 | |
Jaeger是uber开源的实现,基于ZipKin的,功能比较强大,组件也比较复杂。还好有一个 all-in-one 的 docker 镜像。我们就用它了。 | |
初始化好全局的 Tracer,就可以用了。 | |
tracingCfg := cfg.OpenTracing.ToTracingConfig() | |
tracer, _, err := tracingCfg.New("TiDB") | |
if err != nil { | |
log.Fatal("cannot initialize Jaeger Tracer", err) | |
} | |
opentracing.SetGlobalTracer(tracer) | |
grpc 还是很方便的,有相应的包可以直接加上 tracing 功能: | |
import ( | |
"github.com/grpc-ecosystem/go-grpc-middleware" | |
"github.com/grpc-ecosystem/go-grpc-middleware/tracing/opentracing" | |
) | |
unaryInterceptor := grpc_middleware.ChainUnaryClient( | |
grpc_prometheus.UnaryClientInterceptor, | |
grpc_opentracing.UnaryClientInterceptor(), | |
) | |
streamInterceptor := grpc_middleware.ChainStreamClient( | |
grpc_prometheus.StreamClientInterceptor, | |
grpc_opentracing.StreamClientInterceptor(), | |
) | |
conn, err := grpc.Dial( | |
addr, | |
grpc.WithInsecure(), | |
grpc.WithTimeout(dialTimeout), | |
grpc.WithInitialWindowSize(grpcInitialWindowSize), | |
grpc.WithInitialConnWindowSize(grpcInitialConnWindowSize), | |
grpc.WithUnaryInterceptor(unaryInterceptor), | |
grpc.WithStreamInterceptor(streamInterceptor)) | |
## 哪些地方该埋点? | |
所有关键代码路径,执行比较耗时的地方(走io),跟外部组件交互的地方(grpc)。 | |
以 TiDB 为例,比如收到一个SQL请求执行的流程: | |
1. parse | |
2. compile | |
3. execute | |
事务两阶段提交的过程: | |
* prewrite | |
* commit | |
异步或同步取TS的过程;coprocessor执行过程;事务重试等等... | |
## 该如何埋点? | |
调用链信息必须通过某种方式一直传递下去,Go 语言是传递 ctx 参数,tracing 信息被藏在 ctx 里面。 | |
span := opentracing.SpanFromContext(ctx) | |
ctx := opentracing.ContextWithSpan(ctx, span) | |
**尽量不要把 ctx 存储在对象里面!!!** | |
这个问题跟编程语言里面的静态作用域动态作用域有一点点像。[我以前也写过,context本质上是动态作用域](http://www.zenlife.tk/go-context.md),动态作用域是很evil的。这次不扯无关的话题,只是强调下: | |
对象创建时候的上下文,跟执行对象方法时候的上下文,并不是同一个 | |
我们应该始终trace使用时的上下文 | |
举例一:request sender。假设有一个 sender 对象,并且这个对象可能是复用的。那么,创建对象对象的时候保存下来的上下文,跟调用 `sender.Send()` 的时候的上下文,有可能并不是同一个。 | |
sender := RegionRequestSender{ctx} | |
sender.Send(msg1) | |
// another message | |
sender.Send(msg2) | |
举例二,ddl的问题。DDL对象在创建的时候有一个 ctx,它会起后台的 worker,前台收到消息会分发到后台worker。那么 tracing 的应该是:收到消息,分发到worker,worker处理完消息,返回结果的过程。每次来新的消息,都是一个新的 ctx,而不是DDL对象创建的时候那个ctx。假设需要cancel,也是cancel掉某一次消息处理的上下文,而不把把DDL对象cancel掉。 | |
给事务加 tracing,坏的做法在 Begin 的时候把 ctx 存到 txn 对象里面: | |
txn := store.Begin(ctx) | |
txn.Commit() | |
好的做法,在Commit的时候把参数带上去: | |
txn.Commit(ctx) | |
**trace 应该以一个请求的生命期(调用链)为单位,而不是以事务为单位** | |
由于 SQL 的特殊性,一个query跟一个事务并不是一一对应的关系。如果把 trace 以一个事务为单位,两个地方处理起来比较麻烦。一个是用户用 `begin ... commit` 发多次请求,这种情况必须将 ctx 存储起来。另一个是 retry 的处理。 | |
retry 重试了事务就没了?这样不对。在retry里面重新取了ts,重新生成新的txn对象...但是其实还是同一个事务,这个信息非常重要,我们要记录下来。如果基于事务记录,这一块逻辑很乱,而基于一个请求的生命期,这个就比较容易。 | |
但是我们还是要把事务和 trace 绑定起来。使用 Tags!为每个事务记录 txn.id 的 Tag 信息,就可以处理 `begin ... commit` 了。 | |
type Span interface { | |
SetTag(key string, value interface{}) Span | |
} |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment