博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
percona-toolkit 之 【pt-heartbeat】说明
阅读量:5757 次
发布时间:2019-06-18

本文共 5910 字,大约阅读时间需要 19 分钟。

背景:

      MySQL的架构中,Master-Slave是目前最受欢迎的,用的也最多,但是对于主从的延迟一般都是按照他自己的状态【Seconds_Behind_Master】来查看的,最近看了【】,发现用该状态值去判断主从延迟也不太靠谱。文章中也介绍了 来监控能更好的了解主从延迟时间。本文就介绍下该工具的使用方法。

工作原理:

1,在主上创建一张heartbeat表,按照一定的时间频率更新该表的字段(把时间更新进去)。

2,连接到从上检查复制的时间记录,和从库的当前系统时间进行比较,得出时间的差异。

使用方法:

pt-heartbeat [OPTIONS] [DSN] --update|--monitor|--check|--stop

在主上开启守护进程来更新test.heartbeat表:

pt-heartbeat -D test --update -h master-server --daemonize

监控从的延迟情况:

#一直执行,不退出pt-heartbeat -D test --monitor -h slave-server#执行一次就退出pt-heartbeat -D test --check h=slave-server

常用参数:

注意:需要指定的参数至少有 --stop,--update,--monitor,--check。其中--update,--monitor和--check是互斥的,--daemonize和--check也是互斥。--ask-pass隐式输入MySQL密码--charset字符集设置--check检查从的延迟,检查一次就退出,除非指定了--recurse会递归的检查所有的从服务器。--check-read-only如果从服务器开启了只读模式,该工具会跳过任何插入。--create-table在主上创建心跳监控的表,如果该表不存在。可以自己建立,建议存储引擎改成memory。通过更新该表知道主从延迟的差距。CREATE TABLE heartbeat (  ts                    varchar(26) NOT NULL,  server_id             int unsigned NOT NULL PRIMARY KEY,  file                  varchar(255) DEFAULT NULL,    -- SHOW MASTER STATUS  position              bigint unsigned DEFAULT NULL, -- SHOW MASTER STATUS  relay_master_log_file varchar(255) DEFAULT NULL,    -- SHOW SLAVE STATUS  exec_master_log_pos   bigint unsigned DEFAULT NULL  -- SHOW SLAVE STATUS);heratbeat表一直在更改ts和position,而ts是我们检查复制延迟的关键。 --daemonize执行时,放入到后台执行--user-u,连接数据库的帐号--database-D,连接数据库的名称--host-h,连接的数据库地址--password-p,连接数据库的密码--port-P,连接数据库的端口--socket-S,连接数据库的套接字文件--file 【--file=output.txt】打印--monitor最新的记录到指定的文件,很好的防止满屏幕都是数据的烦恼。--frames 【--frames=1m,2m,3m】在--monitor里输出的[]里的记录段,默认是1m,5m,15m。可以指定1个,如:--frames=1s,多个用逗号隔开。可用单位有秒(s)、分钟(m)、小时(h)、天(d)。--interval检查、更新的间隔时间。默认是见是1s。最小的单位是0.01s,最大精度为小数点后两位,因此0.015将调整至0.02。--log开启daemonized模式的所有日志将会被打印到制定的文件中。--monitor持续监控从的延迟情况。通过--interval指定的间隔时间,打印出从的延迟信息,通过--file则可以把这些信息打印到指定的文件。--master-server-id指定主的server_id,若没有指定则该工具会连到主上查找其server_id。--print-master-server-id在--monitor和--check 模式下,指定该参数则打印出主的server_id。--recurse多级复制的检查深度。模式M-S-S...不是最后的一个从都需要开启log_slave_updates,这样才能检查到。--recursion-method指定复制检查的方式,默认为processlist,hosts。--update更新主上的心跳表。--replace使用--replace代替--update模式更新心跳表里的时间字段,这样的好处是不用管表里是否有行。--stop停止运行该工具(--daemonize),在/tmp/目录下创建一个“pt-heartbeat-sentinel” 文件。后面想重新开启则需要把该临时文件删除,才能开启(--daemonize)。--table指定心跳表名,默认heartbeat。

更多的参数请见。

测试:

环境:主:192.168.200.25:3306从:192.168.200.25:3307从:192.168.200.201:3307

测试一:

1,在主上运行:--daemonize表示守护进程,后台运行。

zhoujy@zhoujy:~$ pt-heartbeat --user=root --ask-pass --host=192.168.200.25 --create-table -D aaa --interval=1 --update --replace --daemonizeEnter password: 或则指定日志文件: zhoujy@zhoujy:~$ pt-heartbeat --user=root --ask-pass --host=192.168.200.25 --create-table -D aaa --interval=1 --log=/tmp/pt-heartbeat.log --update --daemonize Enter password:
zhoujy@zhoujy:~$ ps -ef | grep pt-heartbeatzhoujy   15656     1  0 14:42 ?        00:00:00 perl /usr/local/bin/pt-heartbeat --user=root --ask-pass --host=192.168.200.25 --create-table -D aaa --interval=1 --update --daemonize

2,在从上运行:

#执行一次就退出zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --check0.00#一直执行,不退出zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --monitor 0.00s [ 0.00s, 0.00s, 0.00s ]0.00s [ 0.00s, 0.00s, 0.00s ]0.00s [ 0.00s, 0.00s, 0.00s ]

0表示从没有延迟。 [ 0.00s, 0.00s, 0.00s ] 表示1m,5m,15m的平均值。可以通过--frames去设置。

指定 --file 参数,把输出保存到一个文件中。文件只会保留最新的一条记录。

zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --frames=1s,5s,15s --file=output.txt --monitor

文件output.txt的内容为:

3.00s [ 13.00s, 11.00s,  6.07s ]

在1,2中主更新的间隔时间为默认1s(--interval),检查延迟不需要1s这么频繁,设置10s检查一次从的延迟情况:

zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=10 --frames=1s,5s,15s --monitor0.00s [  0.00s,  0.00s,  0.00s ]0.00s [  0.00s,  0.00s,  0.00s ]0.00s [  0.00s,  0.00s,  0.00s ]

打印出主的server_id,可以先指定主的server_id,也可以不指定,让其自己去找。

zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=2 --print-master-server-id --frames=1s --monitor0.00s [  0.00s ] 120.00s [  0.00s ] 120.00s [  0.00s ] 120.00s [  0.00s ] 12

参数:--master-server-id 先指定主的server_id。

测试二:

1,多级复制的检查深度(--recurse),必须在--check 模式下运行。

zhoujy@zhoujy:~$ pt-heartbeat --user=rep --password=rep --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=1 --frames=1s --master-server-id=12 --print-master-server-id --recurse=3 --recursion-method=processlist --check192.168.200.25:3307  0.00 12192.168.200.201:3307 0.00 12

上面的结果现实找到了2个从服务器,其中201是25的从,25必须要开启log_slave_updates参数,否则无效。通过该方法可以找到所有的从服务器。

2,如何关闭主上面执行的后台进程。可以用参数--stop 去关闭:

zhoujy@zhoujy:~$ pt-heartbeat --stopSuccessfully created file /tmp/pt-heartbeat-sentinel

这样就把在主上开启的进程杀掉了,后续要继续开启后台进行的话,需要把/tmp/pt-heartbeat-sentinel 文件删除,否则启动不了。

总结:

      通过pt-heartbeart工具可以很好的弥补默认主从延迟的,但需要搞清楚该工具的原理。而默认的Seconds_Behind_Master值是通过将服务器当前的时间戳与二进制日志中的事件时间戳相对比得到的,所以只有在执行事件时才能报告延时。备库复制线程没有运行,也会报延迟null。还有一种情况:大事务,一个事务更新数据长达一个小时,最后提交。这条更新将比它实际发生时间要晚一个小时才记录到二进制日志中。当备库执行这条语句时,会临时地报告备库延迟为一个小时,执行完后又很快变成0。

      通过上面的测试,总结下该工具的使用方法

1,M-S环境运行:

zhoujy@zhoujy:~$ pt-heartbeat --user=rep --password=rep --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=1 --frames=1s,2s,3s --master-server-id=12 --print-master-server-id --monitor0.00s [  0.00s,  0.00s,  0.00s ] 120.00s [  0.00s,  0.00s,  0.00s ] 120.00s [  0.00s,  0.00s,  0.00s ] 120.00s [  0.00s,  0.00s,  0.00s ] 120.00s [  0.00s,  0.00s,  0.00s ] 120.00s [  0.00s,  0.00s,  0.00s ] 12

2,M-S-S环境运行:

zhoujy@zhoujy:~$ pt-heartbeat --user=rep --password=rep --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=1 --frames=1s --master-server-id=12 --print-master-server-id --recurse=3 --recursion-method=processlist --check192.168.200.25:3307  0.00 12192.168.200.201:3307 0.00 12

具体的参数参考上面的说明。

 

更多参考信息:

 

 

转载地址:http://bmpkx.baihongyu.com/

你可能感兴趣的文章
如何成为一家敏捷银行
查看>>
MongoDB主动撤回SSPL的开源许可申请
查看>>
Oracle在JavaOne上宣布Java EE 8将会延期至2017年底
查看>>
使用Prometheus监控Cloudflare的全球网络
查看>>
Javascript 深入浅出原型
查看>>
VS 2019要来了,是时候了解一下C# 8.0新功能
查看>>
简单之极,搭建属于自己的Data Mining环境(Spark版本)
查看>>
Web Storage--HTML5本地存储
查看>>
数据库自动化:DBA和DevOps的双赢
查看>>
Ruby 2.5.0概览
查看>>
如何通过解决精益问题提高敏捷团队生产力
查看>>
阿里云数据库产品总监何云飞:云服务是影响未来10~20年的事
查看>>
Comment2Wechat —— Typecho 插件
查看>>
Apache下.htaccess文件配置及功能介绍
查看>>
Magento XML cheatsheet
查看>>
Egg 2.19.0 发布,阿里开源的企业级 Node.js 框架
查看>>
sap的function module发布成web service后fm再次修改的处理 ...
查看>>
Kubernetes 弹性伸缩全场景解析 (四)- 让核心组件充满弹性 ...
查看>>
使用MySQLTuner-perl对MySQL进行优化
查看>>
ubuntu18.10手动安装mysql5.5
查看>>