` keepalived(一) | 听云轩

keepalived(一)

keepalived是一款高可用软件,它的功能主要包括两方面:

1、通过ip漂移,实现服务的高可用;服务器集群共享一个虚拟ip,同一时间只有一个服务器占有虚拟ip,并对外提供服务,若该服务器不可用,则虚拟ip漂移到另一台服务器并对外提供服务。

2、对LVS应用服务器的应用服务器集群进行状态监控,若应用服务器不可用,则keepalived将其从集群中摘除,若应用服务器恢复,则keepalived将其又重新加入到集群中

健康检查和失败切换是keepalived的核心。所谓健康检查,就是采用TCP三次握手、icmp请求,http请求,udp echo请求等方式对负载均衡器后面的实际服务器进行一个存活状态确认;而失败切换主要是应用于配置了负载均衡器上,利用VRRP维持主备负载均衡器的心跳,当主负载均衡器出现问题的时候,由备负载均衡器承载对应的业务,从而在最大限度上减少流量损失,并提供服务的稳定性。

它可以单独使用,即通过ip漂移实现服务的高可用,也可以结合LVS使用,即一方面通过ip漂移实现LVS负载均衡层的高可用,另一方面实现LVS应用服务器层的状态监控。

Z45PER.png

相关原理

keepalived的实现基于VRRP,而VRRP是为了解决静态路由的高可用。

Z45TxO.png

虚拟路由器由多个VRRP路由器组成,每个VRRP路由器都有各自的IP和共同的VRID,其中一个VRRP路由器通过竞选成为master,占有VIP,对外提供路由服务,其他成为backup,master以ip组播(组播地址为:224.0.0.18)形式发送VRRP协议,与backup保持心跳连接,若master不可用(或backup接收不到VRRP协议包),则backup通过竞选产生新的master并继续对外路由服务,从而实现高可用。

在网络层:通过ICMP协议向后端服务器集群中发送数据报文。
在传输层:利用TCP协议的端口连接和扫描技术检测后端服务器集群是否正常。
在应用层:自定义keepalived工作方式。

相关体系和组件

Z45xit.png

1、Scheduler I/OMultiplexer是一个I/O复用分发调度器,它负载安排keepalived所有内部的任务请求。

2、memory mngt:是一个内存管理机制,这个框架提供了访问内存的一些方法。

3、control plane是keepalived的控制面板,可以实现对配置文件编译和解析。

4、core components:

  • watchdog:是计算机可靠领域中极为简单又有效的监测工具,keepalived正是通过它监控checkers和VRRP进程的。
  • checkers:这是keepalived最基础的功能,也是最主要的,可以实现对服务器运行状态检测和故障隔离。
  • ipvs wrapper:这个是IPVS功能的一个实现,这个模块将设置好的ipvs规则发送给内核空间并且提供给IPVS模块,最终实现IPVS模块的负载功能。
  • VRRP stack:可以实现HA集群失败切换功能。负责负载均衡器之间的失败切换。
  • netlink reflector:用来实现高可用集群failover时虚拟ip的设置和切换。

keepalived运行时,会启动3个进程:

  • core:负责主进程的启动、维护和全局配置文件的加载
  • check:负载健康检查
  • vrrp:用来实现VRRP协议

配置文件说明

配置文件:
/etc/keepalived/keepalived.conf

包含三部分:

1、全局配置,配置邮件等;

2、VRRP的配置,配置VRRP实例;

3、LVS配置,配置LVS的应用服务器

若只是单独使用keepalived,通过IP漂移实现服务的高可用,则只需要配置前两部分就可以,若结合LVS使用,实现LVS负载均衡层的高可用、应用服务层的状态监控,则还需要配置第三部分。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
global_defs {
notification_email { #指定keepalived在发生切换时需要发送email到的对象,一行一个
monitor@3evip.cn
}
notification_email_from monitor@3evip.cn #指定发件人
smtp_server stmp.3evip.cn #指定smtp服务器地址
smtp_connect_timeout 30 #指定smtp连接超时时间
router_id LVS_DEVEL #运行keepalived机器的一个标识
}

vrrp_sync_group VG_1{ #监控多个网段的实例
group {
inside_network #实例名
outside_network
}
notify_master /path/xx.sh #指定当切换到master时,执行的脚本
netify_backup /path/xx.sh #指定当切换到backup时,执行的脚本
notify_fault "path/xx.sh VG_1" #故障时执行的脚本
notify /path/xx.sh
smtp_alert #使用global_defs中提供的邮件地址和smtp服务器发送邮件通知
}

vrrp_instance inside_network {
state BACKUP #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备考priority决定
interface eth0 #设置实例绑定的网卡
dont_track_primary #忽略vrrp的interface错误(默认不设置)
track_interface{ #设置额外的监控,里面那个网卡出现问题都会切换
eth0
eth1
}
mcast_src_ip #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip
garp_master_delay #在切换到master状态后,延迟进行gratuitous ARP请求
virtual_router_id 50 #VPID标记
priority 99 #优先级,高优先级竞选为master
advert_int 1 #检查间隔,默认1秒
nopreempt #设置为不抢占 注:这个配置只能设置在backup主机上,而且这个主机优先级要比另外一台高
preempt_delay #抢占延时,默认5分钟
debug #debug级别
authentication { #设置认证
auth_type PASS #认证方式
auth_pass 111111 #认证密码
}
virtual_ipaddress { #设置vip
192.168.36.200
}
}
virtual_server 192.168.36.99 80 {
delay_loop 6 #健康检查时间间隔
lb_algo rr #lvs调度算法rr|wrr|lc|wlc|lblc|sh|dh
lb_kind DR #负载均衡转发规则NAT|DR|RUN
persistence_timeout 5 #会话保持时间
protocol TCP #使用的协议
persistence_granularity <NETMASK> #lvs会话保持粒度
virtualhost <string> #检查的web服务器的虚拟主机(host:头)
sorry_server<IPADDR> <port> #备用机,所有realserver失效后启用
real_server 192.168.200.5 23 {
weight 1 #默认为1,0为失效
inhibit_on_failure #在服务器健康检查失效时,将其设为0,而不是直接从ipvs中删除
notify_up <string> | <quoted-string> #在检测到server up后执行脚本
notify_down <string> | <quoted-string> #在检测到server down后执行脚本
TCP_CHECK {
connect_timeout 3 #连接超时时间
nb_get_retry 3 #重连次数
delay_before_retry 3 #重连间隔时间
connect_port 23 健康检查的端口的端口
bindto <ip>
}
HTTP_GET | SSL_GET{
url{ #检查url,可以指定多个
path /
digest <string> #检查后的摘要信息
status_code 200 #检查的返回状态码
}
connect_port <port>
bindto <IPADD>
connect_timeout 5
nb_get_retry 3
delay_before_retry 2
}

SMTP_CHECK{
host{
connect_ip <IP ADDRESS>
connect_port <port> #默认检查25端口
bindto <IP ADDRESS>
}
connect_timeout 5
retry 3
delay_before_retry 2
helo_name <string> | <quoted-string> #smtp helo请求命令参数,可选
}
MISC_CHECK{
misc_path <string> | <quoted-string> #外部脚本路径
misc_timeout #脚本执行超时时间
misc_dynamic #如设置该项,则退出状态码会用来动态调整服务器的权重,返回0 正常,不修改;返回1,检查失败,权重改为0;返回2-255,正常,权重设置为:返回状态码-2
}
}
}
------ 本文结束 ------
您的支持将鼓励我继续创作