前言
爱快管理页面的 应用工具 - 健康检测 菜单有健康监测功能,具体有没有作用呢?本文借助ESXi虚拟化平台以及独立服务器直接部署的方式测试验证有效性。
启用方法
这个功能非常简单,经过了许多版本的更新,这个页面也没有变化。也许是很少有人使用,也许是功能已经足够。
测试
watchdog看门狗部分
根据功能,猜测爱快会唤醒主板底层的看门狗。由于服务器操作BIOS比较缓慢,正经的能够通过BIOS开启、禁用看门狗的主板往往启动缓慢,手头可以用于实验的服务器正常启动15分钟,不太合适,而ESXi虚拟机就没有这个顾虑了。
创建一个虚拟机,给虚拟机增加一个硬件设备看门狗。
然后上传爱快的iso文件,手工部署一个爱快系统,配置网络进入爱快管理页面。
通过上述方法,默认状态看到爱快的主动健康监测功能是选中状态的,但是等待秒数为空。刷新ESXi操作页面,发现模拟的看门狗并没有被启用。
勾选开启,选择10秒或者20秒的任何一个,再次刷新ESXi操作页面,可以看到“监护程序”是启用状态的。
在这个时候,可以通过docker的方法得到爱快的管理权限,方法自行网络搜索,爱快的操作系统被挂起,经过了几十秒之后,系统正常重置。
压力测试部分
猜测爱快本身除了依赖看门狗,肯定自身也有其他的软件层面的逻辑。
首先在上面的实验环境继续做实验,移除模拟的看门狗。保持选项打开。
通过静态IP的方式为爱快分配外部IP地址,通过SYN半开连接数压力测试构造大量的数据包请求爱快取得的外部IP,在局域网内进行测试。为了降低发包操作系统的配置需求,将爱快虚拟机的处理器设置在比较低的范围。切记,不要直通硬件给爱快,此时可能会导致虚拟化底层被预期之外的重置、挂起。
经测试,启动后爱快瞬间处理器100%,在经过10秒之后,爱快开始自动重启了。
将时间修改为20秒重复以上的测试,经过测试,维持20秒的处理器满载,爱快就自动重启了。
为什么做这个测试?我可能是比较早就将家用宽带路由器放在机房机柜内,用于服务器带外管理的。但是毕竟同IP段总共也就256个IP,加上本身就是用户量比较大,用户有不少都是有大流量风险的。
经常发现此路由器出现以下故障:DHCP不可用,WEB页面无法访问,UPNP服务无应答,DNS代理服务无响应。但是虚拟服务器可用,端口映射正常,从外部可用轻松的直接访问到端口映射的服务,配置固定IP连接、外部DNS IP的服务器可用正常上网。猜测此类构造的家用路由器虽然配置很低,但是仅仅是DNS、UPNP、WEB控制台、DHCP分配之类的任务通过专用系统处理,需要处理器资源保持运转,而DNAT SNAT之类的网络层面的操作与操作系统无关可用直接运行,就像三层交换机那样能够实现更稳定延迟、更稳定承载量的“线速转发”
结论
通过这个测试,可以发现爱快的主动健康检测,至少在彻底死机的情况下也是有作用的。当系统彻底挂死的时候,主板内部的watchdog能够重置系统,重新载入爱快系统。
而当系统负载压力过大,以至于系统已经完全无法处理的情况下,爱快能够在无看门狗硬件的情况下自行重启。因此对于压力较大的场合,此功能建议谨慎开启。
看门狗的操作
如何验证看门狗本身的可靠性,下文以CentOS为例,通过一台独立服务器进行操作。服务器产权归属于笔者本身,专供测试环境学习验证使用,请不要在线上环境进行此类破坏性的实验。