cm_server 迟迟启动不起来的原因分析
  dix3DMteueFN 2023年11月02日 54 0

cm_server 迟迟启动不起来的原因分析

本文出处:https://www.modb.pro/db/424183

  1. 场景 在某个一主两备的环境下面(4G 内存),使用 om 部署了 cm,发现在其中一个节点发现 ca_server 迟迟不能启动,查看 cm 里面关于 ca_agent 和 ca_server 的日志,发现报出了一个错误。 错误如下: m_server: opendir failed!
write_log_file,log file is null now:2022-06-24 14:23:39.186 tid=31471 MAIN ERROR: read staticNodeConfig failed! errno = 12.

cm_server: opendir  failed!
write_log_file,log file is null now:2022-06-24 14:23:39.186 tid=31471 MAIN ERROR: read_config_file_check failed!

从字面意思来看是读取节点配置文件失败,erno=12。

  1. 原因分析: 初步怀疑:操作系统的磁盘空间满了,检查发现磁盘空间还有大量剩余。 系统的调用有问题,(后面会分析) 权限的问题,检查权限也是 ok 的,属组和属主都是 dbgrp 和 omm。 所以磁盘占满了和权限都不是问题的原因,而最主要的原因是系统调用的问题。
  2. 系统调用的原因 咨询了 mogdb 的内核开发关于 cm 的工程师,检查了 cm 的全部日志,他分析的结果是: 原因是内存空间不够(cma 拉起 cms 时候报错信息,时间再 6.24 日 14:21 分,文件操作提示错误,对应错误码 12,errno =12 是 fopen 接口的错误。
  3. 解决办法: 在确定准备同步一致的情况下面,对 ca_server 拉不起来的那台节点的 mogdb 实例重新启动一下,这边就很快发现 ca_server 以及拉起来了。
【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
dix3DMteueFN