SGE (sun grid engine大型集群作业调度系统)
本章节主要介绍如何在ubuntu 22.04上部署安装SGE软件。
1、环境信息:
主机 |
ip地址 |
node01 |
192.168.230.138 |
node02 |
192.168.230.133 |
软件信息:
软件名称 |
版本 |
ubuntu-server操作系统 |
22.04 |
SGE |
8.1.9 |
2、设置所有主机hosts文件
vim /etc/hosts
192.168.230.138 node01
192.168.230.133 node02
3、安装软件包依赖
apt install git build-essential libhwloc-dev libssl-dev libtirpc-dev libmotif-dev libxext-dev libncurses-dev libdb5.3-dev libpam0g-dev pkgconf libsystemd-dev cmake
4、创建sge用户,所有节点执行
出于安全考虑,所有SGE服务都在用户sge下运行。
useradd -u 495 -r -d /opt/sge seg
5、编译安装sge
下载sge包:
git clone https://github.com/daimh/sge.git
cd sge/
cmake -S . -B build -DCMAKE_INSTALL_PREFIX=/opt/sge
cmake --build build -j
cmake --install build
6、安装master节点
chown -R sge /opt/sge
cd /opt/sge
yes "" | ./install_qmaster
source /opt/sge/default/common/settings.sh
qconf -as node01 #添加提交主机
7、添加管理主机
qconf -ah node02
qconf -ah node03
...
qconf -ah node0N
8、安装计算节点:
mkdir -p /opt/sge/default
chown -R sge /opt/sge/default
scp -pr master:/opt/sge/default/common /opt/sge/default/common
cd /opt/sge
yes "" | ./install_execd
source /opt/sge/default/common/settings.sh
qhost -q