ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • SGE(Sun Grid Engine) 설치 작업_Ubuntu
    IT/linux 2023. 6. 22. 16:35
    마스터 서버 - 1

    1. 업데이트 확인

    apt-get update

     

    2. 새 사용자 추가

    adduser gsadmin --uid 500

     

     

    3. Grid Engine package 다운로드

    wget http://downloads.sourceforge.net/project/gridscheduler/GE2011.11p1/GE2011.11p1.tar.gz

    tar -zxvf GE2011.11p1.tar.gz

    mv GE2011.11p1 /home/gsadmin/

    chown -R gsadmin:gsadmin /home/gsadmin/

     

     

    4. NFS 서버(네트워크 파일 시스템) 설치

    apt-get install nfs-kernel-server

    echo "/home/gsadmin *(rw,sync,no_subtree_check,no_root_squash)" >> /etc/exports

    exportfs -a

    service nfs-kernel-server restart

     

     

    5. OpenJDK-8 설치

    apt-get install openjdk-8-jdk

    echo "export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/" >> ~/.bashrc

    export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/

    echo "export PATH=$PATH:/usr/lib/jvm/java-8-openjdk-amd64/bin" >> ~/.bashrc

    export PATH=$PATH:/usr/lib/jvm/java-8-openjdk-amd64/bin

    echo "export SGE_ROOT=/home/gsadmin/GE2011.11p1" >> ~/.bashrc

    export SGE_ROOT=/home/gsadmin/GE2011.11p1/

    source ~/.bashrc

     

     

     

    호스트(클라이언트) 서버 - 1

    1. 사용자 추가

    adduser gsadmin --uid 500

     

     

    2. NFS 클라이언트 설치

    apt-get install nfs-common

     

     

    3. 공유 디렉토리 마운트

    mount xxx.xxx.xxx.xxx:/home/gsadmin /home/gsadmin/
    • mount.nfs: Stale file handle - 먼저 마운트 해제한 다음 마운트
    • home/gsadmin does not exist - 클라이언트에 해당 디렉토리가 없어서 mkdir 필요하다.
    • mount: can't find xxx.xxx.xxx.xxx:/home/gsadmin/ in /etc/fstab: 마운트 하려는 디렉토리를 /etc/fstab에 쓴 다음 마운트

     

     

    4. 자동마운트 설정

    echo "xxx.xxx.xxx.xxx:/home/gsadmin /home/gsadmin nfs" >> /etc/fstab

     

     

    마스터 서버 - 2

    1. gridengine-master 설치

    apt-get install gridengine-master

     

     

    2. /etc/hosts 수정

    #127.0.0.1
    #127.0.1.1

    xxx.xxx.xxx.xxx master master
    yyy.yyy.yyy.yyy node01 node01
    zzz.zzz.zzz.zzz node02 node02

    이런식으로 추가하면 된다.

    마스터 서버에 client까지 붙이려면 클라이언트도 설치해야한다. 

    마스터 서버는 관리만 한다하면 클라이언트는 설치할 필요가 없다.

     

     

     

    3. 다시 시작 (호스트를 수정하는 경우 적용을 위해 다시 시작 해야한다.)

    service gridengine-master restart

     

     

    4. 설치 완료 확인

    qhost
    • hostname을 찾을 수 없음

    - /etc/hosts에 들어간 qmaster와 /var/lib/gridengine/default/common/act_qmaster 일치하는지 확인

    • error:cell directory "/home/gsadmin/GE2011.11.pl//default doesn't exist

    소프트링크 사용 : ln -s /var/lib/gridengine/default /home/gsadmin/GE2011.11.pl/default

     

     

    호스트(클라이언트) 서버 - 2

    1. gridengine-client 설치

    apt-get install gridengine-client

     

     

    2. gridengine-exec 설치

    apt-get install gridengine-exec

     

     

    3. 다시 시작

    /etc/init.d/gridengine-exec restart

     

     

     

    마스터 서버 - 3

    1. 관리자 목록에 노드 추가

    qconf -ah node01
    qconf -ah node02

     

     

    2. gsadmin 그룹 추가

    qconf -au gsadmin gsadmin

     

     

     

    3. commit 호스트에 노드 추가

    qconf -as node01
    qconf -as node02

     

     

     

    4. 클러스터 대기열에 큐 추가

    qconf -aq main.q

     

     

     

    5. main.q 수정

    qconf -mq main.q

    hostlist는 각 노드의 이름

    slot은 각 노드에 할당된 cpu 개수, 노드 이름을 지정하지 않으면 기본값은 10

    병렬 환경 smp 추가 : 슬롯을 9999로 수정

    qconf -ap smp

    prolog는

     

    prolog.sh 파일 생성: /var/lib/gridengine/default/common/prolog.sh

    마스터와 클라이언트 모두 있어야하고 실행 권한도 부여해야한다.

     

    prolog.sh

    리소스 구성 수정 (텍스트로 뒤에 두 줄 추가)

    qconf -mc

     

     

    6. 다시 시작

    service gridengine-master restart

     

     

     

    호스트(클라이언트) 서버 - 3

    1. /etc/hosts 마스터 서버와 일치하도록 수정

     

     

    2. 다시 시작

    /etc/init.d/gridengine-exec restart

     

     

    3. qhost

     

     

     

     

    qstat -f

    qstat -F

    qmod -c main.q@hostname 이런식으로 clear가능

    qmod -d main.q@hostname 비활성화

    qmod -e main.q@hastname 활성화

    qdel listnum 작업 삭제

    qsub 작업 넣는거

     

    등등

    728x90
    반응형