해당 가상머신만 부팅 불가인지, 같은 호스트내 다른 가상머신도 부팅 불가인지, 모든 클러스터의 가상머신이 부팅 불가인지에 따라 트러블 슈팅은 달라질 수 있습니다. 가상머신 부팅시 호스트를 지정하여 모든 호스트에서 부팅이 되지 않는지 확인해주세요. 만약 부팅(혹은 라이브 마이그레이션)이 되지 않는 호스트가 있다면, Mold>인프라스트럭처>호스트에서 상태를 확인해주세요. 정상이 아니라면 에이전트 재시작이 필요할 수 있습니다.
그 다음으로 스토리지 컨트롤러 가상머신이 모두 부팅되고, rbd(기본 스토리지) 볼륨 상태가 정상인지 확인할 필요가 있습니다.
Cube>Ablestack 메뉴에서 각 호스트의 SCVM 이 부팅되어 있는지, 스토리지 센터 클러스터 상태가 모두 Health OK 인지 확인해주세요.
만약 SCVM 상태가 Health Warn 상태라면, 기술지원이 필요할 수 있습니다. SCVM 에 할당된 네트워크(HPN, PN, CN) 이 모두 mtu 9000이상이고 캐리어가 확인되는지, Cube>네트워킹에서 확인해주세요.
스토리지 센터 클러스터 상태가 Health Warn 이라면, 2가지 경우가 있습니다.
유지보수 모드 상태인 경우라면 우측 메뉴에서 유지보수 모드 해제를 눌러(클러스터 내 호스트 모두 정상부팅 및 네트워킹에 이상이 없어야 합니다.) 가상볼륨이 복구를 진행하게 해주세요. 복구가 끝나면 Health OK 상태로 업데이트 됩니다.
유지보수 모드가 아니라면 기본 스토리지 상태에 이상이 있을 수 있습니다. 기술지원을 요청해주세요.
마지막으로 호스트 및 네트워킹 장애시 가상머신 이미지 데이터 정합성을 위해 Glue 가 이미지에 Lock 을 건 상태일 수 있습니다. Cube>터미널 에서 rbd ls 로 이미지가 확인되는지, rbd lock ls 로 이미지에 락이 걸린 이미지인지 확인해주세요. 만약 락이 걸린 이미지가 있다면 모든 호스트에서 락을 해제해야 합니다.
rbd ls -p rbd
rbd lock list <앞서 출력된 rbd pool uuid>
각 호스트에서 이미지의 락을 다음 명령어로 해제해주세요.
rbd lock rm <출력된 rbd pool uuid> "<출력된 id(auto 와 uuid를 합친 형태)>" <앞서 출력된 이미지의 locker명>
모든 호스트에서 락을 해제했음에도 부팅되지 않는다면 기술지원이 필요합니다.