ucloud HPC

ucloud HPC는 고성능 연산을 위한 클러스터화 된 ucloud 서버 및 솔루션을
제공하는 서비스입니다. (서비스 준비중)

ucloud HPC(고성능 컴퓨팅)

HPC(고성능 컴퓨팅) 기능을 통해 연구원이나 엔지니어는 높은 대역폭, 지연 시간이 짧은 네트워킹, 고용량 컴퓨팅 파워가 필요한 애플리케이션을 사용할 때의 복잡한 과학, 공학적인 분석 및 해석 시뮬레이션 그리고 비즈니스 관련 문제를 해결할 수 있습니다. 일반적으로 사용자는 공유된 클러스터 자원을 사용하기 위해 오랜 시간을 기다리거나 직접 값비싼 하드웨어 시스템을 구입해야 합니다. 반면에 ucloud 인프라 자원을 필요한 대로 사용해 HPC 워크로드를 신속히 처리할 수 있고, 사용에 따라 저렴한 요금 모델을 선택해 비용을 절감할 수 있습니다.

ucloud HPC(고성능 컴퓨팅)

HPC 서비스는 많은 양의 계산을 하거나 데이터를 저장하기 위해 여러 대의 가상머신을 하나의 클러스터로 묶어 제공합니다. 이러한 클러스터는 컴퓨팅 리소스를 제공하는 가상머신인 계산노드들과 계산노드들을 서로 연결하여 단일 시스템처럼 보이게 하는 관리자인 헤드 노드로 구성됩니다. 사용자는 헤드노드에 문제를 해결하기 위한 작업(Job)을 제출하며, 헤드노드는 우선순위와 현재 계산노드의 사용량에 따라서 필요한 자원을 할당하여(schedule) 계산노드들에 작업을 분배합니다. 계산된 결과는 헤드노드를 통해서 리포팅을 받을 수 있습니다. Computing Manager는 이러한 일련의 작업 과정을 GUI를 통해서 제어할 수 있도록 도와 줍니다.

용어설명
- 헤드노드: 다수의 계산노드를 관리하는 역할을 수행하는 HPC 제어용 컴퓨터
- 계산노드: 헤드노드의 제어로 대규모 연산작업을 수행하는 계산용 컴퓨터
- PBS Professional: HPC워크로드를 관리하는 소프트웨어 솔루션
- Compute manager: 기존의 텔넷과 FTP로 수행되던 명령어실행과 파일전송 기능을 간단한 웹브라우저 조작으로 수행하게 해주는 웹서비스

솔루션 소개

PBS Professional®은 1990년 초에 NASA의 Ames 연구소에서 개발되었으며 현재는 그 안정성을 인정받아 전 세계 TOP 500에 속한 많은 대규모 HPC(High Performance Computing) 시스템에서 사용되고 있습니다. PBS Professional은 HPC 시스템의 효율성 증대를 위해 CPU, 메모리, 디스크, 네트워크, 소프트웨어라이선스와 같은 HPC 자원 관리뿐만 아니라 업무환경 분석을 통해 최적의 HPC 자원 활용 계획을 제시합니다.

Altair의 Compute Manager는 사용하기 편리한 웹브라우저 기반의 HPC 인터페이스입니다. 쉽게 HPC를 활용한 작업이 가능하며 실행 중인 작업의 상태를 모니터링하고 진행된 결과를 실시간으로 차트와 애니메이션으로 확인할 수 있습니다. HPC를 활용한 모든 solving작업은 Compute Manager를 통해 간단하게 수행할 수 있으며 엔지니어들은 대규모의 시뮬레이션 연산 실행을 위해 어떻게 MPI(초병렬처리) 환경을 설정하고 실행해야 하는지 더 이상 고민할 필요가 없습니다.

서비스 특·장점

1 경제성
고객은 원하는 만큼만 시간요금 또는 월요금을 지불하고 HPC 클러스터를 구성 운영할 수 있습니다.
2 확장성
워크로드에 필요한 크기와 시간에 따라 서버를 원하는 대로 추가하고 제거할 수 있습니다.
3 효율성
관리 도구(GUI)로 컴퓨팅 작업을 시작하고 한참을 기다리지 않고 몇 분만에 컴퓨팅 리소스을 이용할 수 있어 혁신적으로 빠른 업무처리가 가능합니다.
4 보안성
HPC에서 실행되는 모든 작업을 관리하는 워크로드 관리툴인 PBS Professional은 동종업계에서 유일하게 EAL 3+등급 보안인증을 획득한 제품으로 보안기능에 관한 신뢰도를 한층 높였습니다.

서비스 주요기능

1 PBS Professional: 업계 최고의 HPC 안정성 및 활용도 증대효과 보장
자원활용도 증대를 위해 최적의 스케줄링 알고리즘 제공
NASA, 기상청, 미국방성의 대규모 시스템 납품을 통해 검증된 확장성
작업실패 최소화를 위한 계산노드 장애 검출 및 사용자 오류 자동수정(hook) 기능 제공
업계 유일의 EAL(국제표준 보안인증) 3+등급 인증 획득을 통한 보안 강화
2 Compute Manager(Easy to use): HPC사용자 편의성 증가
WEB 기반의 HPC 작업환경 제공
실시간 실행결과 모니터링 및 파일 수정기능(Edit)
HPC 실행환경을 Profile 관리하여 팀간의 협업가능 및 반복작업 제거
3 업그레이드 및 기술지원(Keep Track and Plan)
지속적인 기능 추가 및 성능 개선 보장
- Hook/MPI라이브러리 통합/Green Computing(전력절감 기능)
- Job실행 속도 향상(7배)/재구동 속도 개선(40배)/동시접속 지원성능 확장(15배)
알테어사 전세계 14개국 27개 사무소에서 글로벌 기술지원 가능
24시간 활용이 가능한 WEB 기반의 Knowledge-Based 온라인 커뮤니티 사이트 운영
장애 지원 및 고객응대를 위한 파트너 사 및 알테어 한국지사의 프리미엄 서포팅

물리서버 컴퓨팅과 비교

물리서버 컴퓨팅과 비교표
구분 물리서버 기반 컴퓨팅 ucloud HPC
확장성 물리서버 컴퓨팅과 비교
용량 확대를 위해서는 H/W 추가, 교체 필요
  • 컴퓨팅 노드 추가로 빠르게 HPC 클러스터 확장 가능
신속성 Delivery, Installation 등 설치 시간 소요
Hardware Maintenance 시간 소요
  • 운영체제(OS) 및 HPC 스케줄러를 빠른 시간 안에 통합 설치
  • Cluster를 구성하기 위한 NFS, NIS, SSH 등을 자동으로 설정
안정성 Hardware 장애 시 서비스 불가
장애를 대비한 System Redundancy 필요
  • cloud 여유자원으로 전환, 신속한 장애복구
  • System Redundancy 불필요
비용절감 여유용량이 포함된 Hardware 구입비 소요
네트워크/상면/전력 등 운영비용 발생
  • 필요 용량만큼 사용, 해당 비용 지불
  • 부대 운영비용 감소

기대효과

1 업무효율 증대
사용자가 HPC 시스템 사용에 대한 지식 없이 업무에만 집중 가능(WEB 기반 UI제공)
HPC 작업실패 최소화에 의한 반복업무 감소
Application 별 실행환경 최적화에 따른 HPC 작업시간 단축
Profile 공유을 통한 구성원 간에 원활한 협업가능
2 HPC 자원활용 극대화
작업대기(Queue) 및 예약(Reservation) 기능을 통해 주말 또는 공휴일에 HPC 자원 사용이 가능
이중화, Job보정기능, 장애장비 자동검출을 통해 작업 실패 최소화
자원이력 분석을 통한 투자대비 효과 제고 및 체계적인 도입비용 산정 가능