HPC 워크로드 HPC 워크로드란?
HPC 워크로드는 여러 컴퓨팅 리소스에 분산된 매우 복잡하고 데이터 집약적인 작업으로, 각 리소스는 작업의 일부를 병렬로 실행합니다. HPC 시스템은 한 번에 수백만 개의 시나리오를 실행하고 한 번에 TB(테라바이트) 규모의 데이터를 사용할 수 있으므로 조직이 더 빠르게 인사이트를 얻는 데 도움이 됩니다.
목차
HPC 워크로드의 다양한 구성요소
모든 HPC 워크로드가 서로 다르며 작업을 완료하는 데 필요한 CPU와 예약된 메모리 수준은 작업의 기간, 간격, 규모 등 관련된 노력에 따라 달라집니다. 가장 기본적인 수준에서는 하나의 워크로드 또는 쿼리가 입력(I)을 수집하고 출력(O)을 생성합니다. 이는 다음과 같은 구성요소로 나눌 수 있습니다.
· 요청: 워크로드에서 '작업'이란 애플리케이션에 요청되는 내용을 의미합니다. 여기에는 일련의 읽기 및 쓰기 작업(I/O 명령)과 스토리지 시스템 관련 페이로드가 포함됩니다.
· 애플리케이션 및 VM: 모든 워크로드는 작업을 달성하는 데 사용되는 항목 또는 애플리케이션의 지속적인 노력에 따라 결정됩니다. 애플리케이션이 데이터를 처리하는 방식과 소프트웨어에 내재된 한계는 워크로드 자체의 특성을 형성합니다.
· 작업 세트: 워크로드 중에 생성되거나 소비되는 데이터의 양을 작업 세트라고 합니다. 일반적인 HPC 워크로드에는 대부분 비정형 형식인 엄청난 양의 데이터가 소모됩니다. 과학자와 엔지니어가 워크로드의 정확도를 미세 튜닝하기 위해 노력함에 따라 HPC 모델에서 사용하는 데이터가 기하급수적으로 증가하고 있습니다.
· 듀티 사이클: 일련의 프로세스가 발생한 후 다시 발생하는 경우 이를 듀티 사이클이라고 합니다. 그러한 노력의 대략적인 반복 시간은 데이터를 사용하는 사람과 애플리케이션의 목적 그리고 스토리지 성능에 따라 크게 달라집니다.
HPC 워크로드 관리 방법
기존 HPC 시스템은 CLI(명령줄 인터페이스)를 사용하여 작업의 제출 및 관리를 관리합니다. HPC 워크로드를 관리하는 프로세스는 다른 데이터 워크로드와 마찬가지로 관련 데이터를 식별하고 준비한 다음 요청을 제출하고 애플리케이션을 실행하며 생성된 결과를 수집하여 저장하는 것으로 시작됩니다.
데이터 준비
HPC 워크로드의 정확도는 데이터 정리에 달려 있습니다. 조직에서는 분석할 데이터셋에 대한 데이터 스크러빙을 수행하여 부정확하거나 불완전하거나 형식이 잘못되었거나 중복된 데이터를 업데이트/제거해야 합니다.
데이터 접속 설정
HPC 워크로드는 데이터에 쉽고 빠르게 액세스할 수 있어야 하는 반면 조직은 안전하고 효율적인 방식으로 데이터를 제공하는 정책을 구현해야 합니다. 데이터 레이크, 데이터 패브릭, 레이크하우스 아키텍처, 신경망 등 사용되는 모든 리소스에 대해 동일한 암호화 및 액세스 제어가 실행됩니다.
알고리즘 선택
사용할 알고리즘을 선택한 다음 분석 모델을 구축, 교육, 배포하려면 광범위한 전문 지식 및 기술이 필요하며 요청을 제출하는 데이터 과학자가 정의해야 합니다.
쿼리 실행
많은 애플리케이션이 HPC에서 결과를 생성하는 데 자주 활용됩니다. Apache Hadoop, Databricks, Cloudera와 같은 분산 컴퓨팅 소프트웨어 플랫폼은 이러한 복잡한 분석을 분할하고 구성하는 데 사용됩니다.
HPC 워크로드 유형
HPC 워크로드에는 엄청난 양의 데이터를 살펴보고 추세를 검색하고 예측을 내리며 운영이나 관계에 대한 권장 조정을 생성하는 여러 카테고리가 있습니다.
인공 지능
간단히 말해 AI(인공 지능)는 머신에서 정보를 처리할 때 인간의 지능을 시뮬레이션하는 것으로, 학습, 추론, 자체 수정을 포함하여 인간이 매일 수십억 개의 결정을 내리는 데 사용하는 인지 기술에 초점을 둡니다. 학습 자체에는 입력 데이터를 받아서 이를 실행 가능한 정보로 전환하는 규칙을 만드는 것이 포함됩니다. 추론에는 원하는 결과를 얻기 위해 사용할 올바른 알고리즘을 결정하는 것이 포함됩니다. 자체 수정은 AI 프로세스에서 가장 중요한 부분으로, 각 결정은 알고리즘을 지속적으로 미세 튜닝하는 데 도움이 됩니다.
기계 학습
인공 지능의 한 유형인 ML(기계 학습)은 알고리즘을 사용하여 결과를 예측하는 정확도를 점점 높이고 있습니다. ML이 가장 일반적으로 사용되는 분야는 Netflix, Spotify, Facebook과 같은 미디어 기업의 추천 엔진입니다. 기타 사용 사례로는 고객 관계 관리 시스템, 비즈니스 인텔리전스, 가상 비서, 인적 자원 정보 시스템, 자율 주행 자동차 등이 있습니다.
딥 러닝
기계 학습의 하위 집합으로, ML에서 예측 분석의 자동화를 수행합니다. 또한 정보 처리 계층에서 계층마다 더욱 정교한 이해를 구축하고 점차적으로 데이터셋에 대한 더욱 복잡한 정보를 학습합니다. 대표적인 사용 사례로는 자율 주행 자동차가 있는데, 자동차의 후드 아래에 있는 슈퍼컴퓨터가 차량을 조종하는 자동화된 기술을 구축합니다.
HPC 워크로드가 클라우드 환경에서 작동하는 방식
클라우드는 HPC에 이상적인 플랫폼입니다. HPC 워크로드를 클라우드로 옮기면 조직이 필요에 따라 거의 무제한의 컴퓨팅과 서비스를 활용할 수 있기 때문입니다. 즉, 단일 워크로드에 필요한 만큼의 리소스를 사용한 다음 작업이 완료되면 리소스를 해제할 수 있습니다.
또한 전 세계 데이터 센터에 분산된 수십만 대의 서버를 관리하면서 클라우드 기반 컴퓨팅 인스턴스와 스토리지 리소스의 인프라를 조립할 수 있습니다. 이를 통해 데이터 및 처리 활동이 빅 데이터 작업이 위치한 곳 또는 클라우드 제공자의 특정 지역에서 이루어질 수 있습니다. 인프라와 소프트웨어 서비스는 클라우드에 있으며, 사용자는 거의 모든 규모의 빅 데이터 프로젝트에 필요한 인프라를 조립할 수 있습니다.
클라우드에서 HPC 시스템을 실행하는 가장 큰 이점은 필요에 따라 리소스를 동적으로 그리고 실시간으로 추가하거나 제거할 수 있다는 것입니다. 빠르게 확장할 수 있기 때문에 용량 병목 현상이 사라지고 고객은 워크로드에 맞춰 인프라 크기를 더 정밀하게 조정할 수 있습니다. 클라우드를 통해 기본 인프라가 제공되므로 사용자는 더 적은 인력으로 더 많은 워크로드를 처리할 수 있으며, 이는 비용 절감과 더불어 직원들이 비즈니스 가치가 더 높은 작업에 집중할 시간을 확보하는 결과로 이어집니다.
HPE와 HPC 워크로드
HPE는 시장에서 가장 포괄적인 HPC 및 컨버지드 워크플로를 위한 소프트웨어 포트폴리오를 제공합니다. 또한 당사의 광범위한 하드웨어 제품군에는 AI, ML 및 기타 HPC 기술을 더 유연하게 활용할 수 있는 솔루션은 물론 업계에서 타의 추종을 불허하는 확장 가능한 고성능의 스토리지 및 상호 연결 기술도 포함되어 있습니다. 이러한 시스템에 포함된 HPE Apollo, Slingshot, Parallel Storage는 탁월한 처리량과 GPU 향상 효과를 제공합니다.
HPE Pointnext Services는 HPC 및 컨버지드 워크플로를 위한 솔루션과 소비 모델을 다양하게 제공하고 지원합니다. 또한 HPE의 성공 사례 기술에 맞춰 전체 솔루션을 관리하고 최적화하여 조직의 HPC 요건을 충족합니다.
HPE GreenLake for HPC는 HPC 애플리케이션을 위한 온프레미스 엔드 투 엔드 솔루션으로, 팀에서 구성요소를 통합하고 튜닝하는 데 시간을 할애할 필요 없이 업계 최고의 놀라운 성능을 제공하도록 설계되었습니다. 이를 통해 HPC 및 AI 워크로드를 더 쉽고 빠르게 배포할 수 있으며 최종 사용자, 개발자, 데이터 과학자가 고성능 클러스터에서 순수 HPC, 순수 AI, 컨버지드 HPC/AI 워크플로를 실행하면서 HPE GreenLake의 탁월한 고객 경험을 그대로 누릴 수 있습니다.