개체 스토리지와 개체 저장소
개체 스토리지와 개체 저장소란?
개체 스토리지는 개체라고 알려진 개별 단위로 데이터 스토리지를 관리하는 방식입니다. 개체 저장소는 데이터 분석 소프트웨어가 개체에서 쿼리를 실행하는 플랫폼입니다.
무제한 용량의 개체 스토리지는 한때 백업 및 복구 기능을 위한 경제적인 스토리지로 인정받았습니다. 개발자들이 클라우드로 이동하고 엔터프라이즈에서 분석이 증가하면서 엄청난 데이터 볼륨과 데이터 세트를 처리하는 기능 덕분에 s3 및 개체 스토리지 사용 사례도 증가했습니다.
개체 스토리지의 작동 원리
개체 스토리지는 한 단위에서 데이터 블록을 함께 유지하며, 온프레미스 또는 다중 네트워크 시스템 및 지리적 영역 전체에서 분산된 데이터 풀 안의 어디서나 손쉽게 검색할 수 있도록 각 개체에 풍부한 메타데이터가 적용된 고유 식별자를 할당합니다.
개체 스토리지는 평평한 주소 공간을 사용하여 다른 시스템에서 사용하는 계층적 구조를 제거합니다. 따라서 간편한 확장 또는 축소가 가능하며, 다양한 스토리지 워크로드에 따라 신속한 확장 및 축소가 적용됩니다.
또한 저장된 데이터를 업데이트할 때 개체 스토리지 시스템이 수정된 일부가 아닌 전체 자산의 새로운 사본을 저장합니다. 따라서 개체 스토리지는 다른 시스템과 비교하여 데이터의 내구성이 우수합니다.
메타데이터의 로드가 많아지면 오버헤드가 더 필요하고 데이터 수정 속도가 느려집니다. 따라서 기존의 개체 스토리지는 다음과 같이 자주 이용하지 않는 데이터에 더 적합합니다.
- 재난 또는 데이터 손실 후 아카이브 검색을 위한 백업 처리
- 정적 웹 콘텐츠(사진, 과거 문서, 음악 등)
- 한 번만 쓰는 애플리케이션 또는 읽기만 하거나 자주 업데이트 하지 않는 애플리케이션
개체 스토리지, 블록 스토리지, 파일 스토리지 비교
데이터 스토리지는 각각 다른 방식으로 데이터 액세스 요구 사항을 처리하는 세 가지 모드(개체, 블록, 파일)로 이용할 수 있습니다. 사용 사례의 주요 특성에 따라 적합한 모드가 달라집니다.
가장 오래되고 단순한 데이터 스토리지 방식인 파일 기반 저장소는 데이터를 종이 기반 시스템과 비슷하게 폴더 안에 단일 정보를 저장합니다. 저장된 데이터를 단순한 경로를 통해 이용할 수 있어 공유 파일 관리에 적합합니다. 하지만 계층적 파일 구조로 인해 특정 정보를 찾는 방식이 번거로울 수 있습니다.
블록 기반 스토리지는 스토리지 효율성 향상을 위해 시스템 전체로 확산할 수 있는 단위로 데이터를 나눕니다. 하지만 블록 스토리지는 각 데이터 블록에 할당된 메타데이터를 고유한 식별 주소로 제한합니다. 따라서 블록은 큰 오버헤드가 필요하지 않으며 다른 시스템보다 민첩성과 효율성이 뛰어납니다. 이러한 단순성으로 트랜잭션 데이터와 같이 자주 변하는 데이터에서 탁월한 성능을 지원합니다.
반면에 개체 스토리지는 다른 스토리지 시스템보다 각 파일에 훨씬 많은 메타데이터를 추가합니다. 애플리케이션 세부 정보, 데이터 보호 수준, 보존 정책 및 기타 속성과 관련 있는 정보 등과 같은 컨텍스트 및 사용자 정의 가능 정보를 포함합니다. 이를 통해 사용자가 많은 수량의 구조화되지 않은 데이터에서 다양한 분석을 구축할 수 있습니다. 또한 개체 스토리지가 다른 모드의 계층형 구조를 제거하여 더 높은 확장성과 더 광범위한 분산된 액세스가 가능합니다.
개체 스토리지와 Kubernetes의 작동 원리
Kubernetes와 개체 스토리지가 상호 작용하는 방식을 이해하려면 데이터의 증가가 근본적으로 기술의 노후화를 촉진한다는 것을 이해해야 합니다. 따라서 데이터 볼륨의 빠르고 지속적인 증가로 기술 개발 주기의 속도가 그 어느 때보다 빨라지게 됩니다.
특별히 빠르게 변하는 환경을 위해 설계된 Kubernetes는 운영자가 컴퓨팅, 네트워킹, 스토리지 인프라를 관리하는 방식에서 중요한 요인이 되었습니다. Kubernetes용 기본 플랫폼인 개체 스토리지는 Kubernetes가 빌드/패키지/구축 프레임워크를 가동하는 데 필요한 탄력성, 확장성, 복원력을 제공합니다. 개체 스토리지를 사용하여 Kubernetes를 통해 작업자는 오버헤드를 줄이면서 프로비저닝부터 적절한 규모의 볼륨 배치에 이르기까지 모든 것을 처리할 수 있습니다.
컨테이너에서 애플리케이션이 실행될 때 개체 스토리지가 애플리케이션의 상태를 유지합니다. 이는 인프라 자동화를 관리하기 위해 개체 스토리지 자체를 컨테이너에서 실행해야 하기 때문에 Kubernetes에 매우 중요합니다. 따라서 개체 스토리지를 사용함으로써 Kubernetes가 상태 비저장 이동식 환경의 인프라를 오케스트레이션할 수 있습니다.
HPE 개체 스토리지 솔루션
개체 스토리지 사용 사례가 확장되면서 HPE가 다중 솔루션을 제공할 필요성도 증가했습니다.
Scality용 HPE 솔루션은 다음과 같은 범용 개체 스토리지에 적합한 솔루션입니다.
- 대규모 축소부터 단일 노드 엣지에 이르기까지 퍼블릭 클라우드 스토리지의 온프레미스 대안
- 미디어 및 공유 지원 데이터 리포지토리
- 데이터 위임을 위한 다음 계층 스토리지(예: Splunk SmartStore, 의료용 이미지 처리, HPC 아카이브)
- 단순한 엔터프라이즈 백업 대상 스토리지
HPE Ezmeral Data Fabric은 고성능과 우수한 확장성이 필요한 분석, AI 및 ML 워크로드에 적합한 솔루션입니다. 관련 사용 사례로는 분석, 리서치, IoT(사물 인터넷), 비즈니스 인사이트 등이 있습니다. HPE Ezmeral Data Fabric은 파일, 개체, NoSQL 데이터베이스를 통합하고 온프레미스, 멀티 클라우드, 엣지 환경에서 하나의 통합 데이터 인프라 및 파일 시스템으로 스트리밍하는 최초의 솔루션입니다. 이를 통해 애플리케이션과 사용자가 데이터의 위치와 상관없이 신뢰하는 데이터를 바로 이용할 수 있습니다.