호기심에서 영감을 얻은 슈퍼컴퓨팅 여정

Cray 슈퍼컴퓨터의 역사.

Cray 슈퍼컴퓨터 Frontier.
Seymour Cray의 모습.

가능성의 영역 확대

모든 것은 한 사람의 비전에서 시작되었습니다. Seymour Cray는 컴퓨터 디자인 기술에 커다란 애정을 갖고 있었습니다. 회로와 선으로 점점 속도를 높이는 도전을 즐겼습니다. 단순하고 민첩한 작업의 매력도 좋아했습니다.

Mr. Cray는 새로운 질문을 던지고자 1972년 Cray Research를 설립했습니다. 세계에서 가장 빠른 컴퓨팅 시스템이라는 비전을 실현하는 것이 목표였습니다. 불가능에 부딪혀도 실망하지 않고 작업을 계속했습니다.

이러한 비전과 소규모의 엔지니어 그룹을 통해 Cray는 Cray-1 슈퍼컴퓨터를 생산했습니다. 엔지니어링의 마스터피스인 Cray-1으로 컴퓨팅 기술을 프로세싱에서 냉각, 패키징까지 다시 쓰고 이 회사와 사업은 역사에 영원히 기록되었습니다.

Cray-1부터 HPE Cray까지

Cray Research의 첫 번째 사명은 업계에서 가장 빠른 컴퓨터를 설계하고 대규모 과학 관련 컴퓨팅을 주도하는 것이었습니다. 하지만 이러한 시스템으로 사람이 할 수 있는 영역이 확대되면서 사명도 변화했습니다. 속도가 개선되면서 전 세계의 안전, 건강, 지능 향상에 도움이 되는 과학 및 산업 분야의 문제 해결을 위한 약속이 포함되었습니다.

Seymour Cray로 시작된 비전에 공감한 HPE는 2019년 Cray를 인수하고, 역동적인 슈퍼컴퓨팅 여정에서 새로운 장을 시작했습니다.

1970년대~1980년대: 혁신적인 아이디어로 기가플롭 및 갈륨 아세나이드 지원

1976년의 Cray-1.

Cray-1 - 1976년

첫 고객: Los Alamos National Laboratory(사진)

재미있는 사실: Cray-1은 1976년부터 1982년까지 세계에서 가장 빠른 슈퍼컴퓨터였습니다. 크기는 너비 259.08cm, 높이 198.12cm였으며 96.56km 길이의 선이 포함되었습니다.

기술 사례: Cray Research는 Cray-1의 작은 크기와 원통형 모양, 100만 단어의 반도체 메모리, 64비트의 단어 사이즈, 최적화된 Fortran 컴파일러, ‘체이닝’이라는 기술 등을 통해 기록적인 160메가플롭 성능을 달성했습니다.

1982년의 Cray X-MP.

Cray X-MP - 1982년

첫 고객: Digital Productions

재미있는 사실: 영화 회사 Digital Productions는 Cray X-MP 시스템을 사용하여 CGI(Computer-Generated Imagery)를 최초로 활용한 영화 중 하나인 The Last Starfighter의 이미지를 만들었습니다.

기술 사례: Cray는 X-MP 시스템을 통해 병렬 처리로 이동했으며, 9.5나노초 클록 주기를 가진 2개의 공유 메모리 병렬 벡터 프로세서가 탑재되었습니다. Cray는 941메가플롭을 뛰어넘는 가장 빠른 X-MP의 11가지 버전을 생산했습니다.

1985년의 Cray-2.

Cray-2 - 1985년

첫 고객: National Magnetic Fusion Energy Computer Center

재미있는 사실: Cray-2 슈퍼컴퓨터는 ‘Bubbles’라는 별명을 얻었습니다. 최초로 액체 침지 냉각 방식을 사용한 이 시스템의 회로는 액체가 끓을 정도로 뜨거웠습니다. Seymour Cray는 유리 패널을 통해 끓는 액체가 보이게 했습니다.

기술 사례: Cray-2는 프로세서 벡터 아키텍처 4개가 2억 5,600만 64비트 메모리(모든 컴퓨터에서 이용 가능한 최대 중앙 메모리) 및 4.1나노초의 클록 속도를 지원했으며 최고 속도는 1.9기가플롭이었습니다.

1988년의 Cray Y-MP.

Cray Y-MP - 1988년

첫 고객: NASA Ames Research Center

재미있는 사실: Cray Y-MP 슈퍼컴퓨터는 영화 Sneakers(1992년)에 카메오로 출연했습니다. 영화의 주연 배우들(Ben Kingsley, Robert Redford)이 Y-MP에 앉아서 세계를 바꿀 방법을 논의합니다.

기술 사례: Cray Y-MP는 1기가플롭 이상을 유지하는 세계 최초의 슈퍼컴퓨터였습니다. X-MP의 후속 모델로 여겨지는 이 초기 시스템은 8개의 병렬 벡터 프로세서, 더 고밀도화된 회로, 그리고 더 큰 중앙 메모리를 갖추고 있었습니다. 최고 속도는 2.67기가플롭이었습니다.

1990년대~2000년대: 변화와 성장

1991년의 Cray C90.

Cray C90 - 1991년

첫 고객: European Centre for Medium-Range Weather Forecasts

재미있는 사실:  Ford Motor Company는 Cray C90 시스템의 첫 번째 상업 고객이었습니다.

기술 사례: 처음에 Cray Y-MP C90 슈퍼컴퓨터라고 명명된 병렬 벡터 시스템은 각각 1기가플롭이 가능한 새로운 CPU 16개와 2기가바이트의 중앙 메모리를 지원했습니다. 최고 속도는 이전 세대 Cray보다 5배 빠릅니다. 가장 중요한 아키텍처 기능 중 하나는 각 CPU가 모든 클록 주기에 기능 단위당 벡터 결과 2개를 제공할 수 있는 듀얼 벡터 파이프라인이었습니다.

1991년의 Cray Y-MP EL.

Cray Y-MP EL - 1991년

고객 관련 사실: 첫해에만 55대 시스템 주문 예약

재미있는 사실: Cray Y-MP EL 시스템은 Cray Research가 금융 서비스 업계와 동유럽에서 판매한 최초의 슈퍼컴퓨터였습니다.

기술 사례: Y-MP EL 슈퍼컴퓨터는 고객의 도입 비용을 낮추어주었는데, 프로세서 최대 4개, 1,042메가바이트의 메모리로 구성 가능했습니다. 공랭식으로 소형이며 지원이 간편했습니다. 메모리와 I/O 대역폭이 균형 잡힌 Y-MP EL은 같은 가격대에서 최대 처리 성능을 제공했습니다. 나중에 EL90 시리즈로 개발되었습니다.

1992년의 Cray M90.

Cray M90 - 1992년

첫 고객: AT&T Bell Labs

재미있는 사실: Cray M90 슈퍼컴퓨터는 최초 Y-MP 시스템에 비해 최대 125배 더 큰 메모리 용량을 제공했습니다.

기술 사례: Cray M90 슈퍼컴퓨터 시리즈(이전 이름은 Y-MP M90)는 Cray Y-MP 시스템의 대용량 메모리 버전입니다. DRAM 기술로 구현되어 최대 40억 단어의 메모리와 함께 2, 4 또는 8 프로세서 구성으로 제공되었습니다. 이를 통해 사용자는 문제를 분할하여 개별적으로 처리할 필요 없이 방대한 규모의 문제를 한 번에 해결할 수 있었습니다.

1993년의 Cray T3D.

Cray T3D - 1993년

첫 고객: Pittsburgh Supercomputing Center

재미있는 사실: Jet Propulsion Laboratory의 NASA 미션 플래너는 화성에서 우주선이 착륙할 최적의 장소를 찾는 데 T3D 시스템을 사용했습니다.

기술 사례: Cray T3D 슈퍼컴퓨터는 Cray의 첫 번째 대량 병렬 처리 시스템이자 세계 최초의 확장 가능한 이기종 시스템으로, 26개월 만에 설계, 개발, 제조, 제공되었습니다. T3D는 Digital Equipment Corporation에서 제작한 마이크로프로세서의 대규모 병렬 처리 어레이를 Cray에서 설계한 벡터 프로세서에 연결한 시스템으로, 32개부터 2,084개까지의 프로세서 규모로 제공되었습니다.

1994년의 Cray J90.

Cray J90 - 1994년

고객 관련 사실: 발표 전 예약 주문 37건

재미있는 사실: J90 시리즈는 Cray에서 가장 빨리 판매된 제품으로 첫해에 170대의 시스템이 판매되었으며 그 가운데 40%가 Cray를 최초로 구매했습니다.

기술 사례: J90 시리즈는 확장 가능한 저비용 시스템이며 8, 16 및 32프로세서 구성으로 제공되었습니다. CPU의 복잡성을 줄이고 저비용의 고속 및 고급 CMOS(Complementary Metal Oxide Semiconductor 칩)를 사용하여 경쟁업체의 시스템보다 대역폭이 10~20배 크고 우수한 가격 대비 성능을 제공했습니다. 시스템 최저가는 $225,000였습니다.

1995년의 Cray T90.

Cray T90 - 1995년

고객 관련 사실: 발표 전 예약 주문 8건

재미있는 사실: T90 시스템은 세계 최초의 무선 슈퍼컴퓨터입니다. 프로세서 모듈을 메모리에 연결하는 혁신적인 장치를 사용한 Cray는 내부의 모든 배선을 제거했습니다. (가장 큰 C90 시스템은 배선 길이가 57.94km였습니다.)

기술 사례: C90 제품군의 후속작인 병렬 벡터 처리 Cray T90 시리즈는 1~32개의 프로세서를 지원했으며, 최대 60기가플롭의 성능을 제공했으며, 상호 연결 케이블을 eZIF(electrically activated Zero-Insertion-Force) 커넥터(각각 신호 접점 400개)로 대체했습니다.

1995년의 Cray T3E.

Cray T3E - 1995년

첫 고객: Pittsburgh Supercomputing Center

재미있는 사실: Cray T3E는 실제 애플리케이션에서 1테라플롭을 유지하는 세계 최초의 슈퍼컴퓨터였습니다. 1997년까지 T3E 시스템은 세계 주요 슈퍼컴퓨터 목록에서 상위 20개 중 14개를 차지했습니다.

기술 사례: T3E는 프로세서를 수십 개에서 수천 개까지 효율적이고 경제적으로 확장할 수 있었습니다. 이 시스템의 차별화 요소는 프로세서 수에 따라 프로세서 간 통신, 운영 체제, I/O, 메모리 등 시스템의 모든 부분이 확장 가능하다는 점이었습니다.

1998년의 Cray SV1 시리즈.

Cray SV1 시리즈 - 1998년

첫 고객: Alabama Supercomputer Authority

재미있는 사실: Ford Motor Company는 Cray SV1 슈퍼컴퓨터 5대를 구매하여 이 시스템의 최대 고객이 되었습니다.

기술 사례: SV1 확장형 벡터 시스템은 4기가플롭의 최고 성능을 지원하는 프로세서, 32기가플롭의 최고 성능을 지원하는 단일 캐비닛 노드, 1테라플롭을 지원하는 슈퍼컴퓨터의 생산을 위한 시스템 클러스터링 툴을 제공했습니다. 이를 통해 세계 최초의 벡터 캐시 메모리와 같은 혁신 기술이 탄생했습니다. 또한 경쟁 제품보다 가격 대비 성능이 8배 더 높았습니다.

2002년의 Cray X1/X1E.

Cray X1/X1E - 2002년

첫 고객: 미국 국방부

재미있는 사실: Cray® X1 프로세서의 온도가 너무 높아 엔지니어들이 모듈의 과열 방지를 위해 혁신적인 증발 분무 기술을 개발했습니다.

기술 사례: Cray X1 시스템은 벡터 시스템의 프로세서 성능과 대규모 병렬 처리의 확장성을 함께 지원했으며, 이는 오랫동안 불가능하다고 여겼던 성과였습니다. 고성능 상호 연결 및 메모리 하위 시스템으로 X1 시스템은 프로세서 4,096개와 최고 성능 50테라플롭까지 확장 가능하게 되었습니다. 주요 업그레이드 X1E는 최고 성능과 컴퓨팅 집적도가 3배 향상되었습니다.

2004년의 Cray XT 시리즈.

Cray XT 시리즈 - 2004년

첫 고객: Sandia National Laboratories

재미있는 사실: Cray는 오크 리지 국립 연구소의 XT5 ‘Jaguar’ 시스템(사진)으로 페타플롭의 장벽을 넘었습니다. Jaguar는 캐비닛 200개, 프로세싱 코어 224,256개, 1.759페타플롭으로 2009년부터 2010년까지 세계에서 가장 빠른 시스템이었습니다. 

기술 사례: Cray는 Sandia National Laboratories와의 파트너십을 통해 Cray® XT™ 시리즈가 될 기술을 개발했습니다. 대규모 병렬 처리 XT는 Cray 설계 상호 연결을 사용하고 공랭식이며, 캐비닛 한 개에서 수백 개로 확장 가능했습니다.

2006년의 Cray XMT.

Cray XMT - 2006년

첫 고객: Pacific Northwest National Laboratory

재미있는 사실: Georgia Tech의 연구자는 PNNL의 Cray® XMT™ 시스템을 사용하여 2009년 Twitter에서 가장 영향력 있는 사용자를 식별했습니다. 이 시스템은 최대 1,800만 명 사용자의 하루치 분량의 트윗을 한 시간 만에 처리했습니다.

기술 사례: Cray XMT 시스템은 공유 메모리 아키텍처가 적용된 확장 가능한 대용량 멀티스레드 플랫폼으로, 대규모 데이터 분석 및 데이터 마이닝에 적합합니다. 디자인은 Cray XT 컴퓨팅 블레이드를 바탕으로 하지만 사용자 정의 Cray Threadstorm 칩을 사용했습니다. 단일 Threadstorm 프로세서는 128개의 동시 스레드 유지가 가능했습니다.

2010년대: 빅 데이터 활용

2010년의 Cray XE6.

Cray XE6 - 2010년

고객 관련 사실: CSCS(Swiss National Supercomputing Centre)는 첫 번째 베타 시스템을 받았습니다.

재미있는 사실: CSCS의 Cray® XE6™ 시스템을 사용한 과학자들은 지구 자기장이 왜 계속 서쪽으로 이동하는지에 관한 300년 묵은 수수께끼를 풀었습니다. 문제는 바로 코어에 있었습니다.

기술 사례: XE6 슈퍼컴퓨터는 XT 시리즈 인프라를 사용하고, 멀티 코어 AMD 프로세서와 혁신적인 Cray Gemini 상호 연결을 결합했습니다. Gemini는 탁월한 메시징 속도를 제공하고 대기 시간이 대폭 개선되었습니다. XE6는 1백만 개가 넘는 프로세서 코어로 확장 가능하며 10페타플롭도 초과할 수 있습니다.

2011년의 Cray XK 시리즈.

Cray XK 시리즈 - 2011년

첫 고객: Swiss National Supercomputing Centre

재미있는 사실: 오크 리지 국립 연구소의 Cray® XK™ 시스템 ‘Titan’(사진)은 2012년 세계에서 가장 빠른 시스템 목록에서 1위를 차지했습니다. 이후 7년간 10위권에 머물렀습니다. 2019년 ORNL은 Cray® Shasta™ 시스템을 ‘Frontier’(Titan의 후속 모델)라고 이름 지었습니다.

기술 사례: Cray XK 시리즈는 Gemini 상호 연결, AMD 멀티코어 스칼라 프로세서, NVIDIA의 멀티코어 GPU가 결합된 진정한 하이브리드 슈퍼컴퓨터였습니다. 시스템은 프로세서 50만 개와 30페타플롭 이상으로 확장 가능했습니다.

2012년의 Cray XC 시리즈.

Cray XC 시리즈 - 2012년

첫 고객: High Performance Computing Center Stuttgart(사진)

재미있는 사실: 2016년 출시된 XC50 슈퍼컴퓨터는 단일 캐비닛에서 최대 1페타플롭의 최고 성능을 지원했습니다. 페타플롭의 장벽을 허문 첫 번째 Cray 시스템은 캐비닛이 200개였습니다.

기술 사례: 500페타플롭까지 확장 가능한 Cray® XC™ 시스템은 스칼라 처리, 공동 처리, 가속기 기술을 확장성이 뛰어난 단일 시스템에 통합했습니다. 또한 모든 지표에서 상당한 성능 향상을 가져온 Aries 상호 연결 기술을 도입하여 비용 효율적이고 확장 가능한 전역 대역폭을 제공하는 과제를 해결했습니다.

2012년의 Cray Urika Platforms

Cray Urika Platforms - 2012년

고객 관련 사실: 최초의 Cray® Urika® 제품은 Institute of Systems Biology, Mayo Clinic, Noblis, Swiss National Supercomputing Centre 등과 같은 얼리 어댑터가 구매했습니다.

재미있는 사실: Urika는 처음에 uRiKA로 표기했습니다. Universal RDF Integration Knowledge Appliance를 의미합니다.

기술 사례: 첫 번째 Urika 제품은 빅 데이터 관계 분석에 대한 그래프 기반 접근 방식으로 설계되었습니다. Cray Threadstorm 대용량 멀티스레드 프로세서와 대용량 공유 메모리 아키텍처를 사용했습니다. 이후 Urika-GD라고 불린 이 플랫폼에는 Urika-XA 익스트림 애널리틱스 플랫폼과 Urika-GX 애자일 애널리틱스 플랫폼이 추가되었습니다.

2013년의 Cray CS 시리즈.

Cray CS 시리즈 - 2013년

고객 관련 사실: 철도 기술 연구원은 CS 시리즈의 첫 번째 공식 고객으로 발표되었습니다.

재미있는 사실: Shadow, Ollie, BeBop, Nurion의 공통점은 무엇일까요? 힌트: 이들은 반려견이 아니고, TOP500 슈퍼컴퓨터 목록에 이름을 올린 CS 시리즈 시스템 중 일부입니다. Nurion은 2018년에 무려 11위에 올랐습니다.

기술 사례: Cray® CS™ 시리즈 클러스터 슈퍼컴퓨터는 프로세싱, 네트워킹, 냉각 분야의 최신 기술을 지원했으며 컴퓨팅, 데이터, 하이브리드 워크로드에 대해 고도의 맞춤 설정이 가능했습니다. 이 시리즈의 마지막 모델인 CS500 시스템은 60페타플롭스가 넘는 성능을 발휘했습니다.

2014년의 Cray CS-Storm.

Cray CS-Storm - 2014년

첫 고객: 미국 정부

재미있는 사실: Cray® CS-Storm™ 시스템이 2014년 출시되었을 당시 세계에서 집적도가 가장 높은 GPU 시스템이었습니다.

기술 사례: CS 시리즈 아키텍처를 바탕으로 하는 CS-Storm 슈퍼컴퓨터는 GPU 가속 워크로드용으로 설계되었습니다. 고집적 단일 랙은 최대 980테라플롭의 이중 정밀 성능을 제공합니다. 이 시스템은 기계 학습 및 딥 러닝, 유전 시뮬레이션, 지리 정보 등과 같은 컴퓨팅 워크로드 가속화에 매우 적합합니다.

2018년의 HPE Cray EX.

HPE Cray EX - 2018년

첫 고객: 아르곤 국립 연구소

재미있는 사실: 엑사스케일 HPE Cray 슈퍼컴퓨터는 Cray-1보다 60억 배 더 빠릅니다.

기술 사례: HPE Cray 슈퍼컴퓨터는 엑사스케일 시대의 워크로드에 적합하게 설계되어, 다양한 프로세서 기술과 컨버지드 워크로드를 지원하며, 슈퍼컴퓨터와 클러스터의 구분을 없애고, HPC 및 AI 워크로드와 클라우드의 생산성을 함께 제공합니다. 혁신적인 HPE Slingshot 상호 연결은 백본 역할을 합니다. 미국의 첫 엑사스케일 슈퍼컴퓨터 3대는 모두 HPE Cray 시스템입니다.