본문 바로가기

연산능력 100 AI 페타플롭스 슈퍼컴…MIT 링컨 연구소, AI 특화된 TX-GAIA 구축

반응형

전 세계 기업, 기관, 대학의 슈퍼컴퓨터 도입 및 구축 경쟁이 치열하다. 더 빠르고 강력한 성능을 가진 슈퍼컴을 보유하기 위한 경쟁 속에서, 최근에는 연구 분야와 목적에 특화된 슈퍼컴 개발도 증가하고 있다. 이러한 가운데 미국 MIT 대학교 링컨 연구소 슈퍼컴 센터(Lincoln Laboratory의 Supercomputing Center) TX-GAIA(Green AI Accelerator)라고 이름 붙인 슈퍼컴 구축을 완료했다고 발표했다.

 

TX-GAIA는 ‘Green AI Accelerator)라는 이름에서 짐작할 수 있듯이, 인공지능 연구에 특화된 기능을 갖춘 슈퍼컴퓨터다. 모델링이나 시뮬레이션 같은 기본적인 슈퍼컴의 기능은 물론, 복잡한 심층 신경망(DNN;Deep Neural Network)을 수행할 수 있는 고성능 컴퓨팅(HPC;High Performance Computing)과 인공지능(AI;Artificial Intelligence)에 최적화된 성능을 제공하도록 설계됐다.

 

TX-GAIA(Green AI Accelerator)가 구축된 MIT 대학교 LLSC의 모듈형 데이터센터인 에코팟(EcoPOD) 모듈형 데이터 센터. TX-GAIA는 100 AI 플롭스의 심층신경망 연산능력을 갖췄으며, 인텔 제온 스케일러블 프로세서와 엔비디아 32GB V100 GPU가 각각 896개 사용됐다.(사진:MIT LLSC)

 

TX-GAIA 구축은 HPE(Hewlett Packard Enterprise)가 담당했다. HP는 ‘HP Apollo 2000’  시스템을 기반으로, 인텔 제온 스케일러블(Intel Xeon Scalable) 프로세서와 AI 응용프로그램 구동에 최적화된 엔비디아의 GPU를 각각 896개 사용해 구축했다. 프로세서의 코어 수는 CPU 당 20개로 전체 코어 수는 1만 7,920개(896*20)에 달한다. 엔비디아 GPU는 32GB V100이 탑재됐다. 전체 노드(nodes) 수는 448개로 구성된다. 

 

린팩(LINPACK) 벤치마크로 측정한 최대 연산속도(Rmax)는 일초에 약 4천 725조번  연산이 가능한 4.725페타플롭스다(petaFLOPS). 페타플롭스는 10의 15제곱으로 1,000조를 의미하며, 이러한 연산속도를 갖춘 슈퍼컴을 페타스케일 슈퍼컴이라고 한다. 전 세계 슈퍼컴 순위를 집계하는 TOP500에 등재된 모든 슈퍼컴은 페타 스케일 슈퍼컴퓨터로 구성되어 있다. 

 

재 슈퍼컴퓨터 1위는 미국 오크리지 국립연구소에 있는 서밋(Summit)으로 약 148.6페타플롭스의 처리속도(Rmax)를 가지고 있다. 텍사스주립대 오스틴 캠퍼스의 텍사스 첨단 컴퓨팅 센터에서 운영에 들어간 프론테라(Frontera)는 23.5페타플롭스의 연산속도(Rmax)를 제공하며, 전 세계 슈퍼컴퓨터 순위 5위에 올라 있으며 대학에 설치된 슈퍼컴 중에서 가장 빠른 것으로 알려져 있다.

 

TX-GAIA는 이러한 슈퍼컴과 비교하면 단순 연산속도는 비교도 되지 않을 만큼 느리지만, 심층신경망(DNN)을 작업을 처리하는 척도를 나타내는 AI 플롭은 약 100 AI 페타플롭스 전 세계 대학에 설치된 AI 슈퍼컴 중에서는 가장 빠르다는 것이 링컨 연구소 슈퍼컴 센터의 설명이다. 심층신경망은 대량의 데이터에서 패턴을 인식하는 방법을 배우는 AI 알고리즘 클래스의 일종이다. 

 

심층신경망은 음성인식이나 컴퓨터 비전 등 다양한 분야에 활용되며, 연구 및 적용 환경이 다양해지면서 더욱더 많은 양의 데이터 세트(Data Set)를 처리해야 한다. 데이터 세트가 많아지면 상대적으로 처리하는 데 많은 시간이 걸릴 수밖에 없다. TX-GAIA는 엔비디아의 GPU 가속기를 활용해 이러한 심층신경망 연산작업을 빠르게 수행할 수 있도록 설계했다고 HPE와 링컨 연구소 슈퍼컴 센터는 전했다. 

 

TX-GAIA는 매사추세츠 주 홀리 요크에 있는 링컨 연구소 슈퍼컴 센터의 에코팟(EcoPOD)이라는 새로운 모듈형 데이터 센터에 설치됐다. 이곳에서 MIT를 비롯한 다른 기관과 협업하는 TX-E1과 TOP500 목록에서 490위에 올라있는 TX-Greem 슈퍼컴 등과 함께 운영된다. 앞으로 TX-GAIA는 심층신경망을 사용하는 알고리즘을 포함한 머신러닝 알고리즘 훈련을 위해서 사용될 예정이다. 

 

앞으로 TX-GAIA는 수십만 개의 이미지나 수년간의 음성 녹음 샘플로 이루어진 데라바이트 단위의 데이터를 분석하며, 머신러닝 알고리즘을 이용해 스스로 분석하는 솔루션을 스스로 알아낼 수 있는 훈련을 하게 된다. 이를 통해 기상 및 기후 예측 능력 개선, 의료 데이터 분석 가속화, 자율 시스템 구축, 합성 DNA 설계, 신소재(new material) 및 장치 개발, 인공지능은 물론이고 복잡한 연산과 대용량 데이터를 처리해야 하는 다양한 연구에 활용된다.

 

 Syndicated to WWW.CIOKOREA.COM

반응형