노드(node)는 데이터를 전송하는 통로에 접속되는 하나 이상의 단위로, 통신망의 분기점이나 단말기의 접속점을 말합니다.
한 노드에 다수의 GPU를 장착하여 노드 당 계산 속도를 높이면 적은 수의 노드로도 많은 양의 계산을 한꺼번에 처리할 수 있는 장점이 있습니다.
만일 이것이 가능하면 슈퍼컴퓨터의 구축비용뿐만 아니라 소모되는 전력도 획기적으로 줄일 수 있습니다.
그러나 지금까지 다수의 GPU를 효율적으로 장착하는 소프트웨어 기술이 개발되지 못해 대부분의 슈퍼컴퓨터에는 각 노드 당 최대 2개의 GPU밖에 장착하지 못했습니다.
□ 서울대 이재진 교수팀은 일반 슈퍼컴퓨터와는 달리 노드 한 대에 최대 6개의 그래픽 처리장치(GPU)를 장착하는 방법으로 기존 슈퍼컴퓨터의 노드 당 계산 속도를 세계에서 가장 빠른 수준으로 끌어올리는데 성공했습니다.
이 교수팀이 개발한 소프트웨어 기술을 사용하면 노드마다 최소 3개 이상의 GPU를 장착하고 효율적으로 계산할 수 있습니다.
이재진 교수팀은 이번 연구결과를 바탕으로 16개의 노드(총 96개 GPU 장착)로 구성된 슈퍼컴퓨터 시작품 '스누코어(SnuCore)'를 자체 제작했습니다.
일반적으로 슈퍼컴퓨터의 계산 속도를 평가하는데 사용하는 프로그램인 린팩 벤치마크로 측정한 스누코어의 노드 당 계산 속도는 0.991테라플롭스(TFLOPS)로 이 수치는 현존하는 슈퍼컴퓨터 중에서 가장 빠릅니다.
게다가 전력효율 면에서도 와트당 871메가플롭스(MFLOPS)로 세계 20위권을 기록했습니다.
스누코어는 시중에서 흔히 구할 수 있는 부품(AMD의 CPU와 GPU, 타이안의 마더보드 및 멜라녹스의 인피니밴드 네트워크 장비 등)에 연구팀이 자체 설계한 냉각 시스템을 이용해 제작되었습니다.
서울대 매니코어 프로그래밍 연구단에서 자체 제작한 슈퍼컴퓨터 스누코어(SnuCore). 가운데 위치한 것이 자체 제작한 냉각 시스템이며, 좌우로 노드가 8개씩 위치하고 있다.
연구팀은 새로 개발한 소프트웨어 최적화 기술을 다양한 프로그래밍 언어 OpenCL과 MPI를 사용해 린팩 벤치마크에 적용하였고, 그 결과 스누코어의 각 노드에 장착된 6개의 GPU를 효율적으로 사용하여 세계에서 가장 빠른 노드 당 계산속도를 확보했습니다.
스누코어의 성능 대비 가격은 다른 세계 최상위급 슈퍼컴퓨터들과 비교해도 최대 8.3%(1/12)로 저렴합니다.
따라서 스누코어에 적용된 소프트웨어 기술을 사용하면 세계 최상급의 성능을 지닌 슈퍼컴퓨터를, 기성부품을 사용하여 저렴한 비용으로 구축할 수 있게 됩니다.
이 교수팀은 이번 연구결과를 서울대에서 개발하고 있는 OpenCL 기반의 프로그래밍 환경인 SnuCL에 적용해 추후 일반 국민에게도 공개할 예정입니다.
이재진 서울대 교수(오른쪽), 조강원 연구원(왼쪽), 나정호 연구원(가운데)이 슈퍼컴퓨터 SnuCore의 상태를 점검하고 있다.
용 어 설 명
린팩 벤치마크 (LINPACK Benchmark) :
벤치마크는 컴퓨터에서 실행시켜 처리시간과 같은 값을 측정해 컴퓨터의 성능을 평가하는 프로그램이다.
린팩 벤치마크는 컴퓨터의 계산 속도를 평가하는 벤치마크 중 하나로, 배정도(double precision) 부동소수점 연산(floating-point operation)이 필요한 선형 시스템의 해를 구하는데 걸리는 시간을 측정해 계산 속도를 측정한다.
린팩 벤치마크는 Top500에서 세계 500위권의 슈퍼컴퓨터를 선정하는 기준으로 사용되는 등 슈퍼컴퓨터의 성능 측정에 널리 사용되고 있다.
FLOPS (floating-point operations per second) :
컴퓨터의 성능을 측정하는 단위로 초당 수행할 수 있는 부동소수점(floating-point) 연산의 수를 의미한다.
'FLOPS' 앞에 '킬로(K)', '메가(M)', '기가(G)', '테라(T)'의 접두사가 붙으면 각각 초당 10의 3승, 10의 6승, 10의 9승, 10의 12승회의 실수 연산을 수행함을 의미한다.
예를 들어 2 GFLOPS는 초당 2×109 회, 즉 20억 회의 부동소수점 연산을 수행할 수 있음을 뜻한다.
OpenCL(Open Computing Language) :
개방형 범용 병렬 컴퓨팅 프레임워크
노드(node) :
데이터를 전송하는 통로에 접속되는 하나 이상의 단위. 주로 통신망의 분기점이나 단말기의 접속점을 말함
<연 구 개 요>
최근 고성능 컴퓨팅을 위해 그래픽 처리 장치(GPU)를 그래픽 처리 대신 일반적인 계산을 위해 사용하는 GPGPU(General Purpose computing on GPU) 기술이 보편화되기 시작하였다. |
<이재진 교수>
1. 인적사항 ○ 성 명 : 이재진(李在鎭, 44세) ○ 소 속 : 서울대학교 컴퓨터공학부 2. 학력 1986 - 1991 서울대학교 물리학 학사 1993 - 1995 Stanford University, Computer Science 석사 1995 - 1999 University of Illinois at Urbana-Champaign, Computer Science 박사 3. 경력사항 |
'과학산책 > 한국연구재단' 카테고리의 다른 글
당뇨성 알츠하이머-치매, 포도추출물이 효과 있다 (0) | 2012.03.06 |
---|---|
인공광합성 박찬범 교수, 3월 과학기술자상 (4) | 2012.02.29 |
유방암 억제하는 유전인자의 비밀 (2) | 2012.02.18 |
암만 골라서 진단하는 펩타이드의 새 플랫폼 '엡타이드' (0) | 2012.02.09 |
안정적인 전기자동차 배터리, 차세대 이차전지 양극소재 (0) | 2012.02.07 |