[뉴서울타임스] 고대성 기자 = 엔비디아가 마이크로소프트(Microsoft)의 클라우드 컴퓨팅 플랫폼 애저(Azure)에서 구동되는 새로운 GPU 가속 슈퍼컴퓨터를 공개했다.
가장 까다로운 인공지능(AI) 및 고성능 컴퓨팅(HPC) 애플리케이션을 처리하도록 설계된 애저의 새로운 NDv2 인스턴스는 세계에서 가장 빠른 슈퍼컴퓨터 중 하나로, 단일 멜라녹스 인피니밴드(Mellanox InfiniBand) 백엔드 네트워크에서 상호 연결된 최대 800개의 엔비디아 V100 텐서 코어(Tensor Core) GPU를 제공한다.
이안 벅(Ian Buck) 엔비디아 가속 컴퓨팅 담당 부사장 겸 총괄은 “지금까지 AI와 HPC를 위해 슈퍼컴퓨터를 이용할 수 있는 기회는 주로 세계 최대규모의 기업 및 기관에 국한됐다. 마이크로소프트 애저의 새로운 제품은 AI를 민주화시켜, 세계가 직면한 주요 도전과제들의 일부를 해결하는데 필요한 툴을 폭넓게 이용할 수 있도록 한다”고 설명했다.
관계자에 따르면 복잡한 AI, 머신러닝 및 HPC 워크로드에 이상적인 이 새로운 제품은 기존 CPU 기반 컴퓨팅과 비교해 성능과 비용 모든 측면에서 상당한 이점을 제공한다. 빠른 성능을 제공하는 솔루션이 필요한 AI 연구진은 여러 NDv2 인스턴스를 신속하게 스핀업(spin up)하고 복잡한 대화형 AI 모델을 단 몇 시간 만에 교육할 수 있다.
마이크로소프트와 엔비디아 엔지니어들은 시험판 버전의 클러스터에서 64개의 NDv2 인스턴스를 사용하여 구글의 AI 언어모델인 버트(BERT)를 약 3시간 만에 훈련시켰다. 여기에는 NCCL, 엔비디아 쿠다 X(CUDA X) 라이브러리, 그리고 고속 멜라녹스 인터커넥트에서 제공되는 다중 GPU 최적화가 활용됐다.
<저작권자ⓒ뉴서울타임스.무단전재-재배포 금지>