클라우드, 연구개발에도 적용 기대
계산화학, 분자모델링, 시뮬레이션 분야에서는 클라우드 활용에 대한 요구가 높아지고 있다.
ERP(Enterprise Resource Planning)를 시작으로 기업의 기간 시스템은 대부분 클라우드 환경으로 넘어가 다양한 금융정보를 비롯해 기업경영, 기업활동에 관한 데이터가 매일 네트워크을 통해 오가고 있다.
그러나 연구개발 부문은 클라우드 활용이 늦어지고 있다.
연구데이터를 외부에 공개할 수 없다는 인식이 뿌리 깊게 자리 잡고 있어 컴퓨터를 외부 네트워크에 접속할 수 없는 연구소도 적지 않기 때문이다.
하지만, 최근 인식이 변화하고 있다.
의약품 연구개발 과정 중 후기 임상시험에서는 일반적으로 병원 등의 시험기관과 네트워크를 통해 데이터를 주고받고 있으나 정보 기밀도 측면에서 초기 연구 단계의 화학구조 데이터와 큰 차이가 없는 것으로 여겨지고 있다.
또 시뮬레이션 실용화를 목표로 한다면 고정밀 모델을 이용해 대량 또는 대규모 계산을 수행해야 하지만 적합한 대형 계산기 자원을 사내에서 마련하기 어려운 문제점이 있다.
시뮬레이션은 제조업 경쟁력의 원천으로 중견·중소기업으로도 확산되고 있으나 대기업을 제외하고는 자체적으로 슈퍼컴퓨터를 도입할 수 있는 곳이 많지 않은 것으로 파악되고 있다.
이에 따라 클라우드에 대한 관심이 높아지고 있다.
클라우드는 사용방식에 따라 폐쇄형(Private)과 공개형(Public)으로 분류된다.
폐쇄형 클라우드는 사내 시스템을 외부 데이터센터 사업자에게 아웃소싱해 운용하는 방식으로 고객별로 분리된 전용 환경을 구축할 수 있어 보안도가 높은 특징이 있으며, 공개형도 특정 환경을 1사만 독점 사용할 수 있는 방식이 있으나 기본적으로는 많은 유저가 시스템을 공유하는 방식이다.
클라우드 서비스는 어떤 자원을 제공하느냐에 따라 IaaS(서비스로서의 인프라스트럭처), PaaS(서비스로서의 플랫폼), SaaS(서비스로서의 소프트웨어)로 크게 구분된다.
PaaS 및 IaaS는 원하는 애플리케이션을 사업자가 제공하지 않기 때문에 사용자가 직접 소프트웨어 개발자와 협상해 라이선스를 취득한 후 클라우드에 설치해야 한다.
반면, SaaS는 웹에서 소프트웨어를 빌려 쓰는 방식으로, 별도로 프로그램을 설치할 필요 없이 일정 비용만 지불하면 곧바로 사용할 수 있으며 중앙에서 소프트웨어를 관리하기 때문에 사용자가 일일이 업그레이드나 패치 작업을 할 필요가 없는 장점이 있다.
일본, 무상 이용 가능한 HPCI 제공
일본은 민간기업이 무료로 외부 슈퍼컴퓨터를 이용할 수 있는 HPCI(High Performance Computing Infrastructure)를 국가 차원에서 제공하고 있다.
HPCI는 슈퍼컴퓨터 Kyo(京)를 중심으로 전국 국립대학·연구기관의 슈퍼컴퓨터를 연결한 거대 네트워크로, 학술연구에 공용하기 위한 시스템 내에 산업 이용이 가능하도록 일정범위를 지정하고 있다.
사전에 과제를 제출해야 하지만 허가 후에는 무상으로 사용할 수 있어 CCS와 관련된 이용실적이 많은 것으로 알려지고 있다.
HPCI 시스템을 구성하는 하드웨어는 매우 다양하며 산업 부분은 전반적으로 Kyo를 쉽게 이용할 수 있도록 설정됐다.
또 성과를 비공개로 전환할 수 있는 유상제도도 구비하고 있다.
HPCI에서 이용된 애플리케이션 TOP10은 1위가 분자동력학법(MD)인 GROMACS, 3위가 MD인 MODYLAS, 6위가 MD인 GENESIS, 7위가 MD인 LAMMPS, 소재계 제1원리 계산인 Quantum ESPRESSO, VASP, 10위가 양자화학 계산인 NTChem로 나타났다.
산업에서는 LAMMPS 이용률이 높은 것으로 파악되고 있다.
HPCI는 2017년부터 이용을 촉진하기 위해 애플리케이션 환경을 정비하고 있으며 OpenFOAM, LAMMPS, Quantum ESPRESSO, GROMACS 등 이용량이 많은 소프트웨어는 문턱을 낮추기 위해 Kyo에 우선적으로 구축하고 있다.
유상 클라우드 서비스로는 공익재단법인 계산과학진흥재단(FOCUS)이 FOCUS Supercomputer를 제공하고 있다.
FOCUS Supercomputer는 HPCI로 Kyo를 이용하기 전에 입문용으로 사용할 수 있도록 만들어졌으며 슈퍼컴퓨터를 처음 이용하는 사용자를 위해 강습회, 상담 등을 실시하고 있다.
실제로 Kyo의 산업 이용에 채택된 과제 가운데 약 60%가 사전에 FOCUS를 이용한 것으로 알려졌다.
이용자는 대기업이 58%로 가장 많고 중소기업이 21%, 소규모 사업자가 15%를 차지하고 있으며, 2017년 11월 기준 이용법인은 270사, 과제는 400건을 넘어선 것으로 파악되고 있다.
슈퍼컴퓨터 자체는 FOCUS가 독자적으로 정비한 시스템으로, A 시스템부터 2016년 증강한 주력기기 H 시스템까지 총 8종류의 슈퍼컴퓨터를 이용할 수 있으며 GPU(Graphic Processor) 탑재형도 보유하고 있다.
모두 Xeon 계열이며 OS는 Linux를 전면 채용했고 요금은 시스템별 종량제 방식으로 부과된다.
애플리케이션은 유체해석, 구조해석, 기구해석, 계산화학, 전자장해석, 음향해석 등 다양하며 상용 애플리케이션을 많이 지원하고 있다.
계산화학 분야는 상용인 Advance/PHASE, AMBER, CONFLEX, Gaussian09/16, J-OCTA VSOP, Materials Studio, MIZUHO/BioStation, SCIGRESS ME, WIEN2k를 포함한 총 24개로 유체해석에 이어 많으며, 특히 Gaussian을 비롯해 오픈소스인 GAMESS, LAMMPS를 많이 이용하는 것으로 알려졌다.
또 Gaussian과 MIZUHO/BioStation은 FOCUS가 라이선스를 보유하고 있어 사용자가 이용시간만큼 요금을 지불하기만 하면 사용할 수 있다.
MI 분야에서 딥러닝 적용
후지쓰와 Itochu Techno-Solutions(CTC)은 민간 SaaS 사업자로 계산화학을 의식한 서비스를 제공하고 있다.
2011년 12월 서비스를 개시한 Fujitsu의「TC Cloud」는 HPC에 특화된 시스템으로 유체해석, 구조해석, 계산화학 등 총 68종류의 애플리케이션을 이용할 수 있다.
유체해석, 구조해석 등은 대부분 상용 애플리케이션이며, 계산화학 분야도 GAMESS, LAMMPS, GROMACS, PHASE/O 등 오픈소스를 비롯해 자체 개발한 SCIGRESS 및 Gaussian, SIESTA, WIEN2k 등 상용 애플리케이션을 지원하고 있다.
플랫폼과 애플리케이션 이용료는 종량제로 지불하는 가격체계를 채용하고 있다.
2017년 여름에는 GPU를 탑재한 계산 리소스 서비스를 새롭게 추가했다. GPU를 시간종량, 일정액, 월정액으로 이용할 수 있으며 동시에 고속기억장치를 일정액으로 이용할 수 있어 AI 학습에 최적인 환경을 제공하고 있는 것으로 평가되고 있다.
또한 MI를 대상으로 한 「TC Cloud 2.0」 서비스를 개시했다.
TC Cloud 2.0은 Fujitsu의 AI 「Zinrai」를 기반으로 하고 있으며 딥러닝(Deep Learning) 기술은 독자 개발한 딥텐서(Deep Tensor)를 활용하고 있다.
딥텐서 기술은 응용범위가 넓으며, 특히 화학구조를 텐서 표현으로 변환해 자동으로 특징을 추출하는 딥러닝이 가능한 특징이 있다.
신약 연구의 가상 스크리닝에 적용되고 있으며 사람이 발견하지 못한 새로운 특징을 200개 가량 획득해 기존 방법에 비해 예측 정밀도가 10% 향상된 등 다양한 성과를 내고 있다.
후지쓰는 TC Cloud 2.0을 베이스로 소재의 실험·측정데이터, 소재계 시뮬레이션에 따른 계산결과 등을 학습데이터로 활용함으로써 소재와 관련된 현상의 원인 분석, 물성 개량에 대한 지침을 얻는 것을 목표로 세우고 있으며 TC Cloud 2.0을 MI 연구기반으로 육성할 방침이다.
계산화학 분야에서는 TC Cloud 2.0이 양자화학 계산 패키지의 대명사격인 Gaussian을 정식으로 제공하고 있다는 점이 메리트로 작용하고 있다.
2016년 라이선스를 취득한 Gaussian은 완전한 시간종량제로 이용할 수 있으며 입력파일을 전송해 TC Cloud」의 커맨드 라인으로부터 쉽게 계산을 실행할 수 있는 특징이 있다.
이밖에 생명과학 분야에서는 GROMACS, 소재과학 분야에서는 LAMMPS의 이용률이 높은 것으로 알려졌다.
저렴하고 간편한 오픈소스도 제공
CTC는 미국 Rescale에 투자하며 2015년 9월부터 HPC 전문 클라우드 서비스 「Rescale」을 제공하고 있다.
Rescale은 HPC에 특화된 시스템으로 기업의 IT 부문이 아닌 현장 연구자·기술자를 지원한다는 콘셉트 하에 100개 이상의 애플리케이션을 보유하고 있다.
이용요금은 종량제로 부과되는 후불이나 선불 중 선택할 수 있다.
계산화학 애플리케이션은 오픈소스를 중심으로 GROMACS, LAMMPS, NAMD, GAMESS, Quantum ESPRESSO 등을 라인업하고 있다.
실제로 이용하는 데이터센터는 일본, 아시아, 미국, 유럽 등 30곳에 분산돼 있으며 미국의 공공 슈퍼컴퓨터도 이용할 수 있는 것으로 알려졌다.
GPU, 인피니밴드(InfiniBand) 등 특수한 하드웨어를 갖춘 자원도 있어 HPC 관련으로는 거의 모든 용도에 적응할 수 있고 브라우저로 포털에 접속해 입력파일을 업로드한 후 리스트에서 원하는 애플리케이션을 선택하면 적합한 서버 목록이 표시되고 설치 및 튜닝 상황 등도 확인할 수 있는 등 사용법이 간단한 장점이 있다.
세계적으로는 유체해석, 구조해석 등 기계계열 CAE에서 많이 사용되고 있으나 일본에서는 최근 수년간 계산화학 분야에 주로 채용되고 있는 것으로 알려졌다.
Rescale은 AI를 응용한 딥러닝에도 활용되고 있다.
AI는 GPU 사용이 필수적이나 직접 GPU 환경을 구축하는 것은 코스트 부담이 크기 때문에 AI에 대한 첫걸음으로 우선 「Rescale」을 이용하는 사례가 증가하고 있다.
특히, 딥러닝은 화학기업이 다른 제조업에 비해 몰두하고 있는 것으로 파악되고 있다.