
CCS(Computer Chemistry System)가 화학물질을 다루는 의약품, 화학제품, 기능성 소재 분야의 연구개발을 지원하는 솔루션으로 부상하고 있다.
특히, R&D(연구개발) 분야에서는 데이터 구동형에 대한 관심이 높아지고 있다.
정보를 기반으로 연구 플랫폼을 공통화해 R&D의 업스트림부터 다운스트림까지 계열화하고, 글로벌한 연구거점이나 다른 기관과의 오픈 이노베이션을 추진하는 사례가 증가하고 있다.
연구업무 효율화, 개발기간 단축이 목적이나 공통된 기반에 정보를 결집함으로써 AI(인공지능), 기계학습으로 이어가기 위한 수단으로도 자리를 잡아가고 있다.
CCS에는 인포매틱스(Informatics), 모델링&시뮬레이션(M&S) 등 다양한 계열의 벤더가 있으며 최근에는 모두 데이터 구동형 R&D 관련대책을 강화하고 있다.
ELN, 화학‧소재 분야에 적용 확대
전자연구노트(ELN: Electronic Lab Notebook)는 연구정보를 수집, 축적, 공유해 활용하는 작업을 주도하고 있다.
물질과학에서는 화학적 합성, 계측‧분석 등 실험이 데이터를 창출하는 근본으로 어떠한 실험을 실행할지를 계획하고 절차 및 결과를 상세히 기록하는 ELN이 연구 플랫폼의 중심으로 부상하고 있다.
ELN은 주로 신약 개발 분야에서 보급된 시스템으로 종이에 기록된 실험노트를 전자화해 기록을 검색‧재이용함으로써 지식재산권 전략 등에 이용하는 목적으로 사용되고 있으나 최근에는 제각각 운영되던 화합물 등록 시스템, 시약 관리 시스템, 어세이(Assay) 시험데이터 관리 시스템 등을 통합해 연계하는 기반으로 활용되고 있다.
화학‧소재 분야에서도 ELN 도입이 활발해지고 있다.
데이터 구동형 연구 스타일인 소재 인포매틱스(MI: Material Informatics)에 대한 관심이 높아졌기 때문으로, MI는 AI 및 기계학습을 이용해 소재의 구조‧조성과 물성‧기능의 상관관계를 학습함으로써 예측모델을 구축하는 것을 목표로 다양한 프로젝트가 진행되고 있다.
특히, 화학‧소재 분야는 의약품을 비롯한 생명과학 분야에 비해 데이터 축적이 크게 부족해 ELN 도입에 대한 니즈가 높아지고 있다.
ELN 벤더들도 화학‧소재 분야의 디지털 전환을 구체화하는 요소로 부각시키기 위한 전략을 본격화하고 있다.
PerkinElmer의 ELN과 ChemAxon의 인포매틱스 솔루션을 제공하고 있는 후지츠(Fujitsu)는 이미 몇 년 전부터 해당 니즈에 대한 대응을 본격화하고 있는 가운데 2019년 11월 제1회 MI 세미나를 개최해 사업전략을 어필한 것으로 알려졌다.
후지츠는 데이터를 모으는 입구를 여러 가지로 설정하고 있다.
우선 AI(지식 구조화와 자연연어 처리)를 응용해 학술문헌, 특허문서에서 화학 관련지식을 추출하고 특허명세서에 기재된 화합물 상세정보를 추출하거나 화합물 구조를 비교하는 ChemMon 시스템을 개발하고 있다.
또 시뮬레이션 결과를 학습데이터로 사용하기 위해 계산화학 통합 플랫폼 SCIGRESS, 양자현상에 착안한 조합 최적화 문제 전용 초고속계산기 Digital Annealer, HPC 클라우드 서비스 TC Cloud를 이용하고 있으며 실험데이터 회수에 ACD/Labs를 사용해 NMR, MS, IR, UV-Vis, 크로마토그래피 등 스펙트럼 데이터의 관리‧해석에 대응하고 있다.
축적한 데이터의 통계해석 및 기계학습에는 Spotfire와 후지츠가 독자적으로 개발한 Deep Tensor 기술을 적용하고 있다.
Itochu Techno-Solutions(CTC)는 제약 분야에 인포매틱스 솔루션을 투입한 바 있는 생명과학사업부와 소재 시뮬레이션 관련제품을 제공하는 과학시스템본부가 연계해 2019년 8월부터 MI 지원을 시작했다.
전략은 후지츠와 비슷하나 ELN은 Dassault Systemes의 BIOVIA를 채용하고 있어 BIOVIA에 포함된 소프트웨어 Pipeline Pilot으로 기계학습을 위한 데이터클렌징 등 다양한 처리를 자동화할 수 있는 강점이 있다.
R&D 효율화 및 기간 단축에 기여
Dotmatics는 2019년 11월 처음으로 Chemical & Material(MI&AI) 세미나를 개최해 화학‧소재기업의 관심을 끌고 있다.
모델로 설정한 수요기업은 클라리언트(Clariant)로 아직 MI에 대한 적용을 구상하는 단계이나 10개국 이상의 26개 연구소에 종사하고 있는 연구자 960명 이상을 대상으로 2020년 말까지 ELN을 도입할 계획이다.
ELN을 중심으로 데이터를 검색하는 BROWSER, 데이터를 해석하는 VORTEX, 화합물을 등록하는 REGISTRY, 시약을 관리하는 INVENTRY, 정보를 공유하는 GATEWAY, 시험데이터를 관리하는 STUDIES 등 다양한 애플리케이션을 연계할 방침이다.
Dotmatics는 클라리언트 외에도 바스프(BAST), P&G, 피르메니히(Firmenich) 등 화학‧소재기업에 해당 시스템을 투입한 경험이 있는 것으로 알려졌다.
Chemical & Material(MI&AI) 세미나는 Dotmatics가 주로 제약기업을 대상으로 사업을 진행한 영향으로 참석자가 약 20명에 불과했으나 일본에 앞서 한국에서 진행한 세미나에는 40명이 넘었던 것으로 알려졌다.
한국에서는 미국이 추진한 Material Genome Initiative(MGI) 프로젝트와 관련해 삼성그룹이 매사추세츠공과대학과 공동연구를 진행하고 있다.
MI를 이용함으로써 1년만에 도요타(Toyota Motor)가 5년을 소비한 전고체전지 소재 개발에 도달한 것으로, 삼성은 2011년 5월 도요타가 출원한 특허가 공개되기 이전인 2012년 10월 연구개발 성과를 발표했다.
클라우드형 ELN 벤더인 Arxspan을 인수한 브루커(Bruker)도 최근 화학‧소재기업으로부터 문의가 증가하고 있는 것으로 알려졌다.
브루커가 공급하는 핵자기공명(NMR) 장치는 의약품과 화학제품 분야에서 모두 측정에 이용되고 있어 기기와 연계함으로써 NMR 데이터를 포함한 연구데이터를 ELN에 결집하는 전략에는 타당성이 있는 것으로 파악되고 있다.
Arxspan은 서비스형 소프트웨어(SaaS) 시스템으로 데이터가 클라우드에 저장됨에 따라 해당 데이터를 검색해 추출한 후 기계학습에 이용하는 시나리오도 준비하고 있다.
MI, 계산데이터로 실험데이터 부족 해소
MI 분야에서는 계산, 시뮬레이션으로 새롭게 데이터를 생성해 부족한 실험데이터를 보충하려는 움직임이 나타나고 있다.
일본에서는 경제산업성 주도로 다양한 화학‧소재기업들이 진행하고 있는 초첨단소재 초고속개발 기반기술 프로젝트에 채용하고 슈퍼컴퓨터 Kyo를 산업적으로 이용하는 프로젝트가 일정한 성과를 거두면서 실험데이터 보충용 시뮬레이션의 가치가 향상되고 있다.
그러나 실험데이터는 계측기의 종류 및 계측조건이 다양할 뿐만 아니라 데이터가 제대로 갖추어지지 않아 오히려 균일한 계산데이터가 기계학습에 적합하다는 의견이 확산되고 있다.
이에 따라 일본 M&S계 벤더 Molsis는 MI 시장에 대한 접근을 강화하고 있으며 미국 Materials Design의 소재 설계지원 통합 시스템 MedeA를 제공하고 있다.
MedeA는 밴드 계산을 토대로 금속, 세라믹, 반도체 등 다양한 소재에 대한 구조 평가와 광학물성, 자성, 열역학물성, 탄성, 진동, 전자전도성 등 물성 평가가 가능한 시스템으로, 계산절차를 구축해 결과를 효율적으로 축적할 수 있는 것으로 알려졌다.
Schroedinger의 초고속분자 동력학 프로그램 Desmond도 해당 용도에 적합하며 콜라보레이션 툴인 LiveDesign으로 기계학습을 실시하는 환경을 마련하고 있다.
통계해석 툴인 QSPR(정량적 구조-물성 상관)을 이용해 계산데이터를 MI에 적용하는 벤더도 나타나고 있다.
JSOL은 소재 물성을 분석하는 소프트웨어 J-OCTA의 QSPR 기능을 확장해 MI용 심층학습 기능을 도입했다.
모노머 분자구조를 SMILES 표기로 입력하고 상관관계 학습을 원하는 물성값과 세트화해 GCN(Graph Convolutional Networks)으로 심층학습할 수 있는 프로그램으로, 물성값은 J-OCTA에 내장된 메소(Meso) 규모의 시뮬레이션 소프트웨어로 계산할 수 있으며 폴리머의 밀도, 유리전이온도, 특성비중을 미리 학습시킨 예측모델도 제공되는 것으로 파악되고 있다.
J-OCTA의 토대인 오픈소스판 OCTA는 경제산업성의 초첨단소재 초고속개발 기반기술 프로젝트에도 채용돼 높은 관심을 받고 있다.
Fujitsu Kyushu Systems은 2020년 4월 제공하는 계산화학 통합 플랫폼 SCIGRESS의 최신판에서 MI에 대응한 QSPR 기능을 강화할 예정이다.
GAMESS, LAMMPS, QuantumESPRESSO, PHASE/0, Gaussian 등 다양한 계산엔진을 이용할 수 있는 GUI(Graphical User Interface) 소프트웨어로, 분자구조와 물성의 상관관계를 스프레드시트 이미지로 간단히 해석할 수 있어 새로운 기계학습법 등이 등장할 것으로 기대되고 있다. (J)