
CCS(Computational Chemical Sciences)는 데이터 구동형 사회 전환이 기대되는 가운데 연구개발(R&D) 분야의 DX(Digital Transformation)를 위한 IT(정보기술) 솔루션으로 부상하고 있다.
CCS는 그동안 경험 혹은 감에 의존했던 작업을 이론, 계산, 데이터 등으로 입증된 합리적인 방식으로 수행한다는 점에서 신뢰도가 높은 것으로 평가된다.
주요 CCS 기술 보유국인 일본은 1980년대부터 저분자 화합물 등 신약 개발 분야에서 합리적 분자설계 도입에 CCS를 활용했으나 최근 보다 광범위한 물질‧소재에 대응을 확대하고 있다.
특히, DX 인프라용 솔루션으로 도입이 확대되고 있으며, 연구실에서 사용하는 각종 기기로부터 데이터를 자동적으로 가져오고 데이터 전처리를 거쳐 기계학습을 통해 새로운 지식을 도출하는 시스템에 대한 니즈가 많은 것으로 알려졌다.
일본, 2023년 시장 627억엔으로 4% 성장
CCS는 신약 개발 등 생명과학 연구 및 화학‧소재 연구를 지원하는 IT 솔루션으로 자리를 잡아가고 있다.
CCS는 분자 모델링, 계산화학을 활용한 시뮬레이션, 실험데이터와 연구 정보를 관리하는 인포매틱스 플랫폼 및 전자실험 노트, 생명정보를 분석하는 바이오 인포매틱스, 연구에 기초 베이터를 제공하는 데이터 베이스 서비스, 대량의 데이터에서 지식을 도출하는 AI(인공지능) 및 기계학습 도구 등 다양한 소프트웨어로 구성돼 있다.
하드웨어로 과학기술계산/HPC(고성능 컴퓨터)를 위한 클러스터와 슈퍼컴퓨터, 미래 상용화가 기대되는 양자컴퓨터 등도 중요한 요소이다.
일본은 CCS 관련 솔루션 개발‧판매액을 기준으로 한 시장규모가 2023년 약 627억엔으로 전년대비 4.2% 성장했고 위탁연구 스타일의 AI계 벤더와 관련한 시장이 적어도 30억엔 이상에 달하는 것으로 파악된다.
최근에는 실험 데이터를 축적하는 정보 기반 전자실험노트 호조가 이어지고 있다.
전자실험노트는 과거 신약 연구를 위한 합성실험을 기록하는 시스템으로 사용됐으나 수년 전부터 바이오계 실험과 품질관리를 위한 시험 등으로 대상이 확대됐고 기능성 화학제품과 식품, 화장품 등도 적용을 시작했다.
신약 개발 연구와 달리 화학‧소재 연구는 실험 데이터를 체계적으로 남기는 관습이 없는 편이어서 연구 DX화를 추진할 때 필요한 데이터가 확보되지 않는 과제가 남아 있다.
이에 따라 먼저 데이터를 모을 수 있는 인프라와 전자노트가 주목받고 있으며, 2023년 CCS 시장의 성장 요인 중 하나로 전자노트 시장의 급성장이 부각된 것 역시 화학 분야의 흐름에 영향을 받은 것으로 판단된다.
데이터 확보 위해 서비스‧솔루션 사업 경쟁
CCS 벤더들은 서비스‧지원, 솔루션 제공을 주요 사업으로 육성하고 있다.
CCS 분야에서 실제 사용 가능한 데이터가 적은 과제를 해결하기 위한 것으로, 데이터 전처리에 투자하는 곳이 등장하고 있다.
이미 있는 데이터도 기계학습 등 데이터과학 처리에 들어갈 수 있는 상태로 정리된 것이 아니어서 절대적인 데이터 확보량이 부족한 편이기 때문에 전처리 투자가 선행돼야 사업 확장이 가능하기 때문이다.
만약 수요기업 사내에 전문 데이터 사이언티스트가 없으면 벤더 서비스를 이용하는 것이 효율적이며, 적은 데이터로 기계학습을 성공시키기 위한 기술을 갖춘 벤더도 증가하고 있다.
실험 데이터를 실제로 늘리는 방법도 주목받고 있다.
크게 실험 데이터를 직접 입력하지 않고 기기에서 데이터를 가져오는 스루풋 방법과 실험을 자동화‧로봇화해 많은 실험을 실시함으로써 데이터량을 늘리는 방법으로 구분되며 2개 방법을 조합하면 효과를 극대화할 수 있는 것으로 알려졌다.
일본 문부과학성이 추진하고 있는 첨단 소재 리서치 인프라(ARIM) 프로젝트도 데이터 확보량을 늘리기 위한 계획으로 파악된다.
계측‧분석, 가공 및 기기 프로세스, 물질‧소재 합성 프로세스 분야에서 전국 25개 대학과 연구기관의 연결‧자동화‧하이스루풋화된 첨단설비를 함께 사용해 창출한 데이터를 이용할 수 있는 형태로 축적하고 활용하는 것을 목표로 하고 있다.
1000대 이상의 첨단 연구설비를 인터넷에서 검색해 사용하고 싶은 장치를 찾고 기술 상담과 기기 이용, 측정 대행, 공동연구, 데이터 이용 등을 신청할 수 있도록 함으로써 일본의 소재 연구 DX 기반을 강화할 예정이다.
데이터 창출 위한 계산화학 기술 주목
DX를 실현하기 위해서는 분자 모델링 & 시뮬레이션(M&S)과 계산화학 기술 개발이 빠르게 진행돼야 할 것으로 판단된다.
계산은 데이터 과학을 위한 원천이며 실험과 같이 외부환경 영향을 받지 않기 때문에 정제된 데이터를 창출할 수 있는 장점이 있다.
흔히 분자동력학법(MD)과 분자궤도법(MO), 제1원리계산으로 알려진 양자역학법(QM) 등이 사용되며 실험치와 관련된 수치를 출력할 수 있게 됨에 따라 계산치를 기계학습 데이터로 이용하는 것도 가능해질 것으로 기대되고 있다.
다만, 경우에 따라서는 실험을 실시하는 것보다 시간이 더 걸릴 때가 있기 때문에 계산시간을 고속화하는 방법 개발이 요구되고 있다.
MLP(기계학습역장)는 QM 계산 결과를 재현하듯 학습한 역장 포텐셜을 MD 계산에 사용하는 기술로, MD 계산 실행속도에 가까운 시간 안에 QM 계산 수준의 정확도를 확보할 수 있다.
이밖에 계산 고속화와 GPU(그래픽 프로세서)를 이용하는 방법도 있으며 많은 계산화학 소프트는 GPU 대응을 강화하고 있다. GPU는 고가이기 때문에 클라우드 서비스를 이용해 GPU를 이용하는 곳이 많은 편이다.
계산화학은 DX 데이터의 원천이 될 뿐만 아니라 계산 자체가 디지털 실험이기 때문에 연구개발 전체를 가속화시키는 역할까지 하는 것으로 평가된다.
데이터 과학적 방법으로 제안된 물질과 소재의 타당성을 시뮬레이션으로 평가하거나 이론적으로 증명할 수 있다는 점에서 데이터와 계산이 각각 연구 DX의 중요한 축으로 떠오르고 있다.
양자컴퓨터, 2030년 오류 수정 기능 상용화
계산화학 분야에서는 양자컴퓨터 개발에도 관심을 나타내고 있다.
양자컴퓨터는 QM 계산을 극적으로 고속화할 수 있기 때문으로, 일본에서는 이화학연구소가 최초의 일본산 양자컴퓨터 1호기와 2호기를, 오사카(Osaka)대학에도 3호기를 설치해 가동하고 있다.
공동 연구를 통해 필요로 하는 일본기업이 활용하도록 했으며 이화학연구소는 2025년 봄 IBM의 양자컴퓨터도를 도입한 것으로 알려졌다.
도쿄(Tokyo)대학은 IBM과 함께 양자 이노베이션 이니셔티브 협의회(QII) 참가기업, 연구기관과 함께 양자컴퓨터를 이용할 수 있는 체제를 구축하고 일정수준 실제 컴퓨터를 조작할 수 있는 환경을 조성했다.
양자컴퓨터는 현재 오류 수정 기능이 없는 NISQ 머신을 사용하며 양자비트 수가 100-1000개 정도에 머무르고 있어 최종적으로는 오류 수정 기능을 갖춘 FTQC 양자컴퓨터가 개발되고 양자비트 수도 점차 늘어날 것으로 예상된다.
양자컴퓨터에서 양자회로를 그리는 행위는 일반 컴퓨터에서 프로그램을 만드는 행위에 해당하며 회로를 구성하는 양자비트는 노이즈 때문에 오류가 발생할 수 있으나 NISQ 단계에서는 오류 수정이 불가능해 신뢰할 수 있는 계산 결과를 얻기 어렵기 때문이다.
회로가 길어질수록 오류 확률이 높아지고 양자 상태가 계속되는 결맞음(Coherent) 시간이 짧아져 복잡하고 대규모인 프로그램을 실행하는 것은 불가능에 가깝다.
반면, FTGC는 수십개의 양자비트를 1개로 묶어 오류를 수정할 수 있으며 범용화를 위해서는 양자비트 수를 1억에서 10억개까지 늘려야 해 2030년에야 개발될 것으로 판단되고 FTGC 개발 전에는 양자화학 계산에 사용하는 양자회로 연구가 진행될 것으로 예상된다.
양자회로를 컴파일하는 소프트웨어가 개발된다면 미래 상용화될 양자컴퓨터 상에서 프로그램을 운영할 수 있게 되며 일부 화학기업들이 개발에 착수한 것으로 알려졌다.
소재 개발에 데이터 구동형 스타일을 도입하기 위해서는 MI(Materials Informatics)가 주목받고 있으며 현재까지 MI를 위한 시스템과 서비스가 다수 등록돼 있는 것으로 알려졌다.
대부분 개념실증(PoC) 단계이지만 이른 시기에 채용실적이 거둔 사례도 있어 상용화가 다가올 것으로 평가된다.
현재 스타트업들이 클라우드 서비스 형태로 MI 사업화를 추진하고 있으나 CCS 벤더들이 MI의 일부 혹은 종합적 니즈를 위탁하는 형태로 사업을 추진할 가능성이 제기되고 있다. (강윤화 책임기자: kyh@chemlocus.com)