
CCS(Computer Chemistry System)는 의약품, 화학물질 및 소재의 성능을 고도화해 신속하게 개발하기 위한 자동화 시스템으로 발전하고 있다.
실험 및 측정을 통해 얻은 데이터를 디지털화하는 계측 인포매틱스(Informatics), 소재를 합성 또는 제조할 때의 반응조건과 조성, 제조공법을 탐구하는 프로세스 인포매틱스 기술개발도 잇따르고 있다.
앞으로는 원하는 기능과 특성을 보유한 물질을 설계하고 실제로 합성‧제조한 후 완성된 물질을 분석해 얻은 데이터를 통해 새로운 결론을 도출함으로써 전체 연구개발(R&D) 프로세스를 통합하고 장기적으로는 전체적인 자동화가 가능할 것으로 예상된다.
코로나19에 따른 원격업무로 성장세
CCS는 화학물질에 관한 연구를 지원할 목적으로 개발된 IT(정보기술) 솔루션으로 컴퓨터화학에 의거한 모델링과 시뮬레이션(M&S), 실험 데이터를 포함해 연구에 필요한 각종 정보를 관리하는 인포매틱스 및 전자연구노트(ELN: Electronic Lab Notebook), 생명정보를 해석하는 바이오 인포매틱스, 특허 및 과학기술 문헌 등을 조사하기 위한 데이터베이스 서비스 등 다양한 시스템이 활용되고 있다.
최근에는 클라우드가 보급됨에 따라 다양한 시스템을 가동하기 위한 호스팅 서비스도 확대되고 있으며, 특히 M&S는 계산량이 늘어남에 따라 클라우드 계산기 자원을 병용하는 사례가 증가하고 있다.
일본에서 CCS 관련 각종 솔루션을 개발하고 있는 주요 벤처들은 일본 시장이 2021년 약 557억엔으로 전년대비 11.4% 성장한 것으로 파악하고 있다.
사회적으로는 코로나19(신종 코로나바이러스 감염증) 영향이 계속되고 있으나 원격활동이 일반화됨으로써 벤처기업의 사업활동에 미치는 영향이 거의 사라지고 있다. 
2020년에는 코로나19의 영향으로 세미나, 학회, 전시회 등 각종 행사가 중단됨에 따라 프로모션 기회가 줄어들어 고전을 면치 못했으나 2021년에는 대부분 원격으로 사용자 모임을 재개했으며 공급제품 홍보를 겸하는 세미나는 오히려 코로나19 이전보다 활발해진 것으로 파악되고 있다.
동영상을 유효하게 활용하는 곳도 증가하고 있다.
세미나 등을 촬영한 영상을 업로드하면 당일에 참가하지 못한 사람도 시청할 수 있으며 트레이닝 영상을 라이브러리화함으로써 사용자가 언제라도 원하는 시간에 시청하면서 학습할 수 있어 시간과 비용을 감축할 수 있는 이점이 있기 때문이다.
원격으로 라이브 방송을 진행해 상호 소통하는 트레이닝도 기능적으로 가능해 다양한 방법을 조합함으로써 고객지원체제가 상당히 강화된 것으로 평가된다.
디지털전환 가속화도 성장 견인
일본 CCS 시장은 2021년 사업활동 정상화 뿐만 아니라 디지털 전환(DX) 가속화에 힘입어 크게 성장한 것으로 파악된다.
시행착오형 연구가 대부분이던 R&D 부문에서 DX가 이루어져 데이터 주도형으로 전환됨에 따라 CCS에 대한 투자가 활성화됐기 때문이다.
일본은 리먼 브라더스 사태 이후 10% 미만 성장에 그쳤으나 2021년에는 DX, MI(Materials Informatics)가 견인해 10% 이상 성장한 것으로 추정된다.
이전에도 AI(인공지능)를 이용한 신약 개발이 이루어졌으나 기계학습에 데이터를 이용할 뿐 연구 프로세스 자체를 데이터 주도형으로 혁신하려는 움직임은 나타나지 않았다.
그러나 DX 열풍이 일어남과 동시에 정부 차원의 주요 MI 프로젝트가 일단락됨에 따라 MI와 프로세스 인포매틱스, 계측 인포매틱스를 포함해 전체를 데이터 주도형으로 통합‧자동화하는 콘셉트가 등장했고 DX와 데이터과학이 통합된 R&D 부문의 DX 전략이 급속도로 확대되고 있다.
일부에서는 MI가 지속가능성에 기여한다는 의견을 제기하고 있다. MI 채용으로 시행착오적인 실험이 대폭 줄어들어 자원 낭비를 억제할 수 있기 때문이다.
MI를 이용해 개발하는 소재는 대부분 지속가능성 등을 타깃으로 삼고 있다.
신약 개발 분야에서도 기계학습을 통한 독성예측이 이루어지고 있으며 동물실험을 대체한다는 의미에서 SDGs(지속가능 개발목표)와도 연결되고 있다.
소재 연구에 계산화학 활용방안 주목
2021년에는 ELN을 포함해 데이터 기반 구축과 관련된 분야가 크게 성장했으며 실험‧계측기기와 연계해 데이터를 자동으로 축적하는 솔루션이 주목받았고 축적한 데이터를 활용하기 위한 시스템, 데이터 분석 툴, 연구 콜라보레이션을 위한 도구 및 서비스 등도 높은 관심을 받고 있다.
MI 및 AI를 활용한 신약 개발은 전문가의 도움이 필요함에 따라 위탁연구 방식으로 서비스를 제공하는 전문적인 AI 벤더가 많으며 화학기업의 저변이 확대되고 자동차, 전기 등 수요기업이 소재 연구를 주목함에 따라 수요가 더욱 확대될 것이 확실시된다.
계산화학, 시뮬레이션 분야도 데이터 주도형 MI와 관련해 크게 성장하고 있다.
소재는 MI를 위해 우선 사내 연구자료를 끌어모을 필요가 있으나 의약분자와 달리 조성, 형태가 제각각임에 따라 데이터 결손이 불가피하며 기계 및 실험조건도 다양해 기계학습의 트레이닝 데이터로 정리된 데이터를 세팅하기 어려운 문제점이 나타나 계산화학 이용전략이 주목받고 있다.
계산값을 데이터화해 소재의 기능‧특성과의 상관관계를 학습하는 것으로 전자를 취급할 수 있는 제1원리 계산, 양자화학 계산을 이용해 분석하면 실용적인 물성과 관련이 있는 계산값을 구할 수 있을 것으로 기대되고 있다.
아울러 전자상태를 고려할 수 있는 제1원리 분자동력학 계산을 이용해 각종 계산 데이터를 창출함으로써 기계학습에 활용하고 있다. 매우 유효한 전략으로 M&S 수요를 견인하고 있다.
최근에는 다양한 계산조건을 통해 되도록 많은 데이터를 계산할 필요가 있는 계산화학 분야의 니즈에 대응하고 있으며 주로 실제 세계에서 얻은 데이터를 관리하던 인포매틱스 기반에 시뮬레이션 시스템을 연결하는 움직임도 등장하고 있다.
특히, MI는 신소재가 대상이고 경험적인 역장을 사용하지 않는 제1원리 계산이 유효하나 슈퍼컴퓨터 등 대규모 계산 환경이 필요함에 따라 외부 계산센터를 클라우드로 이용하는 사례가 증가하고 있다.
오래전부터 존재했으나 최근 들어 수요가 구체화되고 있다.
그러나 슈퍼컴퓨터를 이용해도 계산 부하가 높은 문제점이 있어 분자력장을 기계학습으로 생성하는 뉴럴네트워크(Neural Network) 역장에 대한 관심이 급속도로 높아지고 있다.
제1원리 계산 결과를 학습시켜 재현할 수 있도록 포텐셜에너지(Potential Energy) 역장을 조절하는 것으로 해당 역장을 이용한 계산은 실제로 분자동력학 계산이어서 제1원리 계산과 동일한 결과가 얻어져도 계산비용을 크게 감축할 수 있는 것으로 알려졌다.
경험적인 역장이 없는 계열에서도 계산할 수 있어 신규성이 높은 물질을 대상으로 하는 MI 용도에 적합한 것으로 파악되고 있다.
그러나 트레이닝 데이터로 어떠한 구조에 대해 얼마만큼의 계산 결과를 준비해야 하는지 확실하지 않으며 많은 제1원리 계산을 실행하면 제1원리 계산을 줄이기를 원하는 기존 목적에도 반하게 된다.
역장 정밀도를 보증하는 기계학습 자체가 전문적이고 어렵다는 문제점도 있으나 최근에는 실제로 이용할 수 있는 뉴럴 네트워크 역장이 부상하고 있다. (J)