CCS(Computer Chemistry System) 시장이 호조를 이어가고 있다.
CCS는 신약 연구로 대표되는 생명과학과 고도의 특성을 지니는 기능성 소재를 개발하는 소재과학의 핵심으로, AI(인공지능) 및 기계학습 열풍에 따라 인포매틱스(Informatics) 계열 시스템용 수요가 증가하고 있다.
특히, AI를 이용한 신약 연구 및 소재 인포매틱스(MI: Material Informatics)가 주목받고 있으며 선행연구 가운데 성공사례가 속속 등장하고 있다.
그러나 과학연구에 AI를 도입하기 위해서는 아직 해결해야 할 문제가 많아 우선 기계학습에 이용할 수 있는 디지털데이터 탐색이 중요해지고 있다.
특히, 전자연구노트(ELN: Electronic Lab Notebook)에 대한 관심이 높아지고 있다.
ELN 수요 호조로 성장세 지속
CCS는 의약, 화학, 소재 분야의 연구개발을 지원하기 위한 IT(정보기술) 솔루션으로 계산화학에 의거한 모델링&시뮬레이션(M&S), 연구정보를 관리하는 켐인포매틱스(Chem-informatics)/ELN, 생명정보를 해석하는 바이오인포매틱스(Bioinformatics), 특허 및 문헌 등을 조사하기 위한 데이터베이스 서비스 등 다양한 시스템이 포함된다.
CCS 관련 각종 솔루션을 개발·제공하고 있는 주요 벤더에 따르면, 일본 CCS 시장규모는 2017년 약 443억엔으로 전년대비 6.3% 성장했다.
경제가 안정세를 유지하고 있는 가운데 관련기업 영업실적이 비교적 호조를 보임에 따라 연구개발을 위한 IT 투자가 활발해졌기 때문으로 판단된다.
특히, 인포매틱스 솔루션에 대한 니즈가 두드러지게 나타나고 있다.
CCS 시장은 2000-2003년 전성기를 맞이했다.
이른바 바이오 열풍이 일어나면서 국가가 게놈(Genome), 프로테옴(Proteom) 해석에 대규모 예산을 투입하는 등 투자가 잇따랐기 때문이다.
최근에는 제약기업의 ELN 도입, 정보계 시스템 교체, 소재과학계 M&S가 성장을 견인하고 있으며 2017년 시장규모가 2003년을 상회한 것으로 추정되고 있다.
AI 및 기계학습 강화를 위한 인포매틱스 솔루션에 대한 니즈가 높아진 점도 큰 영향을 미치고 있다.
AI와 CCS는 관련성에 대한 정보가 그다지 알려지지 않고 있다.
AI가 1차 열풍을 일으킨 1960년대에는 미국 스탠퍼드대학교의 레더버그 박사가 세계 최초의 전문가 시스템인 덴드럴(Dendral)을 개발했다. 덴드럴은 적외 스펙트럼을 이용해 화학구조를 추정하는 기능이 있었다.
2차 열풍이 일어난 1980년대는 전문가 시스템의 전성기로 CCS 분야에서 유기합성 경로 설계에 대한 역합성 해석 등이 이루어졌다.
1990년대 들어서는 뉴트럴 네트워크가 등장해 스펙트럼-구조상관 해석, 단백질의 2차 구조 예측, 구조-활성상관 해석, 화학반응 과정 예측 등에 이용됐다.
3차 열풍부터는 AI 학습에 대량의 데이터가 필요해지기 시작했다.
AI·기계학습 활용 바이오신약 개발
신약 개발 분야에서는 1970-1980년대부터 화합물 데이터베이스를 구축함과 동시에 실험데이터를 관리했으며 최근에는 ELN을 이용한 인포매틱스 플랫폼화가 이루어지고 있다.
2000년대 이후에는 바이오계 데이터베이스가 구축됨에 따라 다양한 데이터를 이용한 AI 신약 개발이 가속화되고 있다.
특히, 기계학습을 이용한 물성·독성예측 등에 대한 시도가 잇따르고 있으며 구조-활성상관 해석으로 기존 CCS와 동일한 용도로 사용되고 있다.
이에 따라 통계학적 모델과 AI에 따른 모델의 예측 결과 차이를 비교할 목적으로 구조-활성상관 관련 모델링 소프트웨어에 대한 니즈가 다시 높아지고 있다.
기존 소프트웨어도 전통적인 기계학습법을 보유하고 있으나 대량의 최신 데이터를 활용해 다시 모델화하는 움직임이 나타나고 있다.
기존 CCS는 상용 소프트웨어로 벤더의 지원을 받을 수 있으나 최근 보급되고 있는 AI 툴은 대부분 오픈소스이기 때문에 자유자재로 다루기에 다소 장벽이 높은 것으로 파악되고 있다.
따라서 AI 계열 벤더의 도움을 받는 사례가 증가하고 있는 것으로 알려졌다.
생명과학 시장에서는 2017년 ELN 수요가 크게 증가했다.
선도적으로 도입한 수요처의 시스템이 최근 교체기를 맞고 있고 이용분야가 화학계에서 생물계, 분석계로 확대되고 있기 때문이다.
클라우드형 ELN에 대한 관심도 높아지고 있다.
On-premise 타입을 클라우드 타입으로 전환하는 사례, 처음부터 클라우드 타입이 메인인 ELN을 도입하는 사례가 있으며 On-premise와 클라우드를 모두 선택할 수 있는 벤더도 절반 가량이 클라우드 타입을 채용하고 있다.
MI, 인과관계 파악 가능한 AI 개발이 중요
소재 연구 분야에서는 데이터베이스가 일정수준 축적되고 있으나 연구기업 내부적으로는 체계적인 데이터 정리가 이루어지지 않아 개인컴퓨터에 저장된 사례가 많은 것으로 파악되고 있다.
소재 연구는 실험에 중점을 두는 시행착오적인 방법이 주류를 이루고 있음에도 장기간 크게 문제시되지는 않았으나 최근 MI가 주목받으면서 변화가 일어나고 있다.
MI는 소재에 관한 데이터를 수집해 새로운 지식을 추출함으로써 목표로 하는 기능 및 물성을 보유한 소재를 설계하는 것으로 바람직한 조성 및 구조를 제시할 수 있는 AI 개발이 중요한 요소로 자리 잡고 있다.
이에 따라 제약기업용으로 보급된 ELN이 주목받고 있다.
ELN 시스템은 데이터 수집 및 정리, 적절한 관리에 유효하게 사용할 수 있는 특징이 있어 수요가 서서히 증가하고 있다.
또 소재 분야는 기계학습을 수행하기 위한 데이터가 부족한 문제점이 있어 양자화학/제1원리 계산을 이용하는 방법이 부상하고 있다.
2017년에는 소재계 M&S 수요가 호조를 보였으며 MI 관련수요도 상당수준을 차지한 것으로 추정되고 있다.
계산기 고속화, 계산법 진보에 따라 실제 소재의 특성으로 이어지는 수준의 시뮬레이션이 가능해진 점도 중요한 영향을 미친 것으로 판단된다.
일본에서는 문부과학성의 정보통합형 물질·소재 개발 이니셔티브, 경제산업성의 최첨단 소재 초고속 개발 기반기술 프로젝트에 따라 MI에 대한 산업계의 관심이 높아지고 있다.
일본 고분자학회는 2017년 MI를 특별세션으로 다루었으며 Japan Fine Ceramics Center는 고안정성·고이온 전도체 개발 및 고유전율 소재 설계에, 히다치(Hitachi)는 모터 소형화에 기여하는 신형 자석 개발에, Asahi Kasei Chemicals (AKC)은 수지 컴파운드 및 AN(Acrylonitrile)용 촉매 개발에, 도쿄공과대학과 도호쿠대학은 실온에서 강유전성을 나타내는 갈륨철산화물 개발에, JGC C&C는 고활성 FCC 촉매 설계에 대한 적용에, Kishida Chemical은 차세대 전해액 개발에 MI를 활용하고 있다.
AI, 인과관계 해명 부족으로 신규 툴 개발
그러나 AI는 내열성을 향상시키는 등 이미 알려진 물질의 기능을 최적화하는데 적용할 수 있으나 완전히 새로운 물질을 발견하는 데에는 유효하지 않다는 의견이 제기되고 있다.
AI는 데이터의 상관관계를 색출할 뿐 인과관계를 해명하지는 못하기 때문이다.
예를 들어 키와 몸무게는 분명한 상관관계를 보유하고 있어 키가 크면 몸무게도 많이 나가나 양측에 인과관계는 없기 때문에 몸무게를 늘려도 키가 커지지 않는다.
따라서 AI를 이용한 추론은 흔히 블랙박스로 불리고 있다.
최강의 바둑 AI 알파고를 범용화한 알파제로는 AI가 직접 대전함에 따라 단 2시간만에 최강의 장기 AI로, 4시간만에 최강의 체스 AI로, 8시간만에 이전 알파고를 이기는 수준까지 성장했으나 인간은 AI가 무엇을 학습하고 있는지 파악하지 못하고 있다.
논리는 알지 못해도 결과만 맞으면 된다고 생각하는 사람도 있으나 원리나 법칙 없이는 과학적이라고 하기 어렵다는 의견도 제기되고 있다.
이에 따라 미국에서는 이해할 수 있는 AI를 개발하기 위한 프로젝트가 진행되고 있다.
아직까지는 AI를 특화한 CCS를 제공하는 벤더가 거의 없는 것으로 파악되고 있다.
2차 AI 열풍 때는 AI 구축 툴과 애플리케이션이 모두 상품으로 판매돼 구입 후 벤더의 지원을 받으며 일정하게 이용할 수 있었으나 최근 AI 툴은 오픈소스가 주류를 이루고 있다.
뛰어난 AI 기술을 보유한 스타트업기업은 매우 많으나 신약 및 소재 연구에 대한 지식이 없어 AI 이용을 원하는 수요자는 대부분 프로젝트 베이스로 AI를 구축해야 하는 것으로 파악되고 있다.
이에 따라 수요와 공급 분야에서는 모두 적절한 방안을 모색하는 시기가 당분간 계속될 것으로 예상되고 있다.
▶ 다음호에 계속