계산을 통한 화학물질 독성평가에 관심이 모아지고 있다.
미국·일본·유럽연합(EU) 의약품국제조화회의(ICH)의 M7 <잠재적 발암 리스크를 줄이기 위한 의약품 속 DNA 반응성(변이원성) 불순물 평가 및 관리> 가이드라인(안)이 2014년 6월 시행된 Step4, 2015년 Step5를 토대로 독성 예측 소프트웨어를 제공하는 CCS(Computer Chemistry System) 판매기업과 수요처인 제약기업이 구체적인 준비를 가속화하고 있기 때문이다.
이에 따라 일본은 CBI학회(정보계산화학생물학회) 소속으로 계산독성학연구회를 조직하는 등 응용을 확대하기 위한 대책에 힘을 기울이고 있다.
계산독성학, 화합물·환경규제로 응용 확대
계산을 통한 물성 예측은 QSAR(Quantitative-Structure Activity Relationship)을 통해 오래전부터 CCS의 테마로 자리 잡고 있다.
화합물의 구조적인 특징을 나타내는 Descriptor인 기술어를 이용해 생물학적, 물리적 성질과 화학구조의 관계를 통계학적으로 해석함으로써 예측모델을 생성하는 것으로, 이미 의약 등의 연구현장에서 생물활성 평가, 체내동태에 관여하는 ADME(흡수·분포·대사·배설) 특성 검토, 독성 스크리닝 등에 활발하게 이용되고 있다.
또 REACH 등으로 대표되는 화합물 규제, 환경 관련 규제, 동물실험 금지에 대한 예측공법 등 다양한 분야 및 연구에서 주목받고 있다.
특히, 화장품 분야는 EU가 동물실험을 금지하고 있어 인비트로(in vitro), 인실리코(in silico) 데이터만 검증자료로 제출할 수 있다.
이에 따라 유럽, 미국은 계산독성학과 관련해 국가 차원에서 프로젝트를 진행하거나 관련기업들이 연구회를 구성함으로써 성과를 창출하고 있다.
그러나 일본은 전문적인 연구자가 적어 학회에서도 발표의 장이 한정되고 있다.
이에 따라 CBI학회는 계산독성학연구회를 개설하고 2014년 10월 말 킥오프미팅(Kick-off Meeting)을 개최한 후 정식 활동을 시작했다.
컴퓨터로 변이원성 불순물 평가
계산독성학은 ICH의 M7이 진행됨에 따라 관심이 높아지고 있다.
ICH는 2010년 10월 유전독성 불순물에 관한 M7 가이드라인을 승인하고 2012년 11월 Step2 문서를 완성한데 이어 2013년 11월 Public Comment Hearing을 실시한 후 2014년 6월 Step4 가이드라인(안)을 발표했다.
내용이 확정됨에 따라 Step5 시행만 남아있는 상태이다.
M7 가이드라인은 원료약품 및 제제에 낮은 비율로 존재하는 DNA 반응성(변이원성) 불순물의 평가와 관리에 대해 추천 순서 등을 정리한 것으로, M3 <의약품 임상시험 및 제조·판매 승인신청을 위한 비임상 안전성 시험 실시에 대한 안내>를 보완하고 컴퓨터를 이용한 독성평가법을 명기하고 있어 주목된다.
유전독성 불순물의 안전성은 Class1부터 Class5까지 총 5단계로 평가된다.
Class는 유전독성 데이터베이스 및 문헌검색을 이용해 기존 정보를 조사한 후 변이원성이 확실히 확인되는 Class1(기존 발암물질)과 Class2(기존 변이원), 확실한 비변이원성 물질인 Class5로 분류된다.
이에 따라 독성예측 소프트웨어는 SA(Structural Alert)를 가지는 Class3, Class4를 대상으로 이용되며, 지식베이스와 통계베이스 QSAR 소프트웨어를 통해 음성으로 판정되면 Class5로 취급한다.
지식베이스와 통계베이스 소프트웨어가 각기 다른 결과를 도출하면 다시 전문가 리뷰를 실시해야 하며 예측결과를 뒷받침할 수 있는 정보가 요구될 가능성도 있다.
또 사용하는 소프트웨어는 경제협력개발기구(OECD)의 비준원칙을 따라야 하는 것으로 나타나고 있다.
화학물질은 여러 독성 가운데 발암성에 대한 관심이 가장 높은 가운데 M7은 암을 유발하는 변이원성이 문제시 돼 주목받고 있다.
변이원성은 에임스검사(Ames Test)를 통해 측정하며 쥐티푸스균을 이용해 복귀돌연변이를 검출한다.
같은 유전독성 물질이라도 에임스검사에서 음성으로 판정되는 물질은 역치 메커니즘을 가지고 있어 일반적인 농도로는 발암 리스크가 없지만 낮은 비율로 DNA에 직접 손상을 입히는 물질은 암을 유발할 가능성이 높아 독성으로 판정된다.
그러나 의약품에 포함된 불순물 변이원성을 대상으로 하고 있어 극히 소량인 불순물을 단리·정제해 안전성 시험을 실시하기 어려울 때가 많은 것으로 파악되고 있다.
또 사람을 대상으로 실시하는 임상시험 단계에서 리스크가 있는 불순물을 복용하게 할 수 없기 때문에 인실리코를 통한 예측에 적합한 테마로 M7에 포함되고 있다.

통계베이스 소프트웨어 경쟁 치열
M7 가이드라인은 특정 소프트웨어를 지정하지 않고 있어 이용조건을 충족시키면 모두 사용할 수 있으나 적어도 지식베이스와 통계베이스 소프트웨어는 필수적인 것으로 나타나고 있다.
일본은 인실리코 독성예측 분야를 리드하고 있는 미국 식품의약국(FDA)으로부터 데이터를 제공받거나 공동개발한 소프트웨어를 사용하고 있으며 기본적인 기능은 동일한 것으로 파악되고 있다.
해외 제약 메이저는 여러 소프트웨어를 용도에 따라 구분해 사용하고 있는 것으로 알려졌으나 일본 제약기업은 지식베이스 1개, 통계베이스 1개로 소프트웨어를 최소화하고 있다.
이에 따라 통계 베이스 소프트웨어 시장 경쟁이 치열해질 것으로 예상되고 있다.
영국 Lhasa의 Sarah Nexus는 M7에 대응해 개발된 신제품으로 지식 베이스인 Derek Nexus와 공통 플랫폼으로 이용할 수 있는 이점이 있다.
Lhasa는 독성 데이터 베이스인 Vitic Nexus도 제공하고 있어 M7에 의거한 안전성 평가 작업을 종합적으로 지원할 수 있는 강점이 있다.
Readscope의 Model Applier는 5-6년간의 채용실적을 보유하고 있으며 소프트웨어로서 조작성이 뛰어나고 예측 감도가 높아 호평을 얻고 있다.
시험데이터를 포함한 참고자료가 많아 예측근거로 보다 상세한 데이터를 제공할 수 있는 강점이 있다.
Prous Institute의 SYMMETRY는 배경이 되는 데이터세트(Data Set)가 풍부한 것으로 알려졌다.
Prous Institute는 학술출판사가 모체로 50년 이상 수천만건에 달하는 화합물 정보를 수집함에 따라 세계적인 학술문헌을 총망라하고 있어 예측 베이스 데이터의 출처가 명확하며 자체 실험실에서 독자적으로도 데이터를 수집하고 있다.
MultiCASE의 CASE Ultra는 급성독성, 유전독성, 암원성, 간독성, 신독성, 신경독성, 최기형성을 포함한 150종류 이상의 예측모델을 제공한다.
2014년 봄에는 M7에 대응하기 위해 기능을 강화하고 데이터세트를 추가해 판정할 수 있는 화합물의 종류가 늘어난 것으로 알려졌다.
유일한 일본산 소프트웨어인 Fujitsu Kyushu Systems의 ADMEWORKS는 예측을 위한 데이터세트로 미국 보건복지성의 NTP(국가독성프로그램) 데이터만 채용하고 있으며 예측결과 신뢰성 정보로 화합물 공간도, 트레이닝 화합물의 유사화합물 검색, 트레이닝 화합물의 기술어값 범위 내 검색 등 다양한 기능을 제공한다.
모델에 포함되지 않은 기존화학물질을 이용해 예측성 외부 검증도 실시하고 있다.
이밖에도 CCS제품 가운데 M7 대응제품은 아니나 화학물질의 독성·위험성을 예측하는 QSAR 소프트웨어가 매우 많은 것으로 파악되고 있으며, 인실리코에 따른 평가법은 M7이 아니더라도 앞으로 점차 확산될 것이 확실시되고 있다.
일본, 2014년 392억엔으로 지속성장 …
CCS는 화학물질의 연구개발을 지원하는 시스템으로 생명과학(Life Science), 재료과학(Material Science) 분야에서 기술 발전을 뒷받침하고 있다.
마이크로(Micro)/메소(Meso)/매크로(Macro) 스케일의 모델링 및 시뮬레이션 시스템, 물질의 구조 및 특성에 관한 데이터베이스를 기반으로 하는 정보과학(Informatics) 시스템 뿐만 아니라 여러 어플리케이션을 연계 작동시키는 플랫폼 기술 등 다양한 솔루션 및 서비스를 제공하고 있다.
일본은 경기침체, 대지진 등의 영향에서 서서히 벗어남과 동시에 연구개발 투자를 확대하고 있어 CCS 시장이 꾸준히 성장하고 있다.
ICT(정보통신기술)는 현재 가장 중요한 사회기반으로 제조기업의 모든 활동에 필수적인 요소로 자리 잡고 있다. 마찬가지로 연구개발에서도 CCS가 기반기술로 자리매김하기 시작했다.
일본은 주로 연구영역에서 이용하는 각종 솔루션을 개발·제공하는 공급자의 매출액을 기준으로 한 CCS 시장규모가 2014년 약 392억엔으로 전년대비 5.6% 성장한 것으로 추정되고 있다.
2014년에는 ELN(Electronic Laboratory Notebook)이 주목받았다.
Riken 등 연구부정 의혹이 발생한 영향으로 실험노트의 존재가 일반인에게까지 알려짐에 따라 의혹을 잠재우기 위한 해결책으로 ELN이 부상하고 있다.
다만, 사건 직후에는 문의가 쇄도했으나 결과적으로 수요가 크게 늘어나지는 않은 것으로 나타나고 있다.
기존 ELN은 오버스펙이거나 가격이 매우 높은 수준이기 때문이다.
실험노트는 원래 미국 제약 메이저의 지적재산 보호에 대한 니즈에 부응하기 위해 발달한 것으로, 특허와 관련된 소송에 대응해야 하기 때문에 기술내용 및 방법에 엄격한 룰이 있다.
최근에는 전자화된 ELN이 등장함에 따라 연구를 효율화하는 툴 역할이 강조되고 있으나 시스템 제작자로서도 당국의 각종 규제에 대응할 수 있어 선호되고 있다.
하지만, 제약기업을 제외한 수요처가 사용하기에는 오버스펙이자 고가로 평가되고 있다.
다만, 연구부정 사건을 통해 제약기업을 제외하고도 ELN에 대한 니즈가 있다는 것이 파악되고 있다.
아울러 제약기업용 ELN도 신규 화합물을 생성하는 화학합성 뿐만 아니라 생물, 제제, 품질관리 등 다양한 부분으로 활용범위를 넓힘으로써 시장개척 가능성이 높은 것으로 나타나고 있다.
빅데이터 활용분야 주목
ELN 시장은 제2단계에 들어설 가능성이 제기되고 있다.
제1단계는 개척자인 소수의 공급자가 제약기업의 화학합성 부문을 공략해 수요를 이끌었으며, 제2단계는 제약 연구의 다른 부문 전개 및 비제약 부문 도입을 시도하는 것으로 공급자가 점차 증가하고 있다.
특히, 간편하고 저렴한 클라우드 베이스 ELN이 주목받고 있다.
실험과정을 기록하는 노트로서 자유도가 높아 다양한 업종에서 활용할 수 있으며 클라우드 서비스이기 때문에 바로 사용을 개시할 수 있고 투입비용도 적절한 장점이 있다.
일정기간만 사용할 수 있어 프로젝트 단위로 공동연구를 위해 활용하는 사례도 나타나고 있다.
재료과학 영역도 안정세를 나타내고 있다.
일본 재료과학 시장은 리먼 브라더스 사태 이후 일시적으로 축소됐으나 최근에는 자동차소재, 전자소재 관련 연구가 증가하면서 투자가 회복되고 있다.
재료과학은 독립된 원자나 분자를 아무리 계산해도 대규모 집합체인 <재료>의 특성을 예측·해석할 수 없기 때문에 계산모델 자체를 대규모화·복잡화해야 하나 컴퓨터 처리속도의 한계가 큰 장벽으로 자리 잡고 있다.
그러나 슈퍼컴퓨터 등 고속계산 환경이 민간에게 개방됨으로써 니즈가 점차 높아지고 있다.
컴퓨터화학(계산화학)은 일부에서 고도의 계산이 이루어지고 있는 반면 초심자도 많은 것으로 나타나고 있다.
지금까지 연구에 시뮬레이션을 도입하지 않았던 분야에서도 컴퓨터화학에 대한 관심이 높아지고 있기 때문으로, 최근에는 신규 수요자를 확보하기 위해 초심자용 강습회를 개최하는 사례가 증가하고 있으며 계산을 위탁하는 서비스나 컨설팅을 제공하는 비즈니스도 호조를 보이고 있다.
재료설계용 CCS는 수요자의 기대도가 높아지고 있는 가운데 계산의 유효성을 명확히 선보일 것이 요구되고 있다.
재료개발 분야는 컴퓨터화학 뿐만 아니라 빅데이터 해석공법을 활용한 재료정보과학이 주목받고 있다.
재료정보과학은 2011년 버락 오바마 미국 대통령의 선도로 시작한 「Material Genome Initiative」에서 발단한 것으로, 일본은 2015년 7월 물질·재료연구기구(NIMS)가 프로젝트를 개시했다.
자연과학 연구 방법론은 실험, 이론에 이어 계산이 추가되고 있다.
재료과학은 대상물질의 조합이 방대하고 개별 조직의 사소한 변화가 재료 전체의 특성을 크게 변화시킬 가능성이 있어 연구현장에서는 아직 경험적인 접근이 주류를 이루고 있다.
재료 설계는 물성과 특성 예측이 가장 중요하지만 현재의 기술수준으로는 실험·이론·계산의 과학적 공법이 모두 충분한 유효성을 발휘할 수 없는 것으로 나타나고 있다.
재료정보과학은 빅데이터를 이용한 데이터 구동형 접근을 통해 <예측>에 근접하려는 것이 기본적 자세로, 특히 딥러닝(Deep Learning) 등 새로운 인공지능(AI) 기술에 관심이 모아지고 있다.
딥러닝은 1980년대 후반 폭발적 붐을 일으킨 뉴럴 네트워크(Neural Network)의 연장선에 있는 기술로, 당시에는 산업 응용이 본격화되지 않았으나 최근 초대규모 병렬 다중처리가 가능해짐에 따라 자동차 무인운전 등 큰 성과를 내고 있으며 수십년 후에는 인간을 뛰어넘는 지성이 탄생할 가능성도 제기되고 있다.
AI 기술 및 재료정보과학은 실제 재료개발 현장에서 무엇을 초래할지 아직 의문시되고 있어 긍정파와 회의파로 의견이 엇갈리고 있다.
그러나 실험·이론·계산 모두 재료정보과학에 활용할 수 있는 빅데이터를 창출하기 때문에 4개의 과학을 융합함으로써 대폭발을 일으킬 가능성이 충분한 것으로 평가되고 있다.
특히, 실험과 계산은 점차 대량신속처리화되고 있어 출력되는 데이터양이 방대하며 재료과학용 CCS의 활용영역도 점차 확대될 것으로 예상되고 있다.