
후지츠연구소, MI에 응용해 소재 설계 지원 … 특허 독해부터 착수
후지츠연구소(Fujitsu Laboratories)가 화학적 지식 그래프(Knowledge Graph)를 MI(Materials Informatics)에 응용해 소재 설계를 지원하고 있다.
지식 그래프는 화학 문헌에서 AI(인공지능)를 통해 자동으로 추출한 화학 정보를 지식화‧구조화한 것이며 후지츠연구소는 지식 그래프 상에서 검색하는 것만으로 신규 화합물이나 새로운 기능을 발견하는데 도움이 될 것으로 기대하고 있다.
기존의 정보 기술을 활용한 화학 문헌 조사는 독해한 지식을 얻기 위해 매우 높은 수준의 기술과 많은 시간이 필요하고 정확도가 떨어진다는 문제가 발견되고 있다.
후지츠연구소는 2010년부터 화학특허 문헌을 대상으로 화학정보 추출 연구를 시작했고 2018년부터는 자사의 자연언어 처리와 지식 구조화 기술을 활용한 화학 지식 그래프 연구에 착수했다.
지식 그래프는 노드와 노드 사이에 의미를 갖고 있는 데이터를 그래프로 구조화한 것으로, 게놈 변이 영역에서 활용이 시작됐고 관계성이나 유사성 특성을 축적해 쉽게 검색할 수 있도록 하고 있다.
화학 지식 그래프는 화합물, 물성, 용도, 프로세스, 계층구조 등의 관점에서 정보 사이에 의미와 관련성을 부여하고 있다.
에탄올(Ethanol)은 알코올(Alcohol) 등 상위 및 하위 개념에 맞추어 데이터를 구조화함으로써 직접 접속되지 않은 화학물질, 물성, 관계를 이해하는 것을 돕고 있다.
기존 자연언어 처리를 활용한 정보 추출은 물질의 이름이나 물성, 제조 프로세스 이름 등 표층적 지식 확보에 그쳤으나, 후지츠연구소의 화학 지식 그래프는 물성과 구조, 화학 현상 등 실제 사례와 논리식을 기반으로 형식화해 기본적인 물성 간 관계를 구축한 상태이며 정보 추출을 효율화하고 다양한 관계성을 자동으로 지식화해 지식을 확대할 수 있다.
지식 그래프 상에서 검색했을 때 숨겨져 있던 관계성을 발견하는데에도 기여하고 있다.
후지츠연구소는 지식 그래프 기술을 통해 2020년 5월 제69회 고분자학회 연차대회에서 화학 문헌에서 추출한 화학 정보의 지식화 타이틀로 공익부문상을 수상했다.
성과 보고에서는 절연물의 지식 그래프를 예시로 소개하면서 열에 따른 열화 반응 속도론에 주목하는 등 수명 예측에도 기여할 수 있다고 역설했다.
나아가 가속시험, 소재 평가, 최종제품 설계 등에도 활용할 수 있을 것으로 기대하고 있다.
우선, 화학특허 독해 및 해석 도구로 응용할 수 있도록 하고 후지츠(Fujitsu)를 통해 사업화하는 방안을 검토하고 있다.
특허 유사성과 동일성을 판정하는데 화학적 지식 그래프를 활용하고 기존에 키워드 수준이나 화합물 이름에서만 검색하는데 그쳤던 것에서 나아가 화학물질(구조) 제조방법, 물성, 기능 등 관계성에 기반을 둔 문헌 해석기술을 확립할 계획이다.
다음 단계로는 소재 설계를 지원할 수 있도록 발전시킬 방침이다.
MI 용도로 물성, 제조방법을 추출하는 기술을 확립하거나 과거 문헌 사례에서 다음 개발 후보를 유추하는 작업을 위한 지식 탐색 기술로 발전시키는 방안을 검토하고 있다.
화학적 지식 그래프는 일본 화학물질사전 등 화학물질 데이터베이스와 특허 공보, 공개돼 있는 화학제품 정보 간 관계성을 바탕으로 구축했다.
현재는 고분자를 중심으로 유기화합물이 주류를 이루고 있으며 앞으로 더욱 많은 정보를 반영해 화합물 종류를 늘려나갈 방침이다. (K)