바이오산업동향

항암제 치료효과 예측하는 머신러닝 기술 개발

등록일: 2020-11-03
작성자: 의생명공학과
조회수: 226

약물유전체학의 등장으로 기존에 축적된 다양한 약물반응데이터를 토대로 자체적인 알고리즘을 도출, 사람마다 다른 약물 반응성을 예측하는 머신러닝 연구가 활발하다.

사람의 생체반응을 최대한 반영할 수 있는 양질의 학습데이터를 입력하는 것이 예측의 정확도를 높이는 출발점이 되는데, 기존에는 사람의 임상데이터에 비해 상대적으로 확보가 용이한 동물모델 대상의 전임상데이터가 주로 이용되었다.
   * 약물유전체학 : 개인의 유전자 차이를 기반으로 약물에 대한 반응성을 예측하는 학문

이 가운데 국내 연구진이 동물모델 대신 환자 유래 인공 미니 장기에서 얻은 데이터를 학습하는 알고리즘을 통해 항암제 반응성 예측의 정확성을 높여 주목받고 있다. 실제 사람에서의 반응에 보다 더 근접한 데이터를 학습시키겠다는 것이다.

한국연구재단은 김상욱 교수(포항공과대학교) 연구팀이 암환자 유래 인공 미니장기의 전사체 정보를 토대로 환자의 항암제 반응성을 예측하는 인공지능 기술을 개발했다고 밝혔다.
   * 전사체(transcriptome) : 사람마다 유전정보를 토대로 만들어지는 단백질의 종류는 물론 만들어지는 시기나 양도 다르며 만들어진 단백질의 활성도 다르다. 유전적 특성과 암세포의 전사체 정보를 분석하여 항암제의 치료효과를 예측하려는 것도 이 때문이다.

같은 암을 앓는 환자라도 항암제에 대한 반응이 다르기에 효과를 볼 수 있는 환자를 선별하는 맞춤형 치료가 중요하다. 하지만 기존 머신러닝 예측기법은 암세포의 유전체 정보를 토대로 하고 있어 정확도를 높이는 데 한계가 있었다. 불필요한 바이오마커 정보로 인해 머신러닝이 거짓 신호를 바탕으로 학습하는 문제가 있었다.

이에 연구팀은 약물의 직접적 표적이 되는 개별 단백질에 대한 전사체 정보뿐 아니라, 표적 단백질과 상호작용할 수 있는 생체 단백질 상호작용 네트워크 데이터를 이용, 예측 정확도를 높인 머신러닝 알고리즘을 소개했다.

표적 단백질로부터 기능적으로 가까운 단백질의 전사체 생성량에 대해 우선 학습하도록 한 것이다. 이를 통해 기존 머신러닝이 학습해야 했던 방대한 바이오마커 대신 선별된 바이오마커만 학습할 수 있도록 하여 정확도를 높였다.

또한 동물모델이 아닌 환자 유래 미니장기의 데이터를 이용해 실제 환자에서 반응과의 차이를 좁혔다.  실제 이 방법으로 대장암에 쓰이는 5-플루오로 우라실과 방광암에 사용되는 시스플라틴 등에 대한 환자의 약물반응을 실제 임상결과와 비슷한 수준으로 예측해냈다.

항암제에 반응할 환자를 선별하는 개인 맞춤형 정밀의료 실현은 물론 새로운 항암제의 기전 규명에도 도움이 될 것으로 기대된다.

과학기술정보통신부와 한국연구재단이 추진하는 중견연구사업, 중점 연구소사업 및 포스텍 인공지능대학원 지원으로 수행된 이번 연구의 성과는 국제학술지‘네이처 커뮤니케이션스(Nature Communications)’에 10월 30일 게재되었다.

주요내용 설명

<작성 : 포항공과대학교 생명과학과 김상욱 교수>

논문명
Network-based machine learning in colorectal and bladder cancer organoid models predicts anti-cancer drug efficacy in patients
저널명
Nature Communications
키워드
Cancer precision medicine (암 맞춤형 의료), Network biology (생체 네트워크), Patient-derived organoid (환자 유래 미니장기)
저 자
김상욱 교수(교신저자/포항공과대학교), 공정호 박사과정(제1저자/포항공과대학교)

1. 연구의 필요성
○ 같은 종류의 암이라도 항암제에 대한 치료효과는 사람마다 다르게 나타나는 것이 현재 항암제 치료의 가장 큰 문제 중 하나이다. 따라서, 약물에 반응할 수 있는 환자를 치료 전에 구분해서 환자 맞춤형 치료를 진행하는 것이 효과적이다.
○ 기계학습을 이용한 환자 맞춤형 항암제의 치료 효과를 예측하는 기존 모델들의 경우 필요 이상으로 많은 바이오마커를 이용하여 예측의 낮은 정확도로 인해 많은 암종에서 실패하였다.

2. 연구내용
○ 본 연구팀은 생체 네트워크 및 환자 유래 인공 미니장기의 전사체를 이용하여 항암제의 약물 반응을 예측 가능한 기계학습 모델을 개발 했다. 이를 통해 암환자의 약물반응과 관련이 있는 바이오마커를 발굴하고, 암환자의 항암제 치료 혜택을 높일 수 있는 의료 인공지능 기술을 개발했다.
○ 방광암과 대장암 환자들을 대상으로 연구팀은 생체 네트워크에서 약물의 작용점의 거리를 이용하고, 환자 유래 인공 미니장기의 전사체와 약물반응을 기계학습 하였다. 이를 통해 암환자의 약물 반응을 예측할 수 있는 새로운 바이오마커를 발굴해 냈다.
○ 대장암 치료에 사용되는 5-플루오로 우라실(5-Fluorouracil) 항암제에 대해서는 BH3 단백질이, 그리고 방광암 치료에 사용되는 시스플라틴 (cisplatin) 항암제에 대해 아미노산 합성 단백질들이 새로운 바이오마커로 발굴되었다. 이들 바이오마커는 생체 네트워크에서 약물의 작용점에 가까이 위치하고 있으며, 항암제의 약물 반응성 예측에 효과적임을 확인하였다.
○ 암환자의 예후와 전사체 데이터, 그리고 항암제 치료 이력 등의 데이터베이스를 사용하여, 연구팀은 새롭게 발견한 바이오마커의 효과를 성공적으로 검증하였다. 개발된 의료인공지능은 항암제 치료 혜택을 받을 수 있는 환자를 구분하는데 사용 가능하다.
○ 기존 환자 맞춤형 기계학습 모델에서 사용하지 않았던 생체 네트 워크와 인공 미니장기 전사체 데이터를 활용하여 항암제의 효과를 성공적으로 검증 가능했다. 개발된 방법은 기존에 사용하던 환자 전사체 기반 기계 학습 모델과 딥러닝 기반 인공지능 모델과 비교 하여 환자의 약물 반응을 보다 정확하게 예측 가능하다.

3. 연구성과/기대효과
○ 항암제의 치료효과를 미리 아는 것은 환자의 항암제에 대한 부작용을 낮출 뿐만 아니라, 암환자의 치료시기를 확보하여 생존율을 높일 수 있을 것으로 기대된다.
○ 환자 유래 인공 미니장기와 기계학습의 접목을 처음 보여준 사례로, 앞으로 환자 맞춤형 의료기술 개발 연구에 적용되어 더 많은 암환자의 치료 약물 선택에 응용될 수 있기를 기대하고 있다.
○ 한편 생체 네트워크의 약물 작용점과 약물 반응 바이오마커를 응용한 기술은 또 다른 항암제 개발과 새로운 질병의 약물 작용 메커니즘 규명에 응용될 수 있다.

(그림1) 개발된 환자 맞춤형 약물 반응성 예측 기술의 도식
환자 맞춤형 항암제 효과를 예측하기 위한 기계 학습 모델. 항암제의 반응성과 연관이 있는 단백질을 생체 네트워크에서 약물 작용점에서 거리를 통해 탐색. 환자 유래 인공 미니장기의 전사체와 항암제에 대한 반응을 기계 학습. 환자의 항암제 효과를 예측.
그림제공 : POSTECH 생명과학과 생물정보학 연구팀

(그림2) POSTECH 연구팀 사진, 공정호 연구원 (좌) 김상욱 교수 (우)
사진제공 : POSTECH 생명과학과 생물정보학 연구팀

연구 이야기

<작성자 : 포항공과대학교 공정호 대학원생>

□ 연구를 시작한 계기나 배경은?

우리 연구실은 생체 네트워크를 이용하여 분자적 특징과 표현형의 상관관계에 대해 오랫동안 연구를 진행하였습니다. 암환자에게 항암제에 대한 반응성이라는 표현형을 맞출 수 있는 전사체의 특징은 무엇이 있을까라는 질문을 배경으로 연구가 시작되었습니다.

□ 연구 전개 과정에 대한 소개

방광암에서 가장 많이 사용되는 시스플라틴 이라는 항암제가 방광암 환자들에게 약 30% 밖에 효과가 없음을 알게 된 후, 시스플라틴의 방광암 환자별 효과 예측 모델을 개발에 노력하였습니다. 이후, 개발된 모델을 대장암 환자들에 대한 5-플르오르 우라실 항암제의 효과 예측에 접목하여 모델의 다른 암과 다른 항암제에 대한 적용 가능성을 확인하는 방향으로 진행하였습니다.

□ 연구하면서 어려웠던 점이나 장애요소는 무엇인지? 어떻게 극복(해결)하였는지?

연구의 흐름에 맞는 적절한 데이터를 구하는 것이 어려웠습니다. 다행히도, 최근 많은 유전체 데이터가 온라인 상 공개적으로 사용 가능하여 생물정보학적 분석이 가능해졌습니다. 또한, 필요한 데이터가 공용 데이터베이스에 없을 경우에는 따로 관련 연구자분들게 연락을 드렸었는데, 관련 연구자 분들께서 친절히 공유해 주셨던 것 덕분에 추가적인 연구를 진행할 수 있었습니다.

□ 이번 성과, 무엇이 다른가?

이 연구는 기존 연구 대비 방광암과 대장암에서의 항암제에 대한 효과를 정확하게 예측할 수 있는 생물정보학 기술을 개발하였다는 것입니다. 추가적으로, 항암제의 작용과 연관이 있는 바이오마커를 제공하여, 향후 항암제의 기작을 이해하는데 이용될 수 있습니다.

□ 실용화된다면 어떻게 활용될 수 있나? 실용화를 위한 과제는?

이 연구는 항암제의 효과를 치료 전 예측하여, 항암제의 부작용을 낮추거나 암환자의 치료 시기를 확보하여 생존율을 높일 수 있을 것으로 기대됩니다. 앞으로 한국인을 위한 실용화를 위해선 한국인 암 환자분들의 데이터에서 항암제에 대한 반응성 분석이 필요합니다.

□ 꼭 이루고 싶은 목표나 후속 연구계획은?

이번 연구에서는 두 가지의 암 종에 대해 연구를 진행하였다면, 후속 연구에서는 더 많은 암 종에 대해 환자 맞춤형 의료가 가능한 기계 학습 모델을 개발하고 싶습니다. 또한, 많은 연구가 진행되어 있지 않은 희귀성 질환에 대해서도 맞춤형 의료를 실현시키고 싶습니다.

□ 기타 특별한 에피소드가 있었다면?

환자 유래 인공 미니장기 데이터를 이용하여 암환자의 약물 반응성 예측을 하기 위해 처음에는 기존의 기계 학습 모델들을 이용하는 방향으로 연구를 시작하였습니다. 하지만 기존 기계 학습 모델들이 정확한 예측을 해내지 못하여 그 당시에는 당황스럽고 고민을 많이 했던 기억이 납니다. 이를 해결하기 위해 다양한 기계 학습 알고리즘을 시도하였고, 연구실에서 많이 이용하였던 생체 네트워크 분석을 기계 학습 모델이 접목시키는 아이디어를 떠올릴 수 있었습니다. 돌이켜 생각해보면, 다양한 기계 학습 알고리즘들에 대한 이해도를 높일 수 있었던 좋은 경험인 것 같습니다.

프린트