서울성모병원 유전진단검사센터 김용구∙김명신 교수팀, 차세대염기서열분석법 기반 유전자 발현량 활용 급성백혈병 진단 AI모델 개발
가톨릭대학교 서울성모병원 유전진단검사센터 김용구∙김명신 교수(진단검사의학과, 공동 교신저자), 인천성모병원 진단검사의학과 이재웅 교수(제1저자) 연구팀은 차세대염기서열분석법(NGS) 기반 RNA시퀀싱으로 분석한 급성백혈병의 전사체(transcriptome, 유전체에서 전사(생산)되는 RNA 총체) 데이터의 유전자 발현량을 활용해 급성백혈병 3가지를 감별 진단하는 알고리즘을 인공지능(AI) 기계학습(머신러닝)을 이용해 개발했다.
연구팀은 서울성모병원에서 3가지 급성백혈병(림프모구백혈병(ALL), 급성골수백혈병(AML), 혼합표현형급성백혈병(MPAL))으로 진단받은 환자들의 RNA시퀀싱 분석 전사체 데이터를 이용해 염색체 이상, 유전자 돌연변이, 유전자 발현을 분석한 결과, 기존에 골수세포 특수 염색, 유세포분석, 실시간유전자증폭검사(Real-time PCR), 염기서열분석을 포함한 다양한 검사를 통해 얻을 수 있었던 융합유전자, 면역표현형 정보, 유전자 변이를 한 번에 통합적으로 분석할 수 있었고 기존에 보고되지 않은 새로운 융합유전자도 발견했다고 밝혔다.
연구팀은 유전자 발현량 결과를 활용해 3가지 급성백혈병을 진단하는 점수체계 모델과 인공지능을 이용한 머신러닝 모델 등 두 가지 감별진단 시스템을 개발했다. 연구 검체당 2만여 개의 유전자 발현 데이터가 이용되었으며, 인공지능 기계학습은 유전자 발현 데이터 중 특징 데이터를 추출하고, 특징 데이터를 통해 수학적인 모델을 구축하는 방식으로 진행되었다. 수학적 모델은 학습에 사용되는 데이터들을 통해 모델의 세부 파라미터 값들을 최적화 해나가는 방식으로 진행되었다. 그 결과, 학습된 인공지능모델에 새로운 급성백혈병 데이터를 제공했을 때 인공지능모델이 자동으로 적절한 진단명으로 분류하게 된다. 인공지능모델은 서울성모병원과 델바인 인공지능연구소 조성민 박사가 공동 개발했다.
검증은 공공데이터베이스(국제암유전체컨소시엄(ICGC), 미국국립생물정보센터(NCBI)) 427개 데이터를 이용해 평가한 결과, 림프모구백혈병(ALL), 급성골수백혈병(AML), 혼합표현형급성백혈병(MPAL)을 감별 진단하는 정확도가 점수체계 모델은 97.2% 머신러닝 모델은 99.1%로 나타났다.
유전진단검사센터장 김명신 교수는 “급성백혈병의 진단 및 치료에 유전 진단 검사의 요구도가 급격히 증가하고 있다”며, “다양한 검사 결과를 토대로 질환의 예후와 표적치료제 적용 여부를 결정짓게 되는데, 이번 연구를 통해 여러 검사를 RNA시퀀싱 하나로 단순화할 수 있는 가능성을 확인했다는데 의의가 있다”고 말했다.
김용구 교수는 “특히 이번 연구에서 인공지능을 이용한 머신러닝 모델을 개발해 표현형이 모호하고 분류가 까다로운 급성백혈병도 정확히 진단하고 치료 방향을 설정하는데 도움이 될 것으로 기대된다”고 강조했다.
이번 연구 결과는 ‘Frontiers in Oncology(IF 6.244)’에 최근 게재되었으며, 식품의약품안전처 연구개발사업, 한국연구재단 바이오∙의료기술개발사업 지원으로 진행되었다.
김지예 기자
press@healthinnews.co.kr