전문의도 구분하기 어려운 고해상도·고품질 무릎 관절염 X-ray 이미지 생성 … 의료 인공지능 연구의 걸림돌이었던 데이터 불균형과 프라이버시 문제 해결 기대

실제무릎이미지와알고리즘모델을통해생성된이미지
실제무릎이미지와알고리즘모델을통해생성된이미지
최근 전문가도 구분할 수 없을 정도의 무릎 관절염 합성 X-ray 데이터가 개발됐다. 가상의 고품질 X-ray 데이터는 그동안 의료 인공지능 연구의 걸림돌이었던 데이터의 불균형과 프라이버시 문제를 해결할 수 있을 것으로 기대된다.

서울대병원 정형외과 노두현 교수팀(최병선 전임의, 인공지능 연구소 안건 학생)은 인공지능인 생성적 적대 신경망을 이용해 전문의도 구분하기 어려운 고해상도·고품질 무릎 관절염 X-ray 이미지를 생성하는 모델을 개발했다고 31일 밝혔다.

(왼쪽부터)서울대병원정형외과노두현교수,최병선전임의,서울의대인공지능연구소안건학생
(왼쪽부터)서울대병원정형외과노두현교수,최병선전임의,서울의대인공지능연구소안건학생
생성적 적대 신경망(Generative Adversarial Network, GAN)은 대표적인 합성 데이터 기술로 사람의 눈에 매우 사실적이고 현실적인 이미지를 생성한다. GAN은 가짜 데이터를 생성하는 생성기(Generator)와 진짜와 가짜를 구분하는 판별기(discriminator)가 경쟁적으로 학습해 진짜 데이터에 가까운 가짜 데이터를 생성한다. 이 기술을 의료 데이터에 적용하면 민감정보를 포함한 실제 의료데이터를 대체해 개인 정보 문제에 대한 대안을 제시할 수 있다.

생성적적대신경망
생성적적대신경망
연구팀은 서울대병원에 내원한 환자 10,000명의 무릎 X-ray 이미지를 정제 및 분석했고 생성적 적대 신경망(GAN)을 개발했다. 그 후 생성된 이미지의 신뢰도 수치를 평가했다. 이번 연구에서는 신뢰할 수 있는 데이터를 만들기 위해 최소 2,000장 이상의 영상이 필요함을 확인했다. 생성된 이미지는 컴퓨터 알고리즘으로도 원본과 구분이 힘들었다.

이후 정형외과 전문의 2명, 컴퓨터 비전 전문가 2명, 영상의학과 전문의 1명 등 다양한 전문가들이 생성된 이미지의 품질을 분석했다.

우선 이미지의 성능을 검증하기 위해 진짜 이미지와 생성된 이미지를 구별하는 튜링테스트(Turing test)를 진행했다. 각각 50개의 실제 및 생성된 이미지가 혼합된 100개의 이미지를 분류하는 테스트에서 전문가 5명의 분류 정확도는 34%, 44%, 46%, 57%, 50%로 나왔다. 테스트 결과는 전문의도 실제와 생성물을 확실하게 구별하기 힘들다는 것을 보여준다.

또한 연구팀은 생성된 이미지의 질적 분석도 실시했다. 질병 고유의 해부학적 특성이나 윤곽선, 뼈 테두리, 관절 등의 이미지 품질을 분석한 결과, 생성된 이미지는 실제 이미지와 비교해도 매우 사실적으로 보였다.

연구 결과는 심층학습(Deep Learning) 중 생성적 적대 신경망을 이용해 전문가도 구분하기 힘든 합성 익명 데이터를 만들었다는 점에서 의의가 있다. 이번 연구는 수만 개의 이미지 데이터를 빠르게 생성해 데이터 불균형을 해소하고, 가짜 의료데이터를 활용함으로써 프라이버시 문제를 해결할 수 있는 가능성을 보여준다. 이는 향후 미래 의료 인공지능 연구의 초석이 될 것으로 기대된다.

노두현 교수는 “본 기술을 활용해 향후 인공지능 기반 관절염 판독뿐만 아니라 디지털 트윈과 같은 다양한 인공지능 모델을 개발할 수 있을 것”이라고 강조했다.

해당 연구 공동 1저자로 참여한 최병선·안건 연구원은 “이 모델을 기반으로 의료기관에서 무릎 관절염의 악화를 시뮬레이션 할 수 있는 플랫폼을 사용하게 되면 환자 및 의료진에게 큰 도움이 될 것이다”라고 말했다.

이번 연구는 미국 정형외과 연구 학회의 공식 저널인 ‘정형외과학회지(Journal of Orthopaedic Research)’ 최근호에 게재됐다.

저작권자 © 헬스인뉴스 무단전재 및 재배포 금지