25일 한국바이오협회 바이오경제연구센터는 이슈브리핑을 통해 이 같은 내용을 보고했다.
이에 따르면 엔비디아는 18일 자사가 개최하는 ‘GTC 컨퍼런스’에서 단백질 구조 및 분자도킹예측을 가속화 할 수 있는 확장형 AI 프로그램 ‘바이오네모(BioNeMo)’ 을 공개했다.
이 프로그램은 유전자 코드의 여러 영역의 기능과 돌연변이의 영향을 예측할 수 있도록 유전체 서열에 대한 학습 AI가 포함되어 있다.
엔비디아 측은 이를 통해 “DNA 서열을 분석하고, 약물 분자에 반응하여 단백질의 모양이 어떻게 변하는지 예측하고, RNA를 기반으로 세포의 기능을 결정할 수 있다”고 밝혔다.
엔비디아는 잠재적인 약물후보와 3차원 구조를 예측하는 DiffDock, 단일 아미노산 서열을 기반으로 단백질 구조를 예측할 수 있는 ESMFold 등 이미 20개 이상의 AI 모델을 보유하고 있다.
엔비디아가 발표한 ‘BioNeMo’에서 사용할 수 있는 모델은 3가지로, 다음과 같다.
△ DNABERT - 방대한 양의 DNA 서열 데이터에 대해 학습되었으며 게놈의 특정 영역의 기능을 예측하고 유전자 돌연변이 및 변이의 영향을 분석할 수 있다.
△ scBERT - 단일 세포 RNA서열분석 데이터에 대해 학습된 모델로 유전자 녹아웃(knockout)의 영향을 예측하고 신경, 혈액 세포 또는 근육 세포와 같은 특정 세포 유형을 식별 가능하다.
△ EquiDock - 단백질 상호 작용의 3D 구조를 예측해 가장 유망한 약물-단백질 조합을 식별하여 약물 발견 프로세스를 간소화할 수 있도록 지원한다.
엔비디아의 생성형 AI는 신약개발 가속화 시대를 열어주고, 디지털 수술, 디지털 생물학, 디지털헬스에 이르기까지 다양한 영역에서 획기적인 기능을 제공할 수 있을 것으로 기대된다.
이미 100개 이상의 바이오제약 및 AI 기반 신약개발 회사가 BioNeMo 플랫폼을 사용 중인 것으로 알려져 있으며, 암젠의 경우 항체에 대한 자체 보유 데이터를 사용해 BioNeMo의 ESM 모델을 사전에 학습시켜 물질 스크리닝 및 최적화를 5개 모델에 훈련시키는 시간을 3개월에서 몇 주로 단축햇다고 밝혔다.
김국주 기자
press@healthinnews.co.kr