LG AI연구원, AWS 기반 암 진단 AI 모델 개발
아마존웹서비스(AWS)는 2일 개최한 ‘AWS 리인벤트’에서 LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원의 암 진단과 치료를 위한 병리학 기반모델(FM) 개발사례를 발표했다.
병리학 기반 모델인 엑사원패스(EXAONEPath)는 암 환자의 조직병리 이미지를 안전하게 분석해 유전자 검사 시간을 기존 2주에서 1분 미만으로 단축함으로써 의료진의 치료 속도와 효과를 개선할 수 있도록 돕는다.
엑사원패스는 이미지 패치를 정확하게 분류하는 데 있어 여섯 가지 벤치마크에서 평균 86.1%의 정확도를 달성했으며, 이는 훨씬 더 큰 데이터셋으로 학습된 다른 주요 병리 기반 모델들과 견줄 만한 수준이다. AWS를 통해 LG AI연구원은 테라바이트 단위의 데이터를 1시간 이내로 클라우드에 전송해 모델 학습 시간을 60일에서 1주일로 단축시켰으며, 이를 통해 엑사원패스의 암 진단 및 검출 성능을 향상시켰다. LG AI연구원은 AWS를 활용해 데이터 관리 및 인프라 비용을 약 35% 절감하고, 데이터 준비 시간을 95% 단축했다.
LG AI연구원은 아마존 세이지메이커로 2억8천500만 개의 데이터 포인트와 3만5000개 이상의 고해상도 조직 샘플 이미지를 사용해 8개월 만에 대규모 엑사원패스 모델을 학습하고 배포했다. AWS와 엔비디아 GPU를 활용한 LG AI연구원은 딥 러닝 워크로드의 학습과 추론 속도를 높이고 있다.
LG AI연구원은 연구에 핵심적인 대용량 데이터를 저장하고 검색하는 데 아마존 S3에 연구용 대용량 데이터를 저장하고, 러스트용 아마존 FSx로 밀리초 미만의 지연시간과 초당 수백기가바이트의 처리량으로 대용량 데이터세트에 접근한다.
엑사원패스는 아마존 세이지메이커와 러스트용 아마존 FSx를 기반으로 구축된 LG A연구원의 3000억 개의 파라미터를 보유한 멀티모달 기반 모델 엑사원 중 일부다. LG AI연구원은 추가 병리 이미지를 활용해 더 많은 유형의 암을 진단할 수 있도록 학습시켜 엑사원패스를 지속적으로 업데이트하고 개선해 나갈 예정이다.
LG AI연구원 이화영 상무는 “AWS를 통해 AI 연구를 가속화하여 접근이 용이하고 신속한 암 검진을 현실화가 가능할 것”이라며 “AWS를 활용해 방대한 데이터셋에서 병리학 모델을 더 빠르고 안전하고, 비용 효율적으로 학습시킬 수 있었다”고 밝혔다.
그는 “엑사원패스의 향상된 데이터 처리 기능은 더 개인화되고 효율적인 암 치료를 제공하여 환자의 건강을 개선할 수 있도록 도와줄 것”이라며 “엑사원패스는 전 세계적으로 암 진단 및 치료 방식을 혁신할 수 있는 잠재력을 가지고 있다”고 강조했다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network