[바스리] AI로 30억개 DNA 읽어내 희귀질환을 분석하는 곳
바이라인네트워크에서 스타트업을 리뷰합니다. 줄여서 ‘바스리’. 투자시장이 얼어붙어도 뛰어난 기술력과 반짝이는 아이디어, 새로운 비즈니스 모델을 가진 스타트업은 계속해 탄생하고 있습니다. 세상을 깜짝 놀라게 하겠다고 출사표를 던진 이들을 바이라인의 기자들이 만나봤습니다.
세계적으로 알려진 희귀질환은 현재 약 1만개 정도로, 이 중 80%는 유전 질병으로 선천적이다. 이런 희귀질환은 매년 꾸준히 더 발견되면서, 그 수가 계속해 늘어나고 있다. 희귀질환은 말 그대로 흔하지 않아서 병원에서 바로 진단을 받거나 치료를 하기가 어렵다. 심하게는 치료제가 없는 경우도, 병명을 알 수 없는 경우도 왕왕 있다.
희귀질환 진단을 위해서는 유전자를 읽고 해석해야 하는 별도의 분석 과정이 필요하다. 질병을 특정할 수 없어서 전체 유전자를 다 읽어야 한다. 이때 전문기관이 투입되어 유전자 분석을 통해 희귀질환을 판별한다. 다행인 것은 진단 환경이 과거보다 나아졌다는 점이다. 과거에는 진단 기간만 년 단위, 비용이 억 단위였다. 시간과 비용이 많이 들 수밖에 없는 이유는 인간의 DNA가 30억개로 이뤄져 있기 때문이다. 억소리 나는 DNA를 전체적으로 읽어내, 이 중에서 희귀질환 유전체가 없는지 분석해야 한다.
다행인 점은, 지금은 기술의 발전으로 시간과 비용이 줄었다. 특히 인공지능(AI) 기술의 발전은 의학에도 지대한 영향을 미쳤다. 쓰리빌리언은 직접 개발한 AI 모델을 활용해 환자의 DNA를 분석, 희귀질환을 밝혀낸다. AI의 성능이 발달할수록 정확도와 속도가 빨라지는데, 쓰리빌리언은 국제 AI 의학 대회에서 우승을 거머쥐며 기술력을 입증 받았다고 자부한다.
쓰리빌리언은 어떤 회사?
쓰리빌리언은 8000개의 희귀질환을 진단하는 서비스를 제공한다. 유전체 분석 기업인 마크로젠에서 스핀오프해 지난 2016년 10월 설립됐다. 누적 투자유치금액은 2022년 3월 프리 IPO 단계 기준 418억원 이상이다. 현재 코스닥 기술특례상장을 추진 중이다.
-희귀질환 진단은 어떤 식으로 이뤄지나?
의사가 희귀질환으로 의심한 환자의 검체를 쓰리빌리언에 보낸다. 이때 환자가 가지고 있는 증상 데이터도 함께 전달하면 이를 분석한다. 예를 들어 혈액 샘플에서 DNA를 추출해 30억개의 염기서열을 읽어내고, 이를 바탕으로 환자의 증상을 일으킨 유전변이가 있는지 판별한다. 이를 고려하면 AI가 왜 필요한지에 대한 답이 나온다. 유전변이를 해석해야 하는데, 이를 사람이 일일이 할 수가 없어 AI가 분석을 한다. 최종적으로 쓰리빌리언의 임상유전학팀에서 검수를 한 뒤, 리포트를 만들어 병원으로 보낸다. 의사는 해당 리포트를 환자 진단에 활용한다.
-그래서 사명이 쓰리빌리언인가?
그렇다. 30억개의 DNA를 다 읽어서, 알려진 희귀질환을 검사하기 때문에 이러한 의미를 담았다.
-환자의 증상 데이터와 샘플이 병원에서 쓰리빌리언으로 넘겨질 때 개인정보 동의 과정이 이뤄지나?
그렇다. 다만, 기본적으로 환자의 개인정보를 받진 않는다. 즉, 환자의 이름이나 특정할 수 있는 개인정보는 없고, 오롯이 증상보만 받는다. 물론 유전체 데이터는 민감정보에 해당되어 생명윤리안전법을 따르고 있다.
-쓰리빌리언을 창업한 계기가 있는지?
본격적으로 희귀질환을 진단할 수 있었던 것이 2015년~2016년도 쯤이다. 그 전에도 가능했지만, 당시에는 한 사람의 DNA를 읽어내기 위해 엄청난 비용이 들었다. 20년 전에는 인류최초로 전체 DNA를 읽어낸 프로젝트에 3조원이 투입됐다. 그러다 이 비용이 2010년에 접어들면서 1억원 정도로 줄었고, 2015년~2016년부터는 133만원 정도로 줄었다. 이 비용은 환자들이 진단을 위해 지불할 수 있을 정도의 가격이 됐다는 점에서 의미가 있다.
이 시점에서 누구든지 DNA를 읽어낼 수 있게 되면서, 가장 의미있게 활용할 수 있는 것으로 희귀질환 진단이 주목을 받았다. 특히 희귀질병은 유전자의 이상으로 발생한다. 희귀질병 환자들은 수많은 질병 중 자신이 어떤 질병을 가지고 있는지 찾기 어려운 문제에 봉착해있다. 이런 가운데 유전자 해독 가격이 낮아졌고 AI 기술이 발전하면서 사업 기회를 잡았다.
-원래 바이오에 관심이 많았는지?
생명정보학을 전공했는데, 생명과학 연구를 잘하려면 대규모 데이터에서 인사이트를 찾아야 한다. 기존에는 할 수 없던, 의미있는 과학적인 문제를 풀거나 사람들에게 도움이 되는 서비스를 만드는 것을 추구하는 학문이다.
-희귀질환은 어떻게 정의하나?
희귀질환은 2000명 중 1명 이하로 발병한다. 코로나19도 초반에 환자 수가 적었을 때 희귀질환에 속했다. 그러나 환자 수가 많아지면 더 이상 희귀질환이라고 하지 않는다. 현재까지 알려진 희귀질환 1만개 중 8000개는 유전질병에 속하는데, 이외에도 전염병 등 희귀하게 발병하는 것들도 포함이 된다.
-희귀질환 환자 수는 전세계적으로 얼마나 되나?
80억명 인구를 기준으로 하면 약 6억명에서 7억명 사이다. 연간 희귀질환 진단에 대한 수요는 약 2000만명에게서 일어난다.
현재 희귀질환 치료 시장이 제약 시장에서 메이저가 되고 있다. 희귀질환을 제외한 흔히 발생하는 질병은 이미 약이 나올 만큼 나왔다. 경쟁이 치열하고 새로운 약이 나오려면 기존보다 약효가 더 좋아야하는데 개발이 어렵다. 반면, 희귀질환은 치료제를 개발하면 세제혜택을 받을 수 있고, 약값도 비싸게 책정이 되어 시장성이 있다. 실제로, 희귀질환의 95%에 대해서는 치료제가 개발되어 있지 않다. 즉, 희귀질환 치료제를 개발해 시장에 나가면 글로벌 독점으로 경제성이 확보가 된다. 국내에서 100여명에 그치는 희귀질환 폼페병 치료제가 글로벌 도합 연간 조단위의 매출을 올리는 등, 희귀질환 치료제의 의학적 필요성 외에 제약사 입장에서 경제성도 증명이 되는 사례들이 많이 나오고 있다. 또 매년 미국 식품의약청(FDA)에 승인되는 약의 50% 정도가 희귀질환 치료제에 해당된다.
-희귀질병 판별에 대한 정확도는 얼마나 되나?
유전변이라는 결과가 나왔을 때 질병을 일으키는 병원성 변이인지 아닌지 판별을 해야 한다. 이때 정확도가 99.4% 정도 된다.
-이 정확도는 어떤 근거로 책정된 것인지?
AI가 보유한 데이터셋을 기반으로 한다. 이 데이터셋을 기반으로 AI 모델을 만들고, 신규 데이터가 오면 데이터셋을 기반으로 해석을 한다. 정확도 테스트는 희귀질환 검사와 다른, 학습데이터가 포함되지 않은 데이터셋을 만들어서 한다.
또 정확도에 대한 검증은 논문이나 경진대회 참가로 한다. 임상연구에 대한 논문은 현재 70편 이상 냈다. 지난 2022년에는 글로벌 AI 유전체 분석 경진대회인 CAGI 대회에서 우승을, 작년에는 AI 희귀질환 경진대회인 엑설러레이트 레어(Xcelerate Rare)에서 우승을 했다.
-AI 모델은 자체적으로 개발을 했나? AI의 경우 학습 데이터가 많아야 할텐데 데이터는 어디서 가져오나?
자체적으로 개발을 했다. 데이터는 기본적으로 전세계적으로 오픈되어 있는 것들이 꽤 많다. 여기에 더해 차별화된 데이터가 필요하다. 환자를 진단하면서 쌓이는 데이터가 그것이다. 따라서 진단 사업이 잘될수록 학습 데이터의 질이 좋아지고 이는 AI 모델의 성능을 개선하는 등 선순환을 그리는 구조다.
-제휴 병원이 많아야 하는 것 아닌지?
장기적으로는 유전변이 해석 AI 역량이 높아져야 한다. 유전변이 해석 AI 역량이 높아지려면 다양한 인종, 더 많은 환자의 유전체 데이터를 AI가 학습할 수 있어야 한다. 따라서 진단을 잘 해서 많은 환자 데이터를 쌓을 수 있는 기업이 곧, 유전변이 해석 AI 역량이 높은 회사가 될 수 있다고 본다.
-지금까지 쌓인 데이터가 방대할 것 같다.
유전변이 기준으로 보면 이미 100억개 이상 변이 데이터가 쌓여있다. 월간 1000명에서 2000명 사이의 신규 환자 데이터가 새롭게 쌓이고 있다. 쓰리빌리언의 희귀질환 데이터 강점은 유전자 전체를 읽어야 하기 때문에 한 사람에 대한 30억개의 DNA 데이터를 다 가지고 있다는 점이다. 이렇게 방대하게 쌓인 데이터를 바탕으로 특정 질병에 대한 것을 발굴하거나 신약개발 등을 할 수 있다. 실제로, 제약사들 사이에서 이 데이터에 접근하고 싶어하는 수요가 많다. 쓰리빌리언도 이 데이터를 활용해 신약 연구개발을 하고 있다.
-AI 기술력은 어느 정도인지?
CAGI 대회, 엑설러레이트 레어 대회에서 우승을 한 만큼 AI 기술력은 정상 수준에 와있다고 판단한다. 진단 과정에서 AI 모델이 여러개 필요한데, 다양한 AI 모델을 구축해 희귀질환 진단 과정을 효율화하고 있다. 예를 들어, 유전체 데이터에서 변이를 해석할 수 있고, 변이 유전자가 일으킬 수 있는 질병과의 상관성을 검증하는 모델이 따로 있다.
-AI 개발 인력은 얼마나 되나?
AI 개발진은 약 30명 정도이며, 유전학 팀도 약 10명이다. 쓰리빌리언 전체 인력 80명 중 70~75%가 연구개발 인력이다.
-매출 절반 이상이 해외에서 나온다고, 진단 고객 데이터 중 절반 이상이 외국인인가?
그렇다. 해외 데이터가 더 많고 앞으로 이 비율은 더 늘어날 것이다. 유전질병 시장은 인구비례 시장이다. 이상적으로는 한국 1%, 해외가 99%가 되어야 정상이다. 쓰리빌리언도 이 과정 중에 있으며, 올해는 해외 비중 80%를 보고 있다. 현재 약 50개국 의사들로부터 의뢰가 들어오고 있다.
-경쟁사 대비 차별점은 무엇인가?
결국 AI로 희귀질환에 대한 정확한 진단을 하는 것이 가장 중요하다. 시장에서 선택받는 것은 또 다른 문제다. 매년 200~300개의 희귀질환이 새롭게 보고되는데, 만약 의뢰된 환자들 중 진단에 실패하는 경우 새롭게 발견되는 유전질병, 그리고 해석 근거 데이터들을 바탕으로 주기적 재분석을 통해 추후에 진단이 가능하다. 쓰리빌리언에 의뢰된 환자로 첫번째 시도에 진단에 실패한 경우, 환자가 진단 받을 때까지 매일 환자의 데이터는 자동화된 재분석에 들어가게 된다. 재분석 비용은 1000달러가 넘지만, 쓰리빌리언은 환자가 진단 받을 때까지 재분석을 무료로 제공한다. 이것이 가능한 이유는 재분석 과정에 필요한 시스템을 효율화했기 때문이다.
-영업을 할 때 강조하는 것은 어떤 점인지?
임상 검증이 많이 됐다는 점이다. 또 비용이 글로벌 경쟁사들 대비 저렴한 편이다. 미국의 경우 3000달러(한화 약 400만원) 정도 된다면, 쓰리빌리언은 절반 수준이다. 변이 해석에 들어가는 비용 중 50% 이상은 인건비인데, AI를 활용해 이 비용을 줄였다. 덕분에 검사 결과도 빠르게 전달할 수 있다.
-진단 결과는 얼마나 걸리나?
평균적으로 3주 정도 소요된다. 경쟁사의 경우 약 6주가 걸린다. 진단 결과는 사업이 잘될수록 더 빨리 나온다. 예를 들어 100명의 환자가 모이는데 일주일이 걸렸는데, 이젠 100명을 모으는데 이틀이 소요 된다면 검사를 더 빨리 할 수 있게 된다. 올해는 작년보다 세 배 정도 성장할 것으로 전망하고 있는데, 내년 쯤에는 진단 시기를 지금보다 더 축소할 수 있을 것으로 보고 있다.
-작년 매출은 얼마나 되나?
약 30억원 정도다. 올해는 작년보다 세배 성장하는 것을 예상하고 있다. 이러한 성장세를 내년까지 반복하다보면 손익분기점(BEP)에 도달할 수 있을 것이라고 보고 있다.
-현재 IPO를 추진 중인데 진행 상황은 어떻게 되나?
이제 상장 예비심사를 남겨두고 있는데 결과는 올 여름쯤 나올 것 같다. 이렇게 된다면 하반기에는 상장할 수 있을 것으로 보인다.
업데이트
앞으로 쓰리빌리언과 관련해 새로 나오는 뉴스나 관련 기사는 하단에 계속해 업데이트 할 예정입니다. 새로 궁금한 소식이 있다면 계속해 찾아주세요!
글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network