구글 딥마인드, 또 혁명적 성과…생로병사의 비밀 푸나

알파고를 만든 구글의 AI(인공지능) 자회사 ‘딥마인드’가 또다시 혁명적 수준의 결과물을 내놓았다. 이번에는 생명공학 분야다. 네이처는 30일(현지시각) 구글의 AI 소프트웨어 ‘알파폴드’가 유전정보만으로 단백질의 3차원 입체 구조를 예측하는 데 놀라운 성과를 보였다고 발표했다.

네이처에 따르면 알파폴드는 CASP(The Critical Assessment of protein Structure Prediction)에서 90점에 가까운 예측 성공률을 기록했다. CASP는 2년에 한번씩 단백질 구조를 예측하는 대회로,  이번 대회에 약 100개의 팀이 도전장을 던졌는데 알파폴드는 압도적인 차이로 1위를 기록했다. 알파폴드 경쟁 소프트웨어들은 75점 수준이었다.

네이처에 따르면, 단백질의 기능은 3차원 모양에 의해 결정되는데 아미노산 서열이 결합해 어떤 모습의 3차원이 되느냐를 예측하는 것이 큰 숙제다. 단백질의 기능을 3차원 모양이 결정하기 때문이다. 이는 단백질의 비밀을 푸는 열쇠가 된다. 이 비밀을 풀면 각종 유전병의 원인을 찾을 수 있고, 신약 개발에 활용할 수 있다고 한다.


단백질 구조 예측, 왜 중요한가


인간은 약 30억 쌍의 염기로 유전체가 구성된다. 염기 세 개가 모여서 하나의 아미노산이 만들어진다. 아미노산은 20개가 있는데, 아미노산들이 모여서 단백질이 된다.

이 단백질은 인간의 몸에서 가장 중요한 성분이다. 단백질은 폴딩(구부러짐) 구조를 갖고 있는데, 잘못 구부러지면 파킨슨병이나 알츠하이머와 같은 퇴행성 질환을 얻게 된다. 단백질의 3차원 구조가 단백질의 기능을 결정하기 때문에 그 구부러진 구조를 예측할 수 있다면 질병이 생기는 매커니즘을 알 수 있고, 궁극적으로 지금까지 치료하지 못했던 질병도 치료할 수 있을 것으로 보고 있다.

그러나  단백질의 3차원 구조를 예측하는 것은 구조생물학의 난제이다. 수많은 과학자들이 복잡한 방법으로 그것을 예측하는 프로그램을 만들려고 했지만 아직까지 완벽한 기술은 나오지 않았다. 단백질은 복잡하고 고정된 구조가 아니어서 유동적으로 움직이기 때문이다.


실험적 방법을 통한 기존의 방법들과 알파폴드


과학자들은 수십년 동안 단백질 구조를 예측하기 위한 노력을 해왔다. 이를 위해 여러 실험적 방법이 활용됐다. X선을 단백질에 통과시켜 나타난 회절형태를 이용하는 방법도 있었고, 핵 자기공명(NMR) 분광학을 통해 단백질 분자 부분간의 거리 측정하는 방식을 활용하기도 했다. 극저온전자현미경을 이용하는 방법도 동원됐다. 하지만 이런 실험 방법들은 시간과 비용이 많이들 수밖에 없었다.

반면 알파폴드는 특별한 값비싼 실험장비 없이 딥러닝 등 AI 기술을 이용해 단백질 3차원 구조를 예측했다. 그럼에도 결과가 기존의 실험적 방식과 큰 차이가 없었다. 네이처에 따르면, 알파폴드는 90점에 가까운 예측률을 보였는데, 이 수치가 90이 넘으면 기존의 방법론과 차이가 없어지는 것이라고 설명했다.

알파폴드는 이번이 CASP 첫 도전이 아니다. 지난 2018년에도 도전장을 던진 바 있다. 당시에도 알파폴드는 1위를 기록했는데 60점에 못 미치는 예측 결과였다. 2년만에 30점 가까이 예측률을 높인 것이다. 이같은 개선이 이어진다면 기존의 방법들보다 뛰어난 예측 결과를 얻는 것도 머지 않았다고 이해할 수 있다.

CASP 를 만든 미국 메릴랜드대의 존 몰트 교수는 알파폴드의 성과에 대해 “대단한 일”이라며 “어떤 의미에서는 문제가 풀렸다”고 말했다.

딥마인드의 데미스 하사비스 CEO는 “단백질 구조 예측과 같은 거대한 과학적 과제를 해결하는 것은 AI가 만들 수있는 가장 중요한 응용 프로그램 중 하나”라면서 “내 생에서 가장 중요한 과학적 결과”라고 말했다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

2 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다