메뉴바로가기본문바로가기.

동아사이언스

[표지로 읽는 과학]인간 단백질 전체로 분석 대상 넓히는 인공지능 3D구조 예측

통합검색

[표지로 읽는 과학]인간 단백질 전체로 분석 대상 넓히는 인공지능 3D구조 예측

2021.08.28 09:00
네이처 제공
네이처 제공

국제학술지 네이처는 26일 표지에 아미노산이 배배 꼬인 단백질들로 이뤄진 사람의 형상을 실었다. 단백질은 생명을 이루는 필수 물질로 저마다 기능을 하며 모든 생명 현상에 관여한다. 단백질의 기능을 해제하는 열쇠는 단백질의 3차원(3D) 구조에 있다. 하지만 지금까지 실험을 통해서 인간 단백질의 17%만 그 구조를 알아낼 수 있었다.

 

하지만 구글 딥마인드의 단백질 구조 예측 인공지능(AI) ‘알파폴드2’는 순식간에 인간이 알아낸 인간 단백질 3D 구조의 수를 2만 296개로 늘렸다. 이는 전체의 98.5%에 이르는 수치다. 데미스 허사비스 구글 딥마인드 최고경영자(CEO) 연구팀은 지난달 15일 알파폴드2의 세부 내용을 네이처에 온라인으로 공개한 데 이어 지난달 22일에는 36만 5000개 이상 단백질의 3D 구조를 누구나 볼 수 있도록 공개했다.

 

단백질은 유전자 정보에 따라 20종의 아미노산이 긴 사슬로 수백 개 이상 이어지는 형태를 띤다. 이 아미노산이 분자들 간 힘에 따라 상호작용해 고유 구조를 만든다. 이 구조가 단백질의 기능과 직결된다. 하지만 구조를 만드는 데 워낙 변수가 많아 아미노산만으로 구조를 예측하기는 어려웠다.

 

딥마인드는 실험과 시뮬레이션이 지배하던 단백질 구조 예측 분야를 AI로 뒤집었다. 이미 알려진 단백질 구조와 아미노산 배열을 학습해 새로운 아미노산 배열의 구조를 예측하는 방식이다. 지난해 12월 열린 단백질 구조 예측 학술대회(CASP)에서 92.4점을 받아 최고점을 받으며 구조 예측이라는 오랜 문제의 해결책으로 인정받았다.

 

딥마인드는 유럽 분자생물학연구소(EMBL)와 협력해 알파폴드2의 단백질 구조 예측 결과를 데이터베이스로 구축해 공개하기로 했다. 연구팀은 올해 말 지금까지 알려진 2억개에 이르는 단백질의 절반 이상에 해당하는 1억 3000만 개의 단백질 구조를 예측하는 것을 목표로 제시했다.

 

에디트 허드 EMBL 사무총장은 "알파폴드는 과학계에서 구축한 공개 데이터를 사용해 훈련해 예측 또한 공개되는게 합리적"이라며 "알파폴드 데이터베이스는 개방형 과학 선순환의 완벽한 예"라고 말했다.

관련 태그 뉴스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기