최신 연구동향 정보를 제공하기 위해 생명과학관련 정보제공자를 모집합니다.
Bio리포트 학회참관기
Gordon conference: Quantitative genetics and Genomics 참관기
최선심(강원대학교)
목차
1. 학회 소개
2. MISSING HERITABILITY
3. Causative 유전자 혹은 alleles 찾기
4. 형질 복합성을 야기 시키는 유전자 조절 부위 진화 기작
5. germ line mutation 계산
6. 우울증과 연관된 미토콘드리아 DNA량
7. metabolomics and epigenetics
8. Dr. Atul Bute 박사님의 인간 질병 게놈학적 전망
9. 결론
1. 학회 소개
무엇보다 골던 컨퍼런스 (Gordon conference)를 소개할 수 있어서 기쁘게 생각한다. 83년의 전통을 자랑하는 유서 깊은 학회임에도 불구하고 키스톤 심포지움(Keystone symposium)에 비하여 국내연구자들에게 덜 알려져 있는 듯하다. 학회의 형식은 키스톤과 유사하다. 학회는 매 해 생물, 화학, 물리 분야를 어울러 수 백여 가지의 주제를 가지고 세계 각국의 저명 도시에 위치한 호텔에서 개체된다. 각 주제의 컨퍼런스는 2년에 한 번씩 개최할 수 있는 자격이 부여된다. 각 주제 별로 회장 및 운영위원들이 구성되고, 이들에 의해서 발표 주제와 발표자들이 결정된다. 학회 참여에 관심 있는 연구자는 www.grc.org 사이트에 들어가서 카테고리별, 사이트별, 날짜별로 정리된 컨퍼런스 리스트를 살펴보고 관심 있는 주제의 컨퍼런스를 링크를 통해 찾아 들어가 살펴보기를 권한다.
키스톤 심포지움과 마찬가지로 학회 등록 전에 먼저 참가 의사를 밝히고, 학회 회장에 의해 등록 가능 여부가 결정된다. 한 학회 당 수용할 수 있는 호텔 규모 등을 고려하여 참여 연구자의 수가 결정되기 때문에, 참가 신청 시 자기 소개서를 신경 써서 제출하는 것이 좋다. 아니면, ‘미안하다. 더 이상 수용할 자리가 없어서 등록이 어렵겠다’는 내용을 담은 등록 이메일을 받게 되는 일이 종종 있다. 모든 참가자는 일주일 동안 함께 식사하고, 함께 여행하고, 또 한 강당에 모여 다 같이 같은 톡을 듣고 디스커션에 참여한다.
본인이 참가한 컨퍼런스는 2월 22일부터 2월 29일까지 이탈리아의 바르가 지역에 위치한 IL CIOCCO 호텔에서 개최된 Quantitative genetics and Genomics를 주제로 열린 컨퍼런스 이다. 각 세션 별 좌장이 있고, 좌장들은 세미나 시작에 앞서서 그 세션과 관련된 전체적인 연구 경향과 동향을 소개하고, 이어 2명의 관련 분야 훌륭한 성과를 가진 저명 연구의 발표와 한 명의 대학원생 혹은 포스트닥터 같은 젊은 연구자의 톡이 이어졌다. 컨퍼런스 소주제는 다음과 같다.
1. Genomic architecture of complex traits-Uncovering missing heritability
2. From correlation to causation - Identifying causative variants underlying complex traits
3. From correlation to causation -Identifying causative genes underlying complex traits
4. From correlation to causation-Identifying networks underlying complex traits
5. Population genomics of complex traits
6. Evolutionary genomics of complex traits
7. Genomics of host pathogenetic interaction
8. Epigenomics of complex traits
9. Translational genomics
주제들을 살펴 보면 알겠지만, genotype-phenotype 관계에 있어서, Genomics 연구분야 전반을 커버하고 있어 사실 본인이 모든 주제의 톡들을 다 이해하고 이 참관기에 녹여내기는 매우 어렵고 불가능한 일이라는 것을 우선 밝힌다. 또한, 골던 컨퍼런스의 정책 중 하나가 포스터를 포함하여 모든 발표 자료를 공개하지 않는 것이기 때문에, 사진 촬영을 엄격하게 금지하고 있어, 좀 더 생생한 모습을 전달할 수 없음을 아쉽게 생각한다. 또한, 본인이 생물정보학을 기반으로 연구를 진행하고 있기는 하나, 연사로 초대되어 발표한 여러 연구자들, 즉, 직접 수학 및 통계적 기반의 유전학적 모델을 만드는 연구자들과 연구 분야가 다른 부분이 있어 이해에 한계가 있었던 것도 밝혀두는 바이다. 국내에도 여러 연구자들이 수학적 모델에 기반 한 유전학적 연구를 수행하고 있는 것으로 알고 있는데, 그 분들에게 본 학회를 강력하게 추천하고자 참관기 작성에 동의하게 되었다.
같은 주제의 골던 컨퍼런스는 이제 2년 후, 2017년 미국에서 개최하는 것으로 결정되어 있는 상황이다. 관심 있는 연구자들은 2016년에 미리 사이트를 살펴보고 등록 절차를 진행하여야 할 것이다.
본 컨퍼런스에 대한 종합적인 주제에 관한 총평과 그 외 본인이 관심있게 들었던 몇 가지 톡들을 소개하고자 한다.
2. MISSING HERITABILITY
인간의 질병의 유전적 원인을 밝히는 일은 유전학 분야 혹은 최근 질병유전체학 분야의 큰 목표이다. Genome wide association study (GWAS) 연구는 당뇨, 고혈압과 같이 개별적으로는 영향이 미미하지만, 많은 유전자 혹은 많은 유전적 변이들의 복합적인 상호작용의 결과로 일어나는 복잡한 질병의 유전적 원인들을 밝히기 위한 목적으로 수행되었다. 또한, 키와 몸무게, BMI와 같이 인간이 가진 다양한 특질에 대하여 어떤 유전적 변이가 기여하고 있는지에 관한 많은 연구가 진행되어 왔고, 많은 수의 QTL들이 밝혀져 왔다.
문제는 특정 특질과 통계적으로 유의하게 연관되어 있다고 밝혀진 많은 유전적 변이들이 설명하는 유전력(heritability)이 그리 크지 않다는 데 있다. 즉, 쌍둥이 연구에서 같은 유전적 변이를 가진 쌍둥이가 같은 형질을 발현할 확률이 80%에 이름에도 불구하고, 실제 GWAS에 의해 찾아진 유전적 변이 군들 (SNP sets)의 경우 유전력이 10-25% 정도에 불과하다고 한다. 이를 Missing Heritability라고 하고, 왜 이런 미싱 헤리터빌리티가 발생하는지에 관한 설명이 시도되고 있음을 볼 수 있었다. 가장 눈에 띄는 것은 ‘Quantitative’ 라는 주제에 걸맞게 여러 연구자들이 다양한 수학적 모델링을 디자인 하고 테스트 하거나, 유전적 구조 (genetic architecture)를 이해하거나, 혹은 epistasis라고 불리는 관련된 서로 다른 유전적 변이들 간의 상호작용을 고려한 실험 디자인과 모델을 통하여 Missing Heritabililty를 설명하고자 함을 알 수 있었다.
결론적으로, 어떤 연구자의 경우는 코딩 부위 변이 중심으로 진행되어 왔던 그 동안 대부분의 GWAS 연구에 비하여, Missing heritability를 DNase hypersensitivity sequence (DHS)와 같은 넌코딩 부위이나 발현조절에 관련되어 있을 것으로 생각되는 부위에 존재하는 마커들을 통하여 설명하려고 시도한 반면, 어떤 연구자는 여전히 코딩부위에 존재하거나 혹은 코딩 부위 근처에 존재하는 SNP들에서 답을 찾고자 하는 것을 볼 수 있었다.
3. Causative 유전자 혹은 alleles 찾기
GWAS 연구에 있어서 또 다른 장벽은 원인 유전변이를 찾는 것이다. GWAS연구에서 상관관계 분석이나 회귀분석이 많이 사용되어 오고 있음은 주지의 사실이다. 하지만, 상관관계가 곧 원인은 아니라는 것은 대부분의 연구자가 인식하고 있는 문제이다. 많은 유전변이들은 아마도 원인 변이 근처에 존재하여 Linkage Disequilibrium (LD)에 의한 간접적인 결과로서의 도출된 상관관계라고 생각되어진다. 질병 혹은 형질의 직접적인 원인이 되는 변이를 찾는 것은 여전히 무척이나 어려운 일이다. 다수의 연구자들이 이 문제에 도전하고 있음을 알 수 있었다. 이 주제 또한 주로 수학적 모델링 기법과, 유전자-유전자 상호작용 네트워크 구성을 통하여 유전적 변이로 인한 상호작용의 소실 여부가 질병으로 이어지는 지 여부를 밝힘으로써 질병 원인 유전자 혹은 변이를 찾고자 하는 것을 볼 수 있었다. 또한 흥미로웠던 연구는 사회적 상호작용을 하고 있는 다른 종들의 가진 유전적 변이가 직접적인 질병에 영향을 미친다는 것이다. 예를 들어, 인간과 미생물들의 상호작용이 그 것인데, 인간과 상호작용하고 있는 미생물의 genotype이 인간 질병 유전 변이의 유전과 진화에 영향을 미친다는 것이다.
예로, Howard Huges Medical Institute 소속의 David Stern교수는 형질에 직접적인 원인 변이를 찾아가는 연구와 관련하여 매우 흥미로운 연구를 하나 소개하였다. 다양한 초파리 아종들에게 있어서 존재하는 성행동 (courtship behavior)을 모니터링 하여, 성행동의 위치하고 있는 염색체 위치를 매핑한 다음 성행동을 유발하는 유전자를 찾아가는 연구이다. Stern 교수는 이 연구를 위하여 각 초파리 아종의 날갯짓 소리를 증폭하여 들려주고, 각 아종이 갖는 소리가 구별되게 다르다는 것을 확인시켜 준 다음, 유전학적 방법을 통한 염색체 좌위 매핑과, 매핑 된 위치의 유전자를 바꿔치기 할 경우 성행동에 의해 유발되는 소리가 달라진다는 것을 확인해 줌으로써 어떤 형질의 원인 유전자를 찾는 방법을 소개해 주고 있었다.
4. 형질 복합성을 야기 시키는 유전자 조절 부위 진화 기작
Jonathan Prichard교수는 GWAS 연구 분야에 있어서 다양한 업적을 이룬 분으로 유명하다. 하지만, 본 컨퍼런스에서는 기존의 연구와는 전혀 다른 enhancer라 불리는 유전자 조절부위의 진화와 이에 따른 발현 단백질의 조직 별 분화에 따른 기능적 다양화 기작에 관한 연구를 발표하여 여러 연구자들의 관심을 받았다. 우선, 새로운 유전자 생성에 있어서 유전자 중복 기작이 중요하다는 패러다임으로 부터 톡을 이끌어 나갔다. 오래된 문제 중 하나는 어떻게 중복된 유전자가 functional constraint의 완화에 따른 유전자 죽음으로부터 벗어나느냐에 관한 문제였다.
Dr. Lynch라는 분에 의해 제시되었던 enhancer 부위의 퇴화 및 보존에 의한 subfunctionalization이란 가설이 오랫동안 좋은 설명으로 받아들여져 왔다. 예를 들어, 중복되기 전 조상 유전자가 간과 콩팥에서 발현되는 유전자였다면, 이 유전자 업스트림의 enhancer가 이 발현을 조절했을 터이다. 그런데, 만약 유전자 중복이 일어난다면 같은 조직에 2배에 이르는 유전자 발현이 발생하게 되어 개체의 생존에 해로운 결과를 줄 수 있다. 왜냐하면, 중복은 functional constraint를 약화 시켜 돌연변이가 purifying selection에 의해 제거 되기 어렵기 때문에다.
그런데 만약, 중복된 양쪽 유전자의 enhancer 부분에서 그러한 퇴화(degeneration)가 일어나 중복된 2개의 유전자 중 각 한 쪽에서 간, 다른 한쪽은 콩팥 발현에 관련하는 enhancer가 퇴화되고, 다른 조직 발현을 관장하는 부위가 남게 된다면, 각 조직에서의 발현은 그대로 유지될 수 있다는 것이다. 중복되어 2배가 되었으나, 발현 수준에서는 조상 발현 패턴을 따른다면, 진화에 의해 이 중복 유전자는 제거 되지 않고 둘 다 살아남을 수 있다는 것이 바로 subfunctionalization 가설이다. 프리차드 교수는 바로 이 이론을 현대적인 시퀀싱 기법을 통하여 확인하고자 하였고, 모든 중복이 이 가설에 맞는 것은 아니라는 것을 밝혔다. 즉, 현존 하는 중복 유전자가 서로 발현 조직을 상호간 억제되는 방법으로 보존되기 보다는 두 중복 유전자가 중복된 조직에 발현이 되더라도 정상적으로 기능하는 다양한 패밀리 유전자들의 예가 많이 발견됨을 보여주고, 이를 설명할 수 있는 새로운 모델을 제시하였다.
5. germ line mutation 계산
과거부터 오랜 동안 어떤 계통의 돌연변이율은 서로 다른 두 종 간의 뉴클레오티드 치환수를 두 종이 분기한 시간으로 나누어 계산해 왔고, 그 결과로 인간과 침팬지의 분화 시점이 약 7백 만 년쯤 전으로 예상되어 왔다. 하지만 최근 NGS기술의 발달로 직접적으로 세대 간에 일어나는 돌연변이의 개수를 정확하게 셀 수 있게 되어 앞서 진화적인 방법으로 계산된 돌연변이율과 비교가 가능하게 되었다. 문제는 이 두 가지 측정에 의해 도출된 돌연변이율의 차이가 크다는 데 있다. NGS계산에 의하면 두 종은 7백 만 년 전 보다 훨씬 오래 전에 분기했어야 한다는 계산이 나온다고 한다. 즉, 두 측정 방법 중 어느 하나가 과하게 혹은 적게 계산하거나, 돌연변이율 계산에 문제가 있다는 것을 암시한다. 여기서 출발하여 콜롬비아 대학의 Molly박사는 세포 분열 시 일어나는 돌연변이율을 계산할 때, 오로지 Replication error에 의한 돌연변이율만을 고려하는 것이 이러한 차이를 만드는 문제 중 하나일 수 있다는 것을 제시하였다. 즉, 환경의 다양한 원인들 예를 들어, UV나 벤젠 등 환경으로부터 오는 돌연변이 유발원에 의한 돌연변이가 일어났을 때 미처 다 고치지 못하고 남는다면 이 역시 돌연변이로 남게 되어 전체적인 돌연변이율에 영향을 미칠 수 밖에 없다는 것이다. 이러한 요소의 보정에 의하여 훨씬 정확한 돌연변이율의 계산이 가능하고, 보다 정확한 종 분화 시기를 예측할 수 있다는 것이 이 박사님의 주장이다.
6. 우울증과 연관된 미토콘드리아 DNA량
옥스포드 대학에서 공부하고 있는 대학원생이 발표한 이 톡이 청중을 감동 시켰다. 연구는 옥스포드 대학에서 수행되었지만 샘플은 컨트롤 6000개, 우울증 case 6000개를 중국의 여러 병원과의 공동연구를 통하여 확보하였다고 한다. 이들 전체 12000개 샘플에 대하여 1x whole genome sequence를 분석하였고, 따라서 핵에 존재하는 유전자들의 돌연변이 정확성은 떨어지나, 미토콘드리아 DNA의 경우는 이 서열결정 방법에 의거하면 100x가 넘는 coverage를 얻을 수 있게 되어 정확한 돌연변이와 양적 계산이 가능하였다고 한다. 여러 가지 유전적 요소와 환경적 요소, 그리고 우울증 간의 상관관계에 관한 분석을 실시했을 때 유일하게 통계적 유의성을 보여준 요소가 바로 미토콘드리아 DNA양이었다고 한다. 즉, 우울증에 걸린 환자 샘플 DNA에서 유의한 미토콘드리아 DNA양적 변화를 관찰할 수 있었다고 한다. 동시에, GWAS 연구에서 미토콘드리아 생합성 경로에 관련된 유전자 하나에서 돌연변이가 관찰되었을 뿐 아니라, 미토콘드리아 자체 dna에서도 역시 생합성 경로에 영향을 미치는 유전자에 돌연변이가 발견되었다고 한다. 즉, 우울증과 미토콘드리아의 상관관계가 있음을 보여주는 흥미로운 결과라 하겠다.
7. metabolomics and epigenetics
메타볼로믹스는 최근 가장 각광 받고 있는 연구 분야라는 데 있어서 재론의 여지가 없다. 환경에서 얻은 미생물들의 다양성을 16 rRNA 서열의 무작위 결정과 어셈블리, 그리고 phylogenetic tree를 그리는 과정을 통하여 조사할 뿐 만아니라, 특정 genotype을 가진 미생물의 군집 빈도의 변화와 인간 질병, 특히 IBD (Intestinal bowel disease)나 Ulcerative colitis의 원인 및 예후의 관련이 있음에 대한 일치되는 결과들이 보고 된 바 있다. 나아가, 고혈압 혹은 당뇨의 발병 또한 메타볼로믹스적인 연구 기법으로 이해하고자 하는 시도도 되어져 오고 있다. U of Minnesota의
Dr. Ran Blekhman은 특히 메타볼롬과 tumor microenvironment와의 상관관계에 관한 연구를 발표 함으로써, 암과의 연관성도 조심스럽게 제시하고 있었다.
더불어, 다양한 후성 유전체 관련 연구 결과 역시 여러 연구자가 발표하였다. 특히, Queensland brain institute의 Dr. Allan은 imprinting에 관여하는 methylation의 변동이 가지는 표현형적 효과를 보여줌으로써, epigenetic regulation의 중요성을 설명하였다.
8. Dr. Atul Bute 박사님의 인간 질병 게놈학적 전망
이 분은 한국에 5-6번 정도 방문하여 톡을 했던 한국 연구자들에게 매우 친숙한 연구자이다. 곱슬머리에 부리부리한 눈, 곱슬머리, 유창한 언변을 가진 훌륭한 연구자 중 한 분이다. 이 분은 소아당뇨를 치료했던 임상의였으나, 지금은 기초연구에 매진하고 계시다고 한다. 얼마 전까지 Stanford에 재직하셨는데 곧 UCSF로 옮기신단다. 사실 한국에서의 이 분의 톡 속도에 비하여 이 컨퍼런스에서의 톡은 10배 정도가 빨라졌다. 어찌나 빠른지 듣는 내가 숨이 가쁠 정도였다. 하지만, 이 분의 연구에서 어떻게든 그 동안의 GWAS 연구를 임상에 적용하고자 하는 노력을 볼 수 있었다.
연구의 시작은 GWAS 방법을 통하여 연구된 수많은 연구 논문들을 직접 사람이 하나하나 읽고 데이터를 다시 정리하기로 한 것이다. 기계의 힘을 빌리지 않고 한 논문 한 논문 찾아보면서 반복적으로 여러 서로 다른 연구에서 공통적으로 관련 있다고 보고된 SNP이 무엇인지 찾고자 했다고 한다. 그런 다음 이 SNP들이 어떤 임상적 예측에 도움이 될 수 있을 까 역으로 보기로 했다고 한다. 우연히 네덜란드 코호트 중에 몇 십 년 전에 채취된 샘플이 있었고 현재 상당 수 죽었으며, 이들 코호트의 임상적 특징들에 관한 데이터를 얻게 되었고, 찾아진 SNP들이 어떤 예측력을 보여주는 지 살펴보았다고 한다. 이 분의 얘기로는 대부분 이미 보고된 SNP들이 예측력이 없었고, 단 한 가지 아주 미묘하게 통계적 유의한 예측력을 보여주는 것이 Alzheimer disease 에 관한 예측이었다고 한다. 하지만, 그 차이는 아주 미묘하였다.
이 분의 정당화는 이것이다. 유리창 밖으로 사람들을 보니 우산을 들고 우비를 입고 있는 사람들이 많았다. 그런데, 이 때 비가 내리고 있었다. 따라서, 우산과 우비는 비가 내리고 있다는 좋은 마커이고 잘 찾은 마커이다. 하지만, 이 마커가 내일 비가 내릴지는 예측하는 데는 거의 아무런 도움이 안된다는 것이다. 지금까지 찾아진 마커들이 가진 예측력이 낮은 것은 어쩜 당연할지도 모른다는 것이다. 또한 이 분은 원인변이를 찾는 데 있어서 linear regression에 기초한 odds ratio계산 보다는 likelihood ratio계산을 통해 찾아야 한다는 제안을 했다. 이 분은 또한 다양한 환경 변수들과 질병과의 모든 알려진 상호관계를 모아서 분석하였고 (일명, EWAS), 그 결과 제초제 (pesticide)가 파킨슨 병과 어느 정도 유의한 관련이 있다는 것을 알 수 있었다고 한다.
수많은 돈과 엄청난 인력과 연구를 동원하여 찾은 몇 천 개에 이르는 질병관련 변이들과 환경변수들에 관한 확률적 분포를 아는 것이 무슨 이익이 있겠느냐는 회의론이 있다는 것을 인지함과 동시에, 알고 싶어하는 반대편 요구도 많다는 것도 인정해야 한다고 했다.
9. 결론
연구자 한 사람 한 사람의 연구 결과를 정리하여 참관기에 쓰기에는 내용도 방대하거니와 본인 한 사람이 다 이해하기에는 벅찬 내용이었음을 다시 한 번 밝히는 바이다. 다만, 정량적 유전학 혹은 유전체학 분야도 전체적은 인간 질병 기작을 이해하고 치료법을 찾아가는 과정에서 활발하게 연구되고 있는 분야라는 것을 다시 한 번 확인할 수 있는 계기가 되었음은 확실하다. 생물정보학과 수학적 모델링이 주요 기술이나 그 이면에는 유전학과 진화학이라는 매우 기초적인 생물학적 지식에 토대를 이루고 있음은 너무나 자명했다. 이 학회를 통해서 다시 한 번 국내 연구가 너무나 기술 중심, 단순한 서열 분석에 초점이 있는 것이 아닌가 하는 생각이 들었다. 기초과학 없는 응용이 있을 수 없다는 것을 정책 입안자들이 알아줬으면 좋겠다는 희망도 가져 보았다. 국내에도 이미 이 분야의 다양한 연구자들이 활발한 연구를 진행하고 있는 것으로 안다. 보다 서로 간에 적극적인 교류가 있었으면 좋겠고, 이런 학회에도 적극 참여하여 포스터 발표가 아니라 톡을 하는 연구자들도 나왔으면 좋겠다는 생각이 든다.
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
자료열람안내
본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다.
내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(view@ibric.org) 바랍니다.