개인유전체 국제워크샵에 다녀와서 :: 2009/04/11 17:37

지난주에는 eIMBL/KOBIC에서 주최하는 국제워크샵에 다녀왔다. 주제는 "Personal Genomics and Asian Bioinformation Center", 최근 급부상하고 있는 개인유전체에 대한 현황과 아시아지역에서의 국제협력체계의 중요성을 논하는 자리였다.

eIMBL International Workshop

박종화 박사님의 프리젠테이션에서 가끔씩 볼 수 있는 혼일강리역대국도지도. 인간유전체지도를 완성해나가는 과정에 대한 메타포로 소개된다.

Ancient world map

저 지도를 볼 때마다 느끼는 것이지만, 나는 내가 관심있는 주변에 대해서만 비교적 정확하게 알고 있을 것이라는. 다른 동네에는 내가 모르는 세계가 있을 것이고 내 인식영역 너머에 있다. 그럼에도 불구하고, 1402년의 세계지도라고 하기엔 왠만한 것들은 다 들어있다. 페르시아반도도 있고, 한반도는 아프리카대륙보다도 크다.

최근의 개인유전체연구는 SNP을 기초로 시작되고 있지만(예, 23andMe), 곧 전체서열결정으로 이어질 것으로 보인다. 그도 그럴것이 유전체 변이는 SNP말고도, MS(Microsatellite), CNV(Copy Number Variation) 등등 더 다양한 것들이 있고, 결국에는 이들을 다 커버하려면 전체서열결정을 해야할 것이기 때문이다. (그럼에도 불구하고, 나는 23andMe의 SNP 60만개는 충분히 중요한 정보라고 생각한다. 마치 출구조사한 일부 샘플이 선거결과예측에 적중하는 것처럼)

본격적인 개인 유전체 전체서열은 2007년 Crag Venter을 시작으로, 2008년 James Watson, African mail Yoruban, Asian mail Han-chinese가 Nature를 통해 공개되었고, 우리나라도 가천의대 김성진 박사의 자료를 공개했다. 마크로젠에서는 Altaic male/female 반수체(haploid) 서열 결정작업이 진행중이다.

KOREF(김성진박사 유전체)의 SNP을 타 유전체 데이터와 비교해봤더니, 아래 슬라이드와 같다더라.

DSC03564

한국인 고유의 SNP로 약 80만개를 새로 결정한 듯 한데, 어떤 과정으로 저렇게 계산됐는지 궁금하다. SNP이라고 하면 집단에서 1%이상의 빈도로 발견돼야 할텐데, 한명의 유전체 전체서열에서 어떻게 그것을 계산할 수 있는지. 어쩌면 별도의 한국인 SNP 타이핑 결과데이터를 합쳐서 계산했는지도 모르겠다.

한국인이 단일민족으로 오랬동안 고정되어 왔으므로, 타 인종에게는 발견되지 않는 SNP이 꽤 있을 것으로 추정할 수 있다. 국제 인간유전체 데이터를 기반으로 한국인의 특정 변이를 확장하면 한국인 맞춤형 의료서비스를 기대할 수 있다. (그러고보면, 국제적인 공개데이터를 별다른 수고없이 날로 먹고 있는 것이 아닐까 싶기도. 한국인 맞춤에 앞서 국제적인 기여도 중요할 것이다.)

요즘 (소셜)네트워크 얘기가 한창인데, 유전자 네트워크도 유사하다. 다양한 유전자들이 복잡하게 얽혀서 특정 현상(반응물 농도)에 미치는 과정을 네트워크로 연구하는 과정은 최근 시스템생물학에 많이 연구하는 분야이다. 제어모델을 위해 네트워크를 미분방정식으로 표현할 수 도 있지만, Boolean network라고 해서 on/off 만으로 단순화하기도 한다.

DSC03573

B가 C를 활성화하고, A가 C를 저해할 때, 위처럼 묘사할 수 있다. 이것을 기본으로 만든 네트워크에서 특정 유전자의 on/off 가 어떤 영향을 미치는가를 시뮬레이션해볼 수 있는 것. 개인유전체를 통해서 얻은 각 유전자의 on/off 가 개체에 어떤 영향을 줄 것인가를 가늠할 수 있고, 이 역시 미래에 널리 활용될 것으로 보인다. 단점은 on/off 로만 묘사한다는 것. 단백질 활성을 30% 낮춘다 등은 여기에 써먹을 수 없다는 단점이.

CPSARST라는 흥미로운 서열유사성 검색방법도 소개됐다.

DSC03575

위처럼 도메인의 조합이 다르게 구성되어 단백질이 만들어질 경우, 일반 BLAST서열정렬방법은 두 단백질이 유사하다고 알려줄 수 없다. 실제로 Lectin과 Arcelin 단백질은 서로 구조가 거의 비슷하지만, 서열유사성은 다르다. CPSARST라는 방법을 사용하면 이 두개가 유사하다는 것을 알 수 있다고. "서열이 유사하면 기능이 유사하다" 간단하게 묘사한 생물학의 가설을 곧이곧대로 프로그래밍하면 안된다는 또하나의 교훈을 던져주었다.   

nsSNP이 발견되는 단백질은 주로 어떤 기능을 수행하는 것일까? 이것은 다르게 표현하면 나와 너의 차이를 만드는 그 생물학적 기능은 무엇일까와 같다. 아래 슬라이드에서 얘기해주고 있다.

DSC03591

주로 신호전달, 감각, 면역기능과 관련이 높은 것으로 나타났다. 빈도가 가장 높았던 GO term 두개는 'Response to stimulus', 'Sensory perception of smell' 였다. 외부자극에 어떻게 반응하는가는 생사에 영향을 주지 않은 채 각각의 변이로 살아갈 수 있었던거지. 그것이 결국은 개개인의 개성의 차이를 만들게 하지 않았는가라는 어쩌면 당연하면서도 흥미로운 결과를 상상하게 한다.

eIMBL Intenational Workshop

이날의 마지막세션 흥미로운 발표를 해주신 마크로젠 서정선대표님. 그리고, 세션체어를 맞은 박종화박사님.

NGS, 23andMe, 삼성의 합류... 이제 점점 개인유전체의 시대가 눈앞으로 다가오고 있다. 윤리다 뭐다 말도 많고 탈도 많은 분야이지만 이제는 거스를 수 없는 시대임은 분명하다. IT기술을 어떻게 접목할 것이고, 보안문제는 어떻게 할 것이며, 윤리 및 사회적영향은 또 어떨것이며 우리에게 어떤 가치를 전해줄 것인지. 그리고 이 거대한 흐름에 누가 앞서 나갈 것인지 자뭇 기대가 된다.
Trackback Address :: http://yong27.biohackers.net/trackback/351
  • BlogIcon gwlee | 2009/04/14 18:42 | PERMALINK | EDIT/DEL | REPLY

    ㅎㅎ 진짜오랜만에..
    BioBlogRSS에 글이 올라와 있길래
    들어와봤습니다요~ ^^

    학교에 있었으면 들었었을텐데.. ㅠㅠ

    이번학기.. 형용형님과 연구에 대해 많은것을 나눌수 있는
    좋은 기회였을텐데.. 아쉽습니다..

    모.... 학교에 있건업건 이렇게 블로그라는
    멋진 통신수단이 존재하니.. ^^
    (비록 서로 회사에 얽혀있긴하지만요.. ㅋ)

    종종 놀러오겠습니다~ ^^

    • BlogIcon yong27 | 2009/04/15 17:44 | PERMALINK | EDIT/DEL

      나도 학교가면 길원씨 볼 수 있을줄 알았는데 없어서 아쉽더라고요. 그래도, 이런저런 모임 및 온라인에서 자주 보고 이야기 나눕시다!

Name
Password
Homepage
Secret