[번역] 『Evolution』 Ch. 2. 생명의 나무: 분류와 계통 - (1)
[번역] 『Evolution』 Ch. 2. 생명의 나무: 분류와 계통 - (2)
[번역] 『Evolution』 Ch. 2. 생명의 나무: 분류와 계통 - (3)
[번역] 『Evolution』 Ch. 2. 생명의 나무: 분류와 계통 - (5)


2.3 분자시계


진화가 오로지 분기로만 일어났고 [즉, 불계적 상동이 없고], 모든 혈통이 일정한 같은 속도로 진화했다면, 두 종 사이에서 나타나는 차이의 개수는 공통조상에서 분기한 이후 지난 시간을 가늠할 수 있는 직접적인 지표가 될 수 있다 [그림 2.12]. 이때 우리는 [그림 2.4A처럼] 단순히 분류군 쌍 사이의 차이 정도에 따라 계통, 즉 분지의 상대적 순서를 결정할 수 있다.



그림 2.12 (A) 분기가 거의 일정한 속도로 일어난다면 혈통 분기의 상대적 시간은 분류군 사이의 [유사성 또는] 전체적 차이로 결정할 수 있고, 따라서 분류군의 계통을 추정할 수 있다. (B) 진화가 거의 일정한 속도로 일어나 분류군 사이의 차이를 추정할 수 있는 가설계통. 가는 눈금선은 새로운 형질상태의 진화를 나타낸다.



초기 분자계통학 연구에 따르면 DNA 서열은 진실로 일정한 속도로 진화하며 분기한다고 생각했다. [이것은 형태적 특징에서는 분명히 사실이 아니다.] 이 개념은 분자시계(molecular clock, 分子時計)라고 불렸다 [Zuckerkandl and Pauling 1965]. 정확한 분자진화시계(molecular evolutionary clock, 分子進化時計)가 존재하므로 계통을 추정하는 방법이 간단해질 수 있다. 또한, 분자시계가 얼마나 빨리 “똑딱거리는지” 결정할 수만 있다면 서로 다른 분류군이 분기한 이후 지난 절대시간도 추정할 수 있다. [우리가 지금까지 고려했던 계통수는 분지가 일어난 절대시간이 아니라 단지 분류군의 분지 순서와 그 상대적 시기만을 묘사할 뿐임을 명심하라.]


분자진화속도를 추정하기 위하여 우리는 각각의 변화가 어디에서 발생했는지를 [그림 2.4그림 2.7에서처럼] 우리가 추정한 계통에 도표로 파시모니하게 작성함으로써 공통조상에서 기원한 쌍을 이루는 종 사이에서 누적된 차이의 개수를 [예를 들어, 염기쌍 돌연변이로 누적된 차이를] 계산한다. 예를 들어, 그림 2.9B에서 사람속과 판속의 공통조상 사이에서는 [6374번 위치와 같은] 76개의 변화가 나타나고, 그 공통조상과 고릴라속 분지 사이에서는 [5365번 위치와 같은] 14개의 변화가 나타나며, 퐁고속 분지와의 사이에서는 [8230번 위치와 같은] 70개의 변화가 나타난다. 따라서 이들 사람상과의 구성원이 [붉은털원숭이인 마카카속으로 대표되는 긴꼬리원숭잇과에 속하는] 구대륙원숭이로 이어지는 혈통에서 분기한 이후, 사람속으로 이어지는 혈통에서 76+14+70+150=310개의 염기쌍 변화가 있었다.


만일 분기가 일어난 절대시간을 추정할 수 있다면 어떤 혈통에서 발생한 염기쌍 치환의 평균속도도 추정할 수 있다. 예를 들어, 긴꼬리원숭이류의 가장 오래된 화석은 2천5백만 년(25 My) 전으로 거슬러 올라가는데, 이를 통해서 붉은털원숭이와 사람상과 구성원 사이에서 분기가 일어난 후 흐른 시간을 최소한 추정할 수 있다. * 붉은털원숭이 혈통에서 백만 년 당 각 염기쌍이 치환된 개수는 457/10,000개의 분석된 염기쌍/25 My=1.83 x 10-3개/My 또는 연간 1.83 x 10-9개다. 그리고 공통조상에서 사람속까지 진화하는 과정에서 나타난 평균속도는 310/10,000/25=1.24 x 10-3개/My였다. 따라서 각각의 혈통에서 치환이 발생한 평균속도는 r = (457+310)/383.5/10,000/25 My 또는 1.534 x 10-3개/My다.


* My는 Mega year, 즉 백만 년의 약자다.


이런 식으로 어떤 분류군이 분기한 절대시간에 대한 화석기록에서 얻은 정보는 분자시계를 보정하는 데 [즉, 그 속도를 보정하는 데] 사용할 수 있으며, 좋은 화석기록을 남기지 않은 다른 분류군의 분기 시간을 추정하는데도 사용할 수 있다. 예를 들어, 두 영장류 종의 ψη-글로빈 위유전자 서열 사이에서 차이가 나는 염기쌍 비율이 0.0256이라고 가정하자. 분자시계를 다음과 같은 식으로 표현한다고 가정하자.


D = 2rt


이 식에서 D는 두 서열 사이에서 차이가 나는 염기쌍의 비율이고, r은 My 당 단위 염기쌍이 분기하는 속도며, t는 종의 공통조상 이후로 경과한 [My 단위의] 시간이며, 상수 2는 분기한 두 혈통을 나타낸다. 그림 2.9에서 추정했듯이 D=0.0256이고 r=0.001534라면 t=D/2r=8.3이므로, 두 종이 공통조상에서 분기한 시기는 8.3 My 전이라고 추정할 수 있다.



그림 2.13 분자진화속도가 대략 일정함을 보여주는 염기쌍 치환 대 분기 이후 경과한 시간. 각 점은 화석증거를 토대로 했을 때 x축 위에 표시된 시기에 가장 최근 공통조상이 출현한 현생 포유류 종의 쌍을 나타낸다. y축은 7가지 단백질의 아미노산 서열에 나타난 두 종 사이의 차이로 추론한 염기쌍 치환의 개수를 나타낸다. 네 개의 초록색 원은 영장류 종의 쌍을 대표한다. [After Langley and Fitch 1974.]



찰스 랭글리(Charles Langley)와 월터 핏치(Walter Fitch)는 분자시계 가설을 검증하는 데 화석에서 얻은 자료를 처음으로 사용했다 [Langley and Fitch 1974]. 7가지 단백질의 아미노산 서열(amino acid sequence)로 이들은 그들은 짝 지은 포유류 종 사이의 서로 다른 뉴클레오타이드 서열 개수를 추정했다. [8장에서 이것을 어떻게 하는지 배울 것이다]. 랭글리와 핏치는 분자 수준에서 차이가 나는 개수와 분기 이후 경과한 시간 사이에 강하지만 부정확한 상관관계를 발견했다 [그림 2.13]. 그들의 “시계”는 정교하지는 않지만 대략적인 계통을 추정하는 데 사용할 수 있었다.


그러나 서열분기속도가 이 예만큼 거의 항상 일정하지는 않다 [Mindell and Thacker 1996; Smith and Peterson 2002]. 화석기록에서 얻은 분지 시간에 대한 정보 없이도 서열의 진화가 분자시계를 따르는지 알아낼 수 있는 몇 가지 방법이 있다. 그 가운데 하나가 상대속도 검증(relative rate test, 相對速度檢證)이다 [Wilson et al. 1977]. 우리는 어떤 공통조상으로부터 [즉, 계통수의 어떤 분지점(分枝點)으로부터] 그 조상에서 파생한 현생종 각각에 이르는 데 경과한 시간이 정확히 같다는 것을 알고 있다. 그러므로 혈통이 일정 속도로 분기했다면, 하나의 후손 종에서 공통조상을 거쳐 다른 종에 이르는 계통수의 모든 경로를 따라 존재하는 [때때로 유전적 거리(genetic distance, 遺傳的距離)라 불리는] 변화의 개수는 대략 같아야 한다 [그림 2.14]. 사람상과 구성원의 예에서 [그림 2.9B 참조] 붉은털원숭이와 다양한 사람상과 구성원 사이에 나타나는 차이의 개수는 [오랑우탄에 대해서는] 806개부터 [사람에 대해서는] 767개까지 범위 안에 들어간다. 사람 혈통이 다소 느린 것처럼 보이더라도, 서로 비슷한 이 숫자는 이들이 상당히 일정한 속도로 분기 분기했음을 가리킨다.



그림 2.14 분자분기(molecular divergence, 分子分岐)의 속도가 일정함을 보여주는 상대속도 검증. 서열은 현생종 A와 B 및 외군인 종 E에서 얻었다. Y와 X는 조상 종을 나타낸다. 이탤릭체 소문자는 각각의 분지를 따라 발생하는 차이의 개수를 [예를 들어, 뉴클레오타이드의 변화 개수를] 나타낸다. A와 E 사이의 유전적 거리는 DAE=a+c+d이고, B와 E 사이의 유전적 거리는 DBE=b+c+d이다. 만일 염기쌍 치환 속도가 일정하다면, a=b이므로 DAE=DBE이다. 일정한 속도가 계통을 통틀어 유지된다면, 종 X를 공통조상으로 가진 짝지어진 종 사이의 유전적 거리는 어떤 종의 다른 쌍과도 같을 것이다.



다양한 생명체에서 얻은 DNA 서열 자료에 적용된 상대속도 검증은 서열의 진화속도가 상당히 가깝게 연관된 분류군 사이에서 종종 매우 비슷함을 보여준다. 그러나 멀리 연관된 분류군은 때때로 다소 다른 진화속도를 나타냈다 [Li 1997]. 예를 들어, 설치류의 서열 진화속도는 영장류보다 두세 배 빠르다.


분류군 사이의 계통관계를 추정하기 위해 분자시계를 가정할 필요는 없으므로, 분자시계가 계통분석에 사용되는 일은 거의 없다. 하지만 분자시계는 때때로 대략적인 분기 시기를 추정하는데 유용하므로 우리는 이 책 후반부에서 분자시계를 이용한 많은 사례를 접할 수 있다.


2.4 유전자 계통수


지금까지 우리는 종의 계통수를 추론하는 데 관심을 뒀다. 같은 원리를 이용하면 우리는 단상형(haplotype, 單相型) 유전자의 다양한 DNA 서열 사이의 역사적 관계를 추론할 수 있다. 때때로 유전자 계통수(gene tree, 遺傳子系統樹) 또는 유전자 계보(gene genealogy, 遺傳子系譜)라 불리는 유전자의 계통은 어떤 단일 종이나 한 종 이상에서 기원한 서로 다른 단상형을 포함한다.


[단상형인] 하나의 DNA 서열에서 다른 형태가 돌연변이 때문에 출현한다 [8장 참조]. 가장 간단한 종류의 돌연변이는 어떤 단일 위치에서 하나의 뉴클레오타이드 염기쌍이 다른 것으로 대체되는 것이다. 이런 식으로 진화하는 일련의 가설적 단상형을 고려해보자. 이를 설명하기 위해 아래와 같이 일련의 염기쌍 돌연변이로 발생한 7가지 단상형을 가정하자.


여기에서 단상형 3은 단상형 2의 7번 위치가 C에서 T로 치환해 발생했다. [그 역도 가능하다]. 새로운 단상형 3은 개체군 내 서로 다른 개체가 보유하는 유전자의 많은 복사본 가운데 오직 하나의 변화만으로 출현했으므로, 조상인 단상형 2는 적어도 당분간은 계속 존재한다.


이제 생명체 표본에서 7가지 단상형 모두를 찾는다고 상상해보자. 근소한 차이가 있는 서열이 가장 가까운 조상-후손 관계를 나타낸다고 가정함으로써 우리는 이들 생명체를 근절 유전자 계통수(unrooted gene tree, 根絶遺傳子系統樹)에 정확히 배열할 수 있다. 즉, 계통적으로 가장 밀접히 연관된 단상형은 가장 적은 가능한 돌연변이 개수에 따라 서로 연결된다. 단상형 1을 다른 단상형에 연결하기 위해서는 아주 많은 돌연변이가 필요하므로 단상형 1은 단상형 2와 4 사이에 있어야 한다. 이런 식으로 우리는 가장 파시모니한 [전혀 나무처럼 보이지 않는] 근절 유전자 계통수를 찾을 수 있다.



이 계통수는 뿌리가 없는데, 이것은 진화의 방향이 어떤지를 [즉, 어느 서열이 그들 모두의 공통조상과 가장 가까운지를] 알 수 없음을 뜻한다. 더욱이, 표본에서 단지 단상형 2에서 7만을 발견한다고 가정하자. 단상형 1은 [9번과 13번 위치에서 발생한] 두 개의 돌연변이로 서로 달라진 단상형 2와 4를 연결하는 데 필요한 단계이므로, 우리는 단상형 1이 현재 존재하거나 과거에 존재했다고 추론할 수 있다. 같은 개별 유전자에서 돌연변이 두 개가 발생할 가능성은 별로 없으므로 단상형 4가 단상형 2에서 직접 발생했을 개연성은 별로 없다 [그 역도 마찬가지다]. 그러므로 단상형 1은 가설적 중간자(hypothetical intermediate, 假設的中間者) 또는 가설조상(hypothetical ancestor, 假設祖上)이라고 가정할 수 있다.


어떻게 진화의 방향을 추론할 수 있을까? 단상형 4, 5, 6, 7이 종 A에서 발견되고 단상형 2와 3이 가깝게 연관된 종 B에서 발견된다고 가정하자. 단상형 4~7이 근연종인 것처럼 단상형 2와 3이 근연종임을 우리는 근절 계통수를 통해 이미 알고 있다. [역자: 여기서 사용한 근연종은 유전자 사이의 관계를 은유적으로 표현한 용어일 뿐이다]. 가장 파시모니한 추론은 두 종의 공통조상이 그 두 종의 단상형 두 무리가 출현한 [단상형 1과 같은] 어떤 단상형을 가진다는 것이다. 이러한 조상의 순서를 밝힘으로써 우리는 아래와 같이 계통수의 뿌리를 결정할 수 있다.



단상형 1을 조상 단상형으로 가정했으므로 단상형의 진화 순서는 종 A에서 4→5→6→7이며 종 B에서는 2→3이라고 결론지을 수 있다. 만일 우리가 어느 한 종에서 [또는 둘 다에서] 단상형 1을 찾을 수 있다면 마찬가지 결론을 얻을 수 있다.






Posted by metas :