Вы находитесь на странице: 1из 5

Secuencias de DNA (mtDNA) mitocondrial humanas revelan una abundancia de sitios polimrficos en la que las frecuencias de las bases

segregantes son muy diferentes. Un polimorfismo tpico consiste en una base de baja frecuencia y la otra base de alta frecuencia. En contraste, los conjuntos de datos de genes nucleares tienden a mostrar un exceso de polimorfismos en que ambas bases segregantes estn en frecuencias intermedias. Una nueva prueba estadstica de esta diferencia encuentra diferencias significativas entre el mtDNA y conjuntos de datos de genes nucleares divulgados en la literatura. Sin embargo, diferencias en los patrones de polimorfismo podran ser causadas por orgenes de muestra diferentes para los diferentes conjuntos de datos. Para examinar ms de cerca la diferencia del mtDNA-nuclear, se generaron las secuencias de ADN de una porcin del locus ligado al cromosoma X piruvato deshidrogenasa Ela subunidad (PDHAl) y de una porcin de la regin mitocondrial control I (CRI) de cada una de ocho personas, cuatro de frica subsahariana. Los dos genes revelaron una diferencia significativa en la distribucin de frecuencia de sitio de sitios polimrficos. PDHAl revel un exceso de polimorfismos de la frecuencia intermedia, mientras que CR1 demostr un exceso de sitios con el patrn de frecuencia de menor a mayor. La discrepancia sugiere que el mito-chondrial variacin ha sido formado por seleccin natural y no puede ser ideal para algunas preguntas sobre los orgenes humanos.

Una distribucin de frecuencias de polimorfismos de ADN puede usarse para hacer preguntas sobre la reciente seleccin natural y tamaos de poblacin cambiante (Tajima 1989a, 1989b; Rogers y Harpending 1992; Fu y Li 1993). Cuando un sitio es polimrfico, generalmente slo dos bases se observan en una muestra de las secuencias de una poblacin, y es posible que una base puede tener una baja frecuencia (y as la base de un de alta frecuencia) o ambas bases pueden tener frecuencias intermedias. En varias ocasiones, los estudios de secuencias mitocondriales humanos han revelado una abundancia relativa de los polimorfismos con el patrn de bajo y alto y una escasez de polimorfismos de frecuencia intermedia (Excoffier 1990; Merriwether et al., 199 1; Vigilant et al., 199 1; RUVOLO, Zehr y von Dornum 1993). Esta salida de expectativas neutrales es consistente con un modelo de una poblacin creciente recientemente (Tajima 1989 ~; Slatkin y Hudson 1991;

Rogers y Harpending, 1992) y ha sido considerada como evidencia de una expansin rpida y reciente poblacin humana, tal vez en los ltimos 200.000 aos (Stringer y Andrews 1988; Stoneking, 1994). Representante de grandes y pequeos estudios mitocondriales se muestran en la figura y b. Si el patrn de polimorfismo mitocondrial es principalmente debido a los patrones histricos de cambio de tamao de la poblacin, entonces se esperan patrones similares de polimorfismos nucleares. Sin embargo, si la seleccin natural en la mitocondria es la principal causa del patrn de polimorfismo del ADN mitocondrial, entonces otros genes no revelar el mismo patrn. Para comparar los genes mitocondriales y nucleares, era necesario evitar que esos estudios de genes nucleares que se centr en los polimorfismos que primero fueron descubiertos dentro de slo una pequea muestra (Long et al. 1990; Bowcock et al. 1991). Estos polimorfismos necesariamente tienden a aparecer en las frecuencias intermedias y son parciales con el fin de anlisis de frecuencia de sitio. Una bsqueda de literatura devueltos dos estudios grandes gene nuclear en el cual se midi variacin uniformemente para todos los individuos muestreados (fig. lc y d). Los estudios de genes nucleares tienen un exceso de los polimorfismos de la frecuencia intermedia mientras que los estudios mitocondriales tienen un exceso de polimorfismos con el patrn de bajo y alto. Estas diferencias podran deberse a las diferentes poblaciones muestreadas para los diferentes estudios. Existe una estructura de poblacin considerable en los patrones globales de las variaciones genticas humanas (CavalliSforza, Menozzi y Piazza 1993). En particular, las poblaciones africanas son ms variables y parecen poseer algunas de las variaciones ms antiguas (Merriwether et al. 1991; Vigilante et al. 199 1). Cerca de dos tercios de las secuencias muestreadas para la figura y b tuvo orgenes africanos. En contraste, cada uno de los estudios de genes nucleares en figura lc y d incluyeron una poblacin no africanos. Para abordar las diferencias entre la mitocondria y genes nucleares sean debido a diferentes orgenes simples, una pequea muestra de las personas africanas y no africanas fueron estudiados en una porcin del genoma nuclear y una porcin del genoma mitocondrial.

HIGO. l. la distribucin de frecuencia de sitios polimrficos. Para cada conjunto de datos, es el nmero de secuencias; L es la longitud de la secuencia de ADN; y s es el nmero de posiciones pares polimrfica, no incluyendo las inserciones y eliminaciones. Para la comparacin entre conjuntos de datos, rr y 8 se han dividido por L para dar estimaciones de la diversidad por par de bases. Casi todos los polimorfismos involucran slo dos de las cuatro bases nucletidas. Para evitar la redundancia, se muestra solamente la frecuencia de la base menos comunes. Por lo tanto, un polimorfismo con una secuencia que difiere de los restante n - 1 secuencias se cuenta en clase de frecuencia 1. Para los pocos polimorfismos 3 - y 4-base, las frecuencias de las dos o tres bases menos comn, respectivamente, estn tambin incluidas en S. Para los grandes conjuntos de datos, frecuencia las clases son en grupos de cinco. Barras blancas son las frecuencias observadas y bar total altura sumas a barras negras S. son los niveles esperados bajo tamao de la poblacin constante (Tajima 1989b). Barras eclosionados son esperados los niveles encontrados por simulaciones para una poblacin creciente recientemente (ver materiales y mtodos y resultados)., gen mitocondrial citocromo oxidasa subunidad II (Ruvolo, Zehr y von Dornum 1993). b, mitocondrial control regin I y II datos (Vigilant et al., 1991). c, B-globi n d. t un recogido de las islas Vanuatu (Fullerton et al., 1994) d,Datos de elastina de una poblacin caucsica britnico (Raybould Bierley y Hulten 1995). L no se da para la elastina, lo que es datos del sitio de la restriccin y 1 ~ y 6 no se han estandarizado en este caso. Original These differences could be due to the different populations sampled for the different studies.

A distribution of DNA polymorphism frequencies can be used to ask questions about recent natural selection and changing population sizes (Tajima 1989a, 1989b; Rogers and Harpending 1992; Fu and Li 1993). When a site is polymorphic, usually just two

bases are observed in a sample of sequences from a population, and it is possible that one base may have a low frequency (and thus the other base a high frequency) or both bases may have intermediate frequencies. Repeatedly, studies of human mitochondrial sequences have revealed a relative abundance of polymorphisms with the low-high pattern, and a paucity of intermediate-frequency polymorphisms (Excoffier 1990; Merriwether et al. 199 1; Vigilant et al. 199 1; Ruvolo, Zehr, and von Dornum 1993). This departure from neutral expectations is consistent with a model of a recently growing population (Tajima 1989~; Slatkin and Hudson 1991; Rogers and Harpending 1992) and has been regarded as evidence of a recent and rapid human population expansion, perhaps within the past 200,000 years (Stringer and Andrews 1988; Stoneking 1994). Representative large and small mitochondrial studies are shown in figure la and b. If the mitochondrial polymorphism pattern is primarily due to historical patterns of population size change, then similar patterns are expected of nuclear polymorphisms. However, if natural selection on mitocondria is the primary cause of the mtDNA polymorphism pattern, then other genes may not reveal the same pattern. To compare mitochondrial and nuclear genes, it was necessary to avoid those nuclear gene studies that focused on polymorphisms that were first discovered within just a small sample (Long et al. 1990; Bowcock et al. 1991). These polymorphisms necessarily tend to appear at intermediate frequencies and are biased for the purpose of site frequency analysis. A literature search returned two large nuclear gene studies in which variation was measured uniformly for all sampled individuals (fig. lc and d). The nuclear gene studies have an excess of intermediate frequency polymorphisms while the mitochondrial studies have an excess of polymorphisms with the low-high pattern. These differences could be due to the different populations sampled for the different studies. There exists considerable population structure in global patterns of human genetic variation (Cavalli-Sforza, Menozzi, and Piazza 1993). In particular, populations from Africa are the most variable and seem to possess some of the oldest variation (Merriwether et al. 1991; Vigilant et al. 199 1). About two thirds of the sampled sequences for figure la and b had African origins. In contrast, each of the nuclear gene studies in figure lc and d included just one non-African population.

To address whether the differences between mitocondria and nuclear genes are due to different simple origins, a small sample of African and non-African individuals were studied at a portion of the nuclear genome and a portion of the mitochondrial genome.

FIG. l.-The frequency distribution of polymorphic sites. For each data set, it is the number of sequences; L is the length of the DNA sequence; and s is the number of polymorphic base pair positions, not including insertions and deletions. For comparison across data sets, rr and 8 have been divided by L to give estimates of diversity per base pair. Nearly all polymorphisms involve just two of the four nucleotide bases. To avoid redundancy, only the frequency of the less common base is shown. Thus, a polymorphism with one sequence that differs from the remaining n - 1 sequences is counted in frequency class 1. For the few three- and four-base polymorphisms, the frequencies of the two or three least common bases, respectively, are also included in S. For the large data sets, frequency classes are in groups of five. White bars are the observed frequencies, and total bar height sums to S. Black bars are expected levels under constant population size (Tajima 1989b). Hatched bars are expected levels found by simulations for a recently growing population (see Materials and Methods and Results). a, Mitochondrial cytochrome oxidase subunit II gene (Ruvolo, Zehr, and von Dornum 1993). b, Mitochondrial control region I and II data (Vigilant et al. 1991). c, B-globi n d a t a collected from the Vanuatu islands (Fullerton et al. 1994). d, Elastin data from a British Caucasian population (Raybould, Bierley, and Hulten 1995). L is not given for Elastin, which is restriction site data, and 1~ and 6 have not been standardized in this case.

Вам также может понравиться