Вы находитесь на странице: 1из 12

Capı́tulo 15

Estructura y organización del DNA


Davide Bau

15.0.1. Niveles de organización del DNA en la cromatina

El DNA es un biopolı́mero natural cuya función es, a través de segmentos de DNA llamados genes,
la de transportar la información genética usada en el desarrollo y el funcionamiento de casi todos
los organismos vivos conocidos. El DNA está formado por cadenas de nucleótidos, que son unidades
compuestas por una base nitrogenada, un azúcar de cinco carbonos llamado desoxirribosa y un grupo
fosfato (a través del cual están unidos el uno al otro) (ver Sección 7.3 y Figura 14.2). Las cuatro bases
que se encuentran en el DNA son adenina (abreviado A), citosina (C), guanina (G) y timina (T). Una
molécula de DNA consiste de dos hebras de secuencias de nucleótidos que interactúan entre ellas. En
cadenas opuestas, la adenina empareja con la timina a través de 2 puentes de hidrógeno, mientras que
la guanina empareja con la citosina a través de 3 puentes de hidrógeno, formando la tı́pica estructura de
doble hélice. Las dos hebras que forman la estructura de doble hélice se orientan en direcciones opuestas
entre sı́ y son por lo tanto en una orientación anti-paralela. Los enlaces de hidrógeno y apilamiento de
bases (las interacciones entre las bases nitrogenadas aromáticas) son las fuerzas que más estabilizan la
estructura de doble hélice del DNA [23].
Dentro de las células el DNA está organizado en estructuras llamadas cromosomas. Dentro de los cro-
mosomas, el DNA se compacta enrollándose en complejos de ocho proteı́nas llamadas histonas para
formar nucleosomas (Figura 15.1), las unidades básicas de empaquetamiento del DNA en eucariotas.
La partı́cula central del nucleosoma se compone de aproximadamente 147 pares de bases de DNA
enrolladas en torno a un octámero de histonas que consta de 2 copias de cada una de las proteı́nas
del núcleo de las histonas H2A, H2B, H3 y H4 [16]. Las partı́culas centrales de un nucleosoma están
conectadas por tramos de “DNA enlazante”, que puede extenderse hasta aproximadamente 80 pares
de bases. Secuencias repetidas de nucleosomas compactan la cromatina para formar la fibra de 10 nm,
que se denomina “collar de perlas” (Figura 15.1) [12]. Este tipo de disposición puede plegarse pos-
teriormente para formar una fibra de 30 nm (Figura 15.1), una estructura aún más compacta que la
fibra de 10 nm. Estudios de microscopı́a electrónica han demostrado que este tipo de estructura es
muy dinámica y puede desplegarse para volver al estado de 10 nm. Los nucleosomas se pliegan a través
de una serie sucesiva de estructuras de orden superior para formar los cromosomas. Los cromosomas
no están distribuidos al azar dentro del núcleo de la célula sino que, al menos en eucariotas superio-
res, ocupan lugares especı́ficos denominados “territorios cromosómicos”. Los territorios cromosómicos
tienen forma irregular y están organizados en pequeños subdominios, partes del núcleo ocupado por

387
cromosomas diferentes. En general, los cromosomas ricos en genes están situados cerca del centro del
núcleo, mientras que los cromosomas con pocos genes están situados cerca de la periferia del núcleo,
a menudo tocando la membrana nuclear [5]. Por otra parte, los territorios cromosómicos no son com-
partimentos herméticamente cerrados, sino que permiten que cromosomas diferentes, en la periferia de
sus territorios interaccionen, por ejemplo, acercando distintos genes con un mismo promotor.
La disposición tridimensional de la cromatina es responsable de guiar las interacciones entre los genes y
sus correspondientes elementos reguladores. Por lo tanto, juega un papel crucial en la determinación y
en el control de las partes del DNA que están siendo transcritas. La estructura de la cromatina depende
de varios factores, como la fase del ciclo celular (durante la interfase la cromatina es menos compacta
para permitir la transcripción y la replicación del DNA) y si los genes están en un estado activo
(trascripción) o pasivo. Los genes que están siendo transcritos, de hecho, están menos empaquetados y
se encuentran junto a la RNA polimerasa. La cromatina en este estado se conoce como eucromatina.
Los genes inactivos se asocian con proteı́nas estructurales y están más empaquetados, la cromatina
en este estado se conoce como heterocromatina [6]. Modificaciones de las histonas como metilación y
acetilación son también responsables de los cambios en la estructura local de la cromatina. Finalmente,
durante la anafase, la cromatina está todavı́a más empaquetada para facilitar la segregación de los
cromosomas.

Figura 15.1: Niveles de organización del DNA. El DNA se compacta enrollándose en complejos de ocho
proteı́nas llamadas histonas para formar nucleosomas. Secuencias repetidas de nucleosomas forman 10
nm (“collar de perlas”), la cual puede plegarse ulteriormente para formar la fibra de 30 nm (imagen
adaptada de Wikipedia).

15.0.2. Determinación de la estructura de dominios genómicos

La arquitectura en tres dimensiones (3D) de un genoma entero o de parte del mismo (un dominio
genómico), es responsable de promover los contactos entre los genes y sus elementos reguladores, lo que
les permite llevar a cabo su función [21]. El conocimiento de la organización espacial de los dominios
genómicos es por tanto esencial para comprender cómo se regulan los genes en las células vivas.
El advenimiento de nuevas tecnologı́as de secuenciación ha permitido obtener una gran cantidad de
datos sobre la secuencias genómica de diferente especies. Proyectos como 1000 Genomes [1] o ENCODE
[4] has permitido obtener un listado de variaciones genéticas (diferencias en las secuencias de DNA
entre una población o entre especies), elementos funcionales y reguladores que controlan las células y
la actividad de los genes.
Sin embargo, esta información por sı́ sola, es decir, la localización de genes y elementos funcionales a lo
largo de la secuencia del genoma, no permite conocer la posición espacial relativa de los genes respecto
de sus elementos reguladores, información esencial para saber cómo se regulan [21]. Para llevar a cabo
la transcripción (Figura 7.1), un gen debe encontrarse próximo a moléculas especı́ficas que la regulan,
como las RNA-polimerasas, un conjunto de proteı́nas con carácter enzimático.

Se puede disponer, si bien parcialmente, de esta información a través de técnicas de espectroscopı́a,


que permiten determinar la posición espacial de los genes y elementos reguladores a baja resolución.
Recientemente, se han desarrollado nuevos métodos bioquı́micos de medición de la frecuencia de las
interacciones entre pares de loci situados en el mismo o en diferentes cromosomas. Estos métodos,
conocidos como métodos 3C [7, 10, 15, 20, 24], permiten superar la baja resolución de las técnicas de
espectroscopia. Los métodos basados en 3C “capturan” los loci que están “interactuando” (o sea, que
están cerca) utilizando un método de cross-link con formaldehı́do [10]. En la práctica, estas técnicas
analı́ticas capturan los loci que están cerca formando un enlace quı́mico entre ellos (a través del for-
maldehı́do); el resultado es un “calco” de la estructura de la cromatina en forma de frecuencias de
interacciones entre loci cercanos.

La combinación de estos métodos bioquı́micos con técnicas de secuenciación de última generación ha


permitido mapear en alta resolución las interacciones entre loci de dominios genómicos y de genomas
enteros. En particular, los métodos 5C y Hi-C son métodos basados en 3C que permiten la determina-
ción simultánea de las frecuencias de interacción de cromosomas enteros (5C) o de genomas completos
(Hi-C) [8, 9]. En la Figura 15.2 se puede ver un ejemplo de matriz 5C. El método Hi-C permite abarcar
regiones más grandes que el método 5C, pero a menor resolución. Al integrar estos tipos de datos con
métodos computacionales (por ejemplo usando simulaciones de Monte Carlo [1]), como la Integrative
Modeling Platform (IMP) [19], es posible determinar la estructura 3D de un dominio genómico a una
resolución sin precedentes. Este método es similar a la determinación de la estructura de proteı́nas
mediante espectroscopia NMR, donde, en lugar de las matrices 5C (o Hi-C), se utilizan espectros de
NMR.

Primeros modelos de dominios genómicos

Los primeros modelos de baja resolución en 3D de la cromatina se generaron utilizando métodos de fı́sica
de polı́meros [7, 17] y de dinámica molecular [22]. Estos métodos han permitido obtener información
sobre las caracterı́sticas fı́sicas de la cromatina, como su compactación, densidad y flexibilidad.

Recientemente, el desarrollo de nuevos métodos que integran datos experimentales con métodos compu-
tacionales (principalmente explotando métodos de optimización) ha permitido llegar a una resolución
más alta de la estructura 3D de los dominios genómicos [3, 11, 13, 14]. Ejemplos de estas metodologı́as
incluyen la determinación de la arquitectura de baja resolución del locus de la inmunoglobulina de ca-
dena pesada (IGH) mediante la integración de datos de espectroscopia FISH [14], la determinación del
modelo 3D del genoma de levadura usando datos de interacción de cromatina en todo su genoma [11]
y la determinación de la arquitectura del dominio de la α-globina humana [3] mediante la integración
de un amplio conjunto de datos 5C en IMP.

En la siguiente sección explicaremos como determinar la estructura 3D de cromatina utilizando IMP. La


ventaja de utilizar este sistema sobre otros es su flexibilidad, IMP permite integrar datos proveniente de
diferentes técnicas experimentales (lo cual, en principio, permite aumentar la resolución de los modelos
generados) y representar cualquier “objeto” (una macromolécula en este caso) a diferente escalas.
Figura 15.2: Ejemplo de una matriz 5C. La matriz muestra el logaritmo de las interacciones, donde
0 (blanco) corresponde a baja frecuencia de interacción, y 12 (negro) corresponde a alta frecuencia de
interacción.

15.0.3. Determinación de estructura con IMP

El software Integrative Modeling Platform 1 (IMP) traduce los datos experimentales en objetos 3D y
en restricciones espaciales entre ellos. Una proteı́na, por ejemplo, puede ser representada a diferentes
escalas: empleando una esfera por cada aminoácido (lo que resultarı́a en modelos de baja resolución)
o por cada átomo (lo que resultarı́a en modelos de alta resolución). Hay varios tipos de restricciones
que pueden ser añadidas al modelo, como distancias entre las esferas (aminoácido/átomos) o volumen
total ocupado por el modelo generado.

Una vez que los datos experimentales hayan sido representados como objetos y restricciones, IMP busca
un conjunto de coordenadas de esos objetos (o sea su estructura tridimensional) que mejor se adapta
a las restricciones impuestas, derivadas de los datos experimentales mismos.

En todos los métodos de determinación y predicción de estructura se genera un gran conjunto de


modelos 3D compatibles con los datos experimentales. Dado que los datos experimentales de tipo 3C
son en general un promedio medido sobre una población de células, la generación de un gran conjunto
de soluciones permite representar las diferentes conformaciones capturadas por los experimentos.

IMP proporciona un conjunto de herramientas para que los desarrolladores de métodos computacio-
nales puedan convertir datos experimentales en restricciones espaciales, para implementar técnicas de
optimización y análisis, y para poder construir modelos por integración de datos provenientes de di-
ferente experimentos. En principio, con IMP es posible modelar cualquier objeto en tres dimensiones
(por ejemplo una biomolécula), siempre que el objeto pueda ser representado adecuadamente en el
marco de IMP (ver siguiente apartado) y que los datos experimentales disponibles sobre la estructura
1
Integrative Modeling Platform. https://integrativemodeling.org
que se está estudiando (el objeto) puedan traducirse en restricciones espaciales entre las partı́culas que
la representan.

Colección de datos

El primer paso en la determinación de la estructura por IMP, como en cualquier método de modelado
por integración de datos, es la colección de datos experimentales. Actualmente, sólo los datos 5C y
Hi-C se han integrado en IMP para determinar la estructura de dominios genómicos. Por tanto, vamos
a entrar en detalle en la determinación de la estructura por IMP considerando este tipo de datos
como punto de partida. Sin embargo, conviene recordar que, en principio, IMP permite la integración
de datos de múltiples tipos; IMP, por ejemplo, ha sido usado por la determinación de la estructura
del complejo del poro nuclear (NPC), un complejo de 456 proteı́nas, integrando datos de microscopı́a,
ultracentrifugación y cromatografı́a de afinidad, entre otros [2]. La ventaja de utilizar datos de diferentes
experimentos es la posibilidad de obtener modelos de mayor resolución en comparación con los métodos
de técnicas experimentales individuales (datos diferentes pueden aportar información complementaria
sobre la estructura de una molécula, permitiendo revelar mas detalles que en el caso de métodos de
técnicas experimentales individuales).
Los datos experimentales de tipo 3C representan la frecuencia de interacción entre fragmentos de
restricción (los trozos de DNA resultante de la digestión enzimática), y pueden ser considerados como
un indicador de la proximidad espacial de los fragmentos relacionados (es decir, de las partes de DNA
que están espacialmente cerca) [15, 18]. La asunción que se hace es que si la frecuencia de interacción
entre dos loci es muy alta, estos dos loci estarán, en media, cerca uno del otro. Hay que recordar que el
termino “interacción” se refiere a la formación de un cross-link (enlace quı́mico) mediante formaldehı́do
entre dos loci que están cerca (en la estructura 3D).
Para tener en cuenta las posibles sesgos/desviaciones en los datos experimentales, los datos son nor-
malizados (utilizando la función “log”) y transformados en Z-scores antes de ser introducido en IMP
(Sección 3.3.3).

La estrategia de IMP

El marco conceptual de IMP se compone de cuatro etapas: la representación (asignar una partı́cula a
cada fragmento de DNA), la puntuación (la magnitud usada para evaluar los modelos generados), la
optimización (la generación de los modelos) y el análisis. Ver esquema en Figura 15.3a.
La representación del sistema (es decir, el conjunto de objetos que representan la macromolécula
biológica bajo investigación) debe ser suficientemente detallada para caracterizar exhaustivamente los
datos experimentales sin hacer la parte computacional inviable como consecuencia de una descripción
del sistema demasiado detallada. Mientras una representación detallada de una molécula podrı́a dar
lugar a modelos de mayor resolución, una representación limitada permite una búsqueda más exhaustiva
del espacio conformacional, siendo computacionalmente menos exigente y por tanto más adecuada para
la representación de las macromoléculas biológicas, como la cromatina. IMP representa un objeto como
un conjunto jerárquico de partı́culas (cada partı́cula representa un fragmento de DNA) que puede ser
representado a diferente niveles de detalles, y sus propiedades (por ejemplo, su posición en el espacio).
Esto permite una representación flexible del sistema a diferentes resoluciones (en la Figura 15.3b, el
dominio de la α-globina humana representada en IMP, en diferentes estados de la optimización).
El paso clave en cualquier método de determinación de estructura es la correcta evaluación de los
modelos generados para identificar las soluciones que mejor representan los datos de entrada. Por
Figura 15.3: Protocolo de optimización de IMP. (a) Diagrama de flujo del protocolo de optimización
de IMP. (b) Representación esquemática de un proceso de optimización tı́pico para la simulación del
dominio génico de la α-globina humana en células K562. El modelo comienza con una configuración
aleatoria y termina con una configuración óptima después de la minimización de la función-objetivo de
IMP reduciendo contemporáneamente las violaciones a todas las restricciones impuestas. Los modelos
son muestra de cuatro instantáneas diferentes durante la optimización. Cada fragmento de restricción
se representa como una partı́cula de radio proporcional a su volumen excluido.

tanto, una relación cuantitativa entre la representación del sistema y el sistema biológico (por ejemplo,
los datos experimentales) debe ser formulada. En IMP esto se logra mediante la asignación a cada
modelo de una puntuación consistente en la suma de funciones individuales llamadas funciones de
densidad de probabilidad (PDFs) que afectan a todas las partı́culas en el sistema. Una PDF es una
función que describe la probabilidad de una variable (por ejemplo, las coordenadas de cada partı́cula
del modelo) de asumir un valor dado (por ejemplo, la distancia entre dos partı́culas derivadas de los
datos experimentales; un ejemplo es el RMSD – Ecuación 10.3). En IMP, la puntación es un número que
mide la calidad de un modelo durante (y al final de) la optimización; es una magnitud que se optimiza
durante el modelado. Al concluir el modelado, los modelos con mejor puntuación serán elegido para el
análisis final. La puntuación final de un modelo, o la función-objetivo de IMP, consistirá entonces en
la suma de cada PDF individual que afecta a todas las partı́culas del sistema (cuanto más baja es la
puntuación, mejor es el modelo).

Una vez que el sistema ha sido debidamente representado y las restricciones entre las partı́culas han
sido definidas, IMP busca una solución del sistema (es decir, genera un modelo 3D) reduciendo si-
multáneamente las violaciones a todas las restricciones impuestas; es decir, IMP genera modelos que
mejor representan los datos experimentales de entrada. El espacio conformacional es explorado en
términos de optimización de energı́a (puntuación) (por ejemplo, utilizando el método de Monte Carlo)
y mediante la generación de un gran número de modelos.

La posición espacial de cada partı́cula se determina considerando una serie de osciladores armónicos
(o muelles; son las PDF implementadas para este problema) aplicados entre pares de partı́culas, cuyo
propósito es mantener las partı́culas a una distancia de equilibrio derivada, para cada par de partı́culas,
de los datos experimentales. Para el modelado de cromatina se utilizan tres tipos de osciladores: (i) los
osciladores armónicos (Hi,j ), cuyo objetivo es mantener dos partı́culas a una distancia especifica, (ii)
los osciladores armónicos inferiores (lbHi,j ), que evitan que dos partı́culas no se acerquen más que una
distancia de equilibrio dada y, (iii) los osciladores armónicos superiores (ubHi,j ), que obligan a cada
par de partı́culas a estar a una distancia menor de una distancia determinada. Las funciones exactas
de estos tres osciladores armónicos son:

Hi,j = k(di,j − d0i,j )2

k(di,j − d0i,j )2 si di,j ≤ d0i,j



lbHi,j =
0 si di,j > d0i,j

k(di,j − d0i,j )2 si di,j ≥ d0i,j



ubHi,j =
0 si di,j < d0i,j

donde di,j es la distancia entre las partı́culas i y j durante la simulación, 0i,j es la distancia de equilibrio
entre las partı́culas i y j obtenida de los datos experimentales, y k es la constante de fuerza aplicada a
los osciladores armónicos, que escala la penalización por no satisfacer una restricción impuesta (es decir,
k penaliza las conformaciones en las cuales las partı́culas están a una distancia diferente de la distancia
obtenida de los datos experimentales). El tipo de restricción (Hi,j , lbHi,j o ubHi,j ) y la distancia de
equilibrio aplicada a cada partı́cula se definen en base a los datos experimentales y a tres parámetros
de IMP (un lı́mite inferior y uno superior de Z-score y una distancia máxima entre dos fragmentos).
Los valores óptimos para estos tres parámetros se determinan empı́ricamente [3].

Por último, el análisis estructural del conjunto resultante de soluciones compatibles con las restricciones
impuestas (es decir, con los datos experimentales de entrada) tiene como objetivo validar los modelos
y revelar sus aspectos importantes. No existiendo estructuras reales con la cual comparar los resultado
(como en el caso de las proteı́nas), es importante confrontar los modelos generado con datos biológicos
comprobados (por ejemplo, utilizando datos de espectroscopia FISH o introduciendo en los modelos
datos sobre las actividad de los genes) para ver si las estructura 3D generadas son compatibles con la
información disponible sobre la molécula estudiada. Este tipo de análisis, junto con la observación de
las caracterı́sticas fı́sicas de los modelos (por ejemplo densidad, grado de compactación, variabilidad de
la estructura), forman una parte esencial de la determinación de estructuras por integración de datos.
15.0.4. Ejemplo de determinación de estructura por IMP

IMP fue recientemente aplicado para la determinación de la arquitectura 3D del dominio génico de
la α-globina humana, una región de ∼500 Kb situada en el cromosoma humano 16 [3]. Un mapa de
interacción completa del locus de la α-globina se obtuvo mediante la aplicación de la técnica experi-
mental 5C (Figura 15.4) para células cancerosas K562, donde se piensa que tienen lugar interacciones
de larga distancia (medida en Kb dentro de la secuencia genómica) entre los genes de α-globina y sus
elementos reguladores. A cada fragmento de restricción resultante por digestión con el enzima HindIII
le fue asignada una partı́cula de radio proporcional al número de bases de DNA en el fragmento. El
HindIII es un enzima de restricción que reconoce la secuencia especifica de DNA “AAGCTT”. Cuando
la enzima encuentra esta secuencia de nucleótidos, produce un corte que, dependiendo de la frecuencia
y de la posición de la secuencia reconocida en el DNA, genera un número de fragmentos de tamaño
diferente. En este caso, el dominio α-globina estuvo representado por un conjunto de 70 partı́culas
(derivadas de la digestión por HindIII), a las cuales se asignaron 1049 restricciones.

Figura 15.4: Representación esquemática de la técnica 5C. Una librerı́a 5C, generada a partir de una
librerı́a 3C, puede ser analizada por técnicas de microarrays o de secuenciación cuantitativa. La digestión
(generalmente por el enzima de restricción HindIII) fragmenta la cromatina en un número de fragmentos
que depende del número de sitios de restricción del DNA (secuencias caracterı́sticas de nucleótidos dentro
de una molécula de DNA.) (Adaptado de [9]).

De estas restricciones, que corresponden a los osciladores armónicos descritos anteriormente, 235 eran
osciladores armónicos, 709 osciladores armónicos inferiores, y 105 osciladores armónicos superiores.
Para realizar una búsqueda exhaustiva del espacio conformacional, se generaron un total de 50.000
simulaciones independientes. En el caso de una macromolécula biológica como la cromatina, este espa-
cio es ingente y como consecuencia, es necesario generar un gran número de modelos tridimensionales
independientes. Cada simulación genera un modelo correspondiente a la mejor solución (en términos
de la puntuación descrita anteriormente) encontrada por cada modelo generado (Figura 15.3b). Los
10.000 modelos con la puntuación de IMP más baja (es decir, los modelos que mejor representan los
datos de entrada) fueron seleccionados y agrupados estructuralmente, lo que resultó en 393 grupos, con
los 10 grupos principales representando el 26 % de los modelos seleccionados (Figura 15.5). Este tipo de
análisis da una idea de la variabilidad de las estructuras generadas. Si se obtuviera un único grupo de
estructuras, se deducirı́a que los modelos generado tienen poca variabilidad (estructura bien definida).
El elevado número de grupos estructurales (393) encontrado en este caso, revela una alta diversidad
en los modelos generados. Esta variabilidad podrı́a ser relacionada con el tipo celular estudiado, siendo
la lı́nea celular K562 derivada de tejido canceroso. Estas células presentan un cariotipo (número de
cromosomas) muy variable y distinto del normal, y un alto nivel de expresión en los genes, factores
que podrı́an aumentar la variabilidad de la cromatina en estas células. Los modelos resultantes fueron
validados indirectamente, mediante la asignación de las caracterı́sticas estructurales locales de la cro-
matina publicada por el consorcio ENCODE [4] y por experimentos de FISH, que validaron el tamaño
y la forma. En la Figura 15.5 los diferentes colores representan los genes y las esferas sus elementos
reguladores [3].

Figura 15.5: Conjunto de soluciones del dominio de la α-globina humana (10 grupos principales).
15.0.5. Conclusiones

En este capı́tulo hemos introducido los diferentes niveles de organización del DNA en el núcleo celular.
Para poder acomodarse en el núcleo celular, el DNA se compacta alrededor de una proteı́nas llamadas
histonas, formando la cromatina. La cromatina es un conjunto de DNA y proteı́nas; la modificación de
su estructura 3D permite que elementos genómicos (por ejemplo genes, promotores, y reguladores de
los genes), se unan (o separan) para asegurar una correcta actividad genómica y garantizar un correcto
funcionamiento de la célula. Para entender como estos procesos tienen lugar es necesario conocer la
estructura 3D de la cromatina. Hemos visto una aplicación concreta que permite, a partir de datos ex-
perimentales, determinar la disposición espacial de los genes, con respecto de su elementos reguladores
(es decir, su estructura 3D). Las mejoras de las técnica de secuenciación (en términos de calidad de
datos producidos, tiempos experimentales y costes) permitirán obtener más datos de tipo 3C que con-
tienen, aunque de manera indirecta, información sobre la estructura 3D de la cromatina. Integrándolos
con métodos computacionales permiten revelar detalles sobre los mecanismo de plegamiento de la cro-
matina, con el fin último de añadir información importante para entender cómo el genoma funciona,
esencial para desarrollar nuevas técnicas terapéuticas, como las terapias génicas.
15.1. Bibliografı́a
[1] G. R. Abecasis, A. Auton, L. D. Brooks, M. A. DePristo, R. M. Durbin, R. E. Handsaker, H. M. Kang, G. T. Marth,
and G. A. McVean. An integrated map of genetic variation from 1,092 human genomes. Nature, 491(7422):56–65,
2012.

[2] F. Alber, S. Dokudovskaya, L. M. Veenhoff, W. Zhang, J. Kipper, D. Devos, A. Suprapto, O. Karni-Schmidt, R. Wi-
lliams, B. T. Chait, M. P. Rout, and A. Sali. Determining the architectures of macromolecular assemblies. Nature,
450(7170):683–94, 2007.

[3] D. Bau, A. Sanyal, B. R. Lajoie, E. Capriotti, M. Byron, J. B. Lawrence, J. Dekker, and M. A. Marti-Renom. The
three-dimensional folding of the alpha-globin gene domain reveals formation of chromatin globules. Nat Struct Mol
Biol, 18(1):107–14, 2011.

[4] E. Birney, J. A. Stamatoyannopoulos, A. Dutta, R. Guigo, T. R. Gingeras, E. H. Margulies, Z. Weng, M. Snyder,


E. T. Dermitzakis, R. E. Thurman, M. S. Kuehn, C. M. Taylor, S. Neph, C. M. Koch, S. Asthana, A. Malhotra,
I. Adzhubei, J. A. Greenbaum, R. M. Andrews, P. Flicek, P. J. Boyle, H. Cao, N. P. Carter, G. K. Clelland, S. Davis,
N. Day, P. Dhami, S. C. Dillon, M. O. Dorschner, H. Fiegler, P. G. Giresi, J. Goldy, M. Hawrylycz, A. Haydock,
R. Humbert, K. D. James, B. E. Johnson, E. M. Johnson, T. T. Frum, E. R. Rosenzweig, N. Karnani, K. Lee, G. C.
Lefebvre, P. A. Navas, F. Neri, S. C. Parker, P. J. Sabo, R. Sandstrom, A. Shafer, D. Vetrie, M. Weaver, S. Wilcox,
M. Yu, F. S. Collins, J. Dekker, J. D. Lieb, T. D. Tullius, G. E. Crawford, S. Sunyaev, W. S. Noble, I. Dunham,
F. Denoeud, A. Reymond, P. Kapranov, J. Rozowsky, D. Zheng, R. Castelo, A. Frankish, J. Harrow, S. Ghosh,
A. Sandelin, I. L. Hofacker, R. Baertsch, D. Keefe, S. Dike, J. Cheng, H. A. Hirsch, E. A. Sekinger, J. Lagarde, J. F.
Abril, A. Shahab, C. Flamm, C. Fried, J. Hackermuller, J. Hertel, M. Lindemeyer, K. Missal, A. Tanzer, S. Washietl,
J. Korbel, O. Emanuelsson, J. S. Pedersen, N. Holroyd, R. Taylor, D. Swarbreck, N. Matthews, M. C. Dickson, D. J.
Thomas, M. T. Weirauch, J. Gilbert, et al. Identification and analysis of functional elements in 1genome by the
encode pilot project. Nature, 447(7146):799–816, 2007.

[5] T. Cremer and C. Cremer. Chromosome territories, nuclear architecture and gene regulation in mammalian cells.
Nat Rev Genet, 2(4):292–301, 2001.

[6] R. T. Dame. The role of nucleoid-associated proteins in the organization and compaction of bacterial chromatin.
Mol Microbiol, 56(4):858–70, 2005.

[7] J. Dekker, K. Rippe, M. Dekker, and N. Kleckner. Capturing chromosome conformation. Science, 295(5558):1306–11,
2002.

[8] J. Dostie and J. Dekker. Mapping networks of physical interactions between genomic elements using 5c technology.
Nat Protoc, 2(4):988–1002, 2007.

[9] J. Dostie, T. A. Richmond, R. A. Arnaout, R. R. Selzer, W. L. Lee, T. A. Honan, E. D. Rubio, A. Krumm, J. Lamb,
C. Nusbaum, R. D. Green, and J. Dekker. Chromosome conformation capture carbon copy (5c): a massively parallel
solution for mapping interactions between genomic elements. Genome Res, 16(10):1299–309, 2006.

[10] J. Dostie, Y. Zhan, and J. Dekker. Chromosome conformation capture carbon copy technology. Curr Protoc Mol
Biol, Chapter 21:Unit 21 14, 2007.

[11] Z. Duan, M. Andronescu, K. Schutz, S. McIlwain, Y. J. Kim, C. Lee, J. Shendure, S. Fields, C. A. Blau, and W. S.
Noble. A three-dimensional model of the yeast genome. Nature, 465(7296):363–7, 2010.

[12] G. Felsenfeld and M. Groudine. Controlling the double helix. Nature, 421(6921):448–53, 2003.

[13] J. Fraser, M. Rousseau, S. Shenker, M. A. Ferraiuolo, Y. Hayashizaki, M. Blanchette, and J. Dostie. Chromatin
conformation signatures of cellular differentiation. Genome Biol, 10(4):R37, 2009.

[14] S. Jhunjhunwala, M. C. van Zelm, M. M. Peak, S. Cutchin, R. Riblet, J. J. van Dongen, F. G. Grosveld, T. A.
Knoch, and C. Murre. The 3d structure of the immunoglobulin heavy-chain locus: implications for long-range
genomic interactions. Cell, 133(2):265–79, 2008.

[15] E. Lieberman-Aiden, N. L. van Berkum, L. Williams, M. Imakaev, T. Ragoczy, A. Telling, I. Amit, B. R. Lajoie, P. J.
Sabo, M. O. Dorschner, R. Sandstrom, B. Bernstein, M. A. Bender, M. Groudine, A. Gnirke, J. Stamatoyannopoulos,
L. A. Mirny, E. S. Lander, and J. Dekker. Comprehensive mapping of long-range interactions reveals folding principles
of the human genome. Science, 326(5950):289–93, 2009.

[16] K. Luger, A. W. Mader, R. K. Richmond, D. F. Sargent, and T. J. Richmond. Crystal structure of the nucleosome
core particle at 2.8 a resolution. Nature, 389(6648):251–60, 1997.
[17] J. Mateos-Langerak, M. Bohn, W. de Leeuw, O. Giromus, E. M. Manders, P. J. Verschure, M. H. Indemans, H. J.
Gierman, D. W. Heermann, R. van Driel, and S. Goetze. Spatially confined folding of chromatin in the interphase
nucleus. Proc Natl Acad Sci U S A, 106(10):3812–7, 2009.
[18] A. Miele, K. Bystricky, and J. Dekker. Yeast silent mating type loci form heterochromatic clusters through silencer
protein-dependent long-range interactions. PLoS Genet, 5(5):e1000478, 2009.
[19] D. Russel, K. Lasker, B. Webb, J. Velazquez-Muriel, E. Tjioe, D. Schneidman-Duhovny, B. Peterson, and A. Sali.
Putting the pieces together: integrative modeling platform software for structure determination of macromolecular
assemblies. PLoS Biol, 10(1):e1001244, 2012.
[20] M. Simonis, P. Klous, E. Splinter, Y. Moshkin, R. Willemsen, E. de Wit, B. van Steensel, and W. de Laat. Nuclear
organization of active and inactive chromatin domains uncovered by chromosome conformation capture-on-chip (4c).
Nat Genet, 38(11):1348–54, 2006.
[21] T. Takizawa, K. J. Meaburn, and T. Misteli. The meaning of gene positioning. Cell, 135(1):9–13, 2008.
[22] G. Wedemann and J. Langowski. Computer simulation of the 30-nanometer chromatin fiber. Biophys J, 82(6):2847–
59, 2002.
[23] P. Yakovchuk, E. Protozanova, and M. D. Frank-Kamenetskii. Base-stacking and base-pairing contributions into
thermal stability of the dna double helix. Nucleic Acids Res, 34(2):564–74, 2006.
[24] Z. Zhao, G. Tavoosidana, M. Sjolinder, A. Gondor, P. Mariano, S. Wang, C. Kanduri, M. Lezcano, K. S. Sandhu,
U. Singh, V. Pant, V. Tiwari, S. Kurukuti, and R. Ohlsson. Circular chromosome conformation capture (4c) uncovers
extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nat Genet, 38(11):1341–7,
2006.

Вам также может понравиться