Академический Документы
Профессиональный Документы
Культура Документы
PROYECTOS
GENÓMICOS
La mayoría de las células en el cuerpo son diploides, y tienen 46 cromosomas totales en humanos.
Se denominan, células somáticas Las células sexuales o gametos, son haploides y solamente tienen
23 de los 46 cromosomas totales. Para expresar la información biológica en el genoma, se requieren
reacciones coordinadas de enzimas y proteínas, denominada, expresión de genoma. El producto de
la expresión genómica es el transcriptoma, el cual es una colección de ARN derivados de genes
codificantes de proteínas. La transcripción es el proceso de convertir segmentos de ADN codificante
a ARN-mensajero. El 2do producto de la expresión genómica es el proteoma; el repertorio proteico
de la célula. Las proteínas del proteoma se obtienen mediante el proceso de traducción.
Desde 1903, W.S. Sutton había determinado patrones de herencia en genes paralelos a la división
cromosómica, dando lugar a la teoría cromosómica (los genes están dentro de cromosomas). El
teñido celular permitió ver que los cromosomas efectivamente están hechos de ADN y proteína en
proporciones relativamente iguales. Para 1930, Avery, MacLeod, y McCarty mostraron que el ADN
y no las proteínas era el componente activo del “principio transformador” con un experimento de
inoculación de S. pneumoniae en ratones con variantes neutralizadas y patogénicas. Hershey y
Chase usaron marcado radioactivo para mostrar el funcionamiento de los bacteriófagos a través de
la inserción de su ADN viral. Ambos experimentos no confirmaron absolutamente al ADN como el
“principio transformador” en comparación a las proteínas, pero eso vendría después con la
estructura de doble hélice de Watson y Crick en 1953.
Para poder dilucidar la estructura del ADN, Rosalind Franklin usó difracción en rayos X para poder
observar la estructura. No obstante, Watson y Crick hicieron uso del contenido de agua en las fibras
de ADN, las proporciones de bases determinadas por las reglas de Chargaff, y construcción de
modelos para obtener la estructura de doble hélice. Las principales características de esta
estructura involucran el pareado de bases específico entre A y T y C y G con 2 y 3 puentes de
hidrógeno (respectivamente), y las interacciones pi-pi hidrofóbicas que le dan una mayor estabilidad
a pares de bases adyacentes y a la estructura general de la doble hélice.
El ADN es un polímero linear no separado en el que las subunidades están hechas de cuatro
nucleótidos distintos que pueden venir en cualquier orden particular y en cualquier número de
unidades. Cada nucleótido tiene una 2-desoxiribosa (una pentosa), una base nitrogenada (citosina
y timina son pirimidinas con un anillo y adenina/guanina son purinas con anillo doble) que forma un
enlace beta-N-glicosídico con el azúcar, y un grupo fosfato. Si solo se tiene el azúcar y la base, se
tiene un nucleósido. Los nucleótidos individuales están unidos por enlaces fosfodiéster en sus
carbones 5’ y 3’, y la diferencia entre el extremo 5’ y 3’ (P-terminal y OH terminal) es lo que le da
especificidad en transcripción para ir en dirección 5’-3’.
La estructura de doble hélice se conoce como la forma B del ADN. La mayoría del ADN en células
tiene esta forma, pero hay otras formas que existen a causa de que cada nucleótido en la estructura
tiene la flexibilidad de adoptar otras configuraciones estructurales. Las características de esta y las
demás formas están en la siguiente tabla.
El procesado de pre-ARN o ARN precursor incluye diversos procesos. Modificaciones en los extremos
5’ (tapones) y cadenas poli-A en extremos 3’. El splicing es la remoción de intrones para tener ARN
maduro compuesto solo de exones. El tercer proceso son modificaciones o edición de ARN a través
de la adición de otros grupos químicos (metilaciones o acilaciones).
El código genético es la conexión más clara que existe entre el proteoma y el transcriptoma de un
organismo, y específica como una o más secuencia de 3 nucleótidos en ARN-m se traduce a un
aminoácido específico. El código genético no es universal, y otras especies eucariontes o hasta las
mitocondrias pueden codificar para diferentes aminoácidos con un mismo codón.
2. GENOMAS Y EVOLUCIÓN
4. INTRODUCCIÓN A LA BIOINFORMÁTICA
Resumen del artículo de Mark B. Gerstein et al de qué es un gen posterior al proyecto encode:
Abstracto: Aunque el secuenciado del genoma humano sorprendió con la cantidad de proteínas
codificante, no cambió perspectiva acerca de lo que es un gen. Los patrones complejos de
regulación y la transcripción penetrante descubiertos con el proyecto ENCODE, al lado de
conservación no génica y la gran abundancia de ARN no codificante; cambiaron el concepto de
gen. El artículo reseña las definiciones de Mendel y Morgan, hasta ORFs modernos,
resumiéndolos descubrimientos actuales de ENCODE y proveyendo una nueva definición para el
gen: Una unión de secuencias genómicas codificando un set coherente de productos
potencialmente sobrepuestos y funcionales.
El consorcio ENCODE completó su caracterización del 1% del genoma humano en 2007. Este
proyecto fue un logro mayor en la caracterización del genoma humano y cambió la perspectiva
proteica alrededor del gen.
Wilhelm Johannsen definió por primera vez el concepto del gen en 1909 basándose en la teoría
desarrollada por Mendel, quién demostró que algunos rasgos como altura o color de flor no se
entremezclaban en su descendencia, sino que pasaban como entidades distintas y discretas. En
1910, el genetista Hunt Morgan estudiaban mutaciones de segregación en D. melanogaster.
Pudieron explicar sus datos con un modelo en el que los genes se arreglaban linealmente y que su
capacidad de entremezclarse es proporcional a la distancia que los separa. En este entonces, el
gene era una entidad abstracta cuya existencia era reflejada en la forma en la que los fenotipos
eran transmitidos entre generaciones. Para los 40’s Beadle y Tatum descubrieron que las
mutaciones en genes podían dar lugar a defectos en pasos dentro de vías metabólicas, dando
lugar a la perspectiva de un gen-un polipéptido o un gen-una enzima. Para los 50’s se había
demostrado que la herencia tenía un componente físico y molecular porque los rayos X causaban
mutaciones. En 1955, Hershey y Chase establecieron que la sustancia transmitida por
bacteriófagos a las bacterias realmente era ADN y dio lugar a que el gen fuera visto como un
cistrón, una región de ADN definida por mutaciones que in trans no podrían complementar
genéticamente a otras. En los años 60’s, el haber obtenido la estructura tridimensional del ADN
desde 1953 permitió explicar como es que el ADN funciona como una molécula de herencia. El
pareado de bases explicaba como la información genética podía ser copiada, y la existencia de dos
hebras explicaba porque a veces había errores durante la replicación del ADN y como esto podía
dar lugar a mutaciones. Fue también en esa década que la biología molecular tuvo un rápido
desarrollo. Se sabía que algunos genes codifican no para proteínas pero si para ARN-r y ARN-t,
causando que el gen fuera visto como un código de ácidos nucleicos que da lugar a un producto
funcional. Durante la década de los 70’s y los 80’s, el gen fue considerado como un ORF. Se
desarrollaron técnicas de clonación y secuenciación, revolucionando el campo de la biología
molecular. Se creó el concepto del gen nominal, definido por su secuencia predicha en vez de ser
visto como un locus responsable de un fenotipo. La definición de los 90’s a los 2000’s es la que se
usa actualmente y fue definida por la organización de nomenclatura del genoma humano como un
segmento de ADN que contribuye a la función del fenotipo, pero en ausencia de una función
demostrada, un gen puede ser caracterizado por secuencia, transcripción, u homología.
Resumen del artículo de Peter Portin y Adam Wilkins de la definición del término del gen:
En 1866, Mendel hizo sus primeros experimentos de herencia, sin usar el término de genes. Este
término no se tuvo hasta 1909, con Johannsen. En el año de 1900 ya se conocía la existencia de los
cromosomas, pero en 1902, Boveri demostró la individualidad de cada cromosoma y su
continuidad a través de la mitosis. Estas dos propiedades dieron una buena explicación para las
leyes de segregación y de mezclado independiente. En 1916, Bridges mostró con D. melanogaster
que la falta de segregación en marcadores genéticos durante la formación de gametos siempre se
asocia a un comportamiento excepcional de un par cromosómico durante la meiosis. Después, se
encontró el fenómeno de pareado en arvejillas, indicando que los genes pareados están en el
mismo cromosoma y aquellos con mezclado independiente no. Después de ello se demostraría
con Morgan que genes separados en el cromosoma también pueden tener una clasificación o
mezclado independiente por la recombinación durante la meiosis, pero los genes cercanos entre
ellos tienen un cierto grado de herencia compartida. Se siguió trabajando en mapas genéticos de
grupos de genes pareados y luego mapas citológicos de los cromosomas. Morgan pudo explicar
citológicamente el entrecruzado genético con la teoría del quiasmatipo de Jannsens. La otra
hipótesis era la hipótesis clásica, que no requería el rompimiento y unión de cromosomas, pero
asumía que las variaciones eran resultado de las cromáticas mezclándose una encima de la otra.
Para 1930, el concepto de gen era visto como una unidad indivisible de herencia, localizada en
puntos específicos de un cromosoma y caracterizados por tener transmisión hereditaria,
recombinación genética, la capacidad de mutar, y una función. Lo que se desconocía todavía era
como los genes llevaban a cabo estos procesos. Muller en 1922 había publicado que los genes
eran moléculas con 3 capacidades esenciales, autocatálisis, heterocatálisis (producción de un
material o efecto no genético) y la habilidad de mutar). Durante el período clásico, el gen fue
tratado como un punto adimensional en un cromosoma.
Posteriormente, durante el período neoclásico; el gen adquiere una dimensión espacial no
ambigua, una longitud, y después una identidad lineal química en la forma de la molécula de ADN.
El período neoclásico comenzó en 1940 con dos líneas de investigación principales, una que usaba
mapeo recombinacional y otra que usaba la naturaleza molecular y estructural del gen. Ambas
líneas se unirían en 1950. A principios de los 40’s, se demosró que los genes podían ser disectados
en segmentos contiguos con recombinación genética. Los experimentos de Avery y sus colegas
dieron amplia evidencia de que el ADN era la molécula principal de la herencia en 1944, y Hershey
y Chase mostraron en 1952 que los bacteriófagos usaban el ADN para multiplicarse. Más relevante
aún sería la estructura del ADN en 1953-1954 que daría lugar a demostrar que los genes se
transcriben a ARN-m y luego a proteínas. Se había logrado establecer la naturaleza del gen y su
conexión con las proteínas. Benzer en 1961 destruyó la concepción clásica del gen como una
unidad fundamental de función, recombinación y mutación demostrando que el gen podía tener
varias mutaciones y recombinaciones. El período neoclásico de la genética culminó en el
averiguamiento del código genético y dio lugar a un nuevo concepto para el gen: un gen-un
ARNm-un polipéptido.
Existen desviaciones del concepto neoclásico del gen que eliminan su validez. Se encontró que un
gen podía dar lugar a más de un ARNm, y que un gen puede ser parte de varias unidades de
transcripción a través de promotores complejos, y/o splicing alternativo. Por ende, un solo gen
puede dar lugar a más de un transcrito. El splicing alternativo se estudió a finales de los 70’s,
notando la existencia de los intrones y su eliminación por splicing para solamente tener exones en
ARN maduro. En splicing constitutivo, todos los exones de un transcrito se incorporan a un ARN
maduro por ligado invariante de exones consecutivos, dando un único tipo de ARNm a partir de un
gen. En el splicing alternativo, los exones no consecutivos se unen por el procesamiento de
algunos, pero no todos, los transcritos de un gen. Adicionalmente, las secuencias de aminoácidos y
sus funciones son derivables del ADN de su gen correspondiente (edición de ARN). Esto implica
procesos moleculares post-transcripcionales en los que se altera la molécula de ARN y por ende se
tiene una secuencia de aminoácidos diferente a la predicha originalmente. También es importante
considerar el concepto de compartir genes, en los que diferentes células tienen polipéptidos
iguales derivados del mismo gen, pero con funciones diferentes.
Algunas inconsistencias más severas en el concepto del gen se pueden resumir en los siguientes
puntos. 1) En organismos eucariontes hay casi nula restricción a la transcripción, haciendo
imposible establecer relaciones generales simples entre transcritos primarios y sus productos. El
genoma está lleno de transcritos sobrepuestos que hacen imposible establecer una relación 1:1:1
para secuencias específicas de ADN, transcritos, y funciones. Esto se complica más si se considera
que los transcritos codificantes y no codificantes pueden derivarse de cualquiera de las 2 hebras
de ADN. 2) Los exones de diferentes genes pueden ser miembros de más de un transcrito. La
fusión de genes anula el concepto neoclásico del gen y tiene ocurrencia en 4-5% de pares de genes
en tándem en humanos. 3) En organelos de eucariontes microbiales, hay muchos genes
encriptados que están fragmentados en diferentes segmentos a lo largo del genoma. 4) Hay
evidencia de que el estatus funcional de un gen puede ser heredado de una generación a otra a
través de herencia transgeneracional epigenética. 5) La restauración genética puede ocurrir y dar
lugar a reescribir el ADN de un organismo a través de segmentos de ARN heredados de
generaciones pasados. 6) Hay muchos genes codificantes para ARN que producen ARN diverso que
no traduce a proteínas (ARN-r, ARN-t, miARN).
El estado actual del concepto del gen requiere entender que el gen no es autónomo, ni
independiente, pero si ejerce sus efectos dentro o afuera de sistemas complejos de interacción.
Son “engranajes” de una red regulatoria genética (GRN) y es difícil entender los fenotipos
mutantes que pueden resultar. Esto causa que el gen sea visto como una entidad
multidimensional. Los autores de este artículo dan la siguiente definición al concepto de gen: Un
gen es una secuencia de ADN (cuyos segmentos no necesariamente son contiguos) que específica
para uno o más ARN relacionados por secuencia/proteínas evocadas por GRNs y que participan
como elementos de las GRNs; con efectos indirectos, o como resultados de GRNs y dando lugar a
efectos fenotípicos más directos. Esta definición es sumamente molecular, pero su tamaño la hace
una solución meramente tentativa o temporal.
Resumen del primer capítulo del Griffiths introduction to genetic analysis, 10ª edición:
Los genes y el ADN que los compone tienen diferentes propiedades. La capacidad de replicarse, la
generación de formas usando el ADN como la información para dar lugar a ellas, y la posibilidad de
sufrir mutaciones. La generación de forma se lleva a cabo a través de la formación de proteínas.
Primeramente, se transcribe la secuencia de nucleótidos para obtener un ARN-m. Esta secuencia se
conoce como el “transcrito”. Posteriormente viene el proceso de producir una cadena de
aminoácidos basada en la secuencia de nucleótidos del ARN-m; denominada traducción. La
traducción hace uso de tres nucleótidos sucesivos, llamados codones. La síntesis proteica ocurre en
los ribosomas, donde los ARN de transporte (ARN-t) llevan aminoácidos individuales para formar
una cadena polipeptídica. El ADN es una molécula lineal de cuatro bloques constitutivos
denominados “nucleótidos”. Los cuatro nucleótidos son la Adenina, Timina, Guanina, y Citosina.
La estructura de un gen en eucariontes es más complicada que en procariontes, los cuales no tienen
núcleo celular dentro de ellos. En los genes de muchos eucariontes, la secuencia codificadora está
interrumpida por segmentos de ADN denominados intrones. Estas secuencias son eliminadas del
ARN-m maduro antes de salir del núcleo y dejan solamente las partes codificantes; denominadas
exones.
La selección natural es un proceso donde individuos con una característica particular tienen a
reproducirse mejor que otros en un entorno particular; dando lugar a una mayor abundancia de
individuos que comparten esa característica particular en su fenotipo. La similitud por ascendencia
de un ancestro común se conoce como “homología”. Un árbol evolutivo es un diagrama ramificado
que muestra la ascendencia de especies modernas y extintas a través de sus ancestros a lo largo del
tiempo. Esto puede llevarse a cabo con secuenciado de ADN.
Las variantes que puede haber en un especie o población pueden clasificarse en continuas o
discontinuas. Las variaciones discontinuas consisten de una característica encontrada en una
población que da lugar a dos o más fenotipos diferentes. Estas variaciones suelen ser producto de
diferencias alélicas. La constitución alélica de un organismo es su genotipo, el cual es el origen
hereditario del fenotipo. La existencia de dos o más variantes discontinuas da lugar a un
polimorfismo, pero no es hasta que se tienen variantes discontinuas excepcionales que se tiene una
mutante. Las variantes continuas tienen un rango constante de fenotipos en una población (tamaño,
peso, color de piel, etc.). Las variantes alélicas son el resultado de cambios en sitios activos de
polipéptidos, los cuales son grupos de aminoácidos cruciales. Los alelos que no dan lugar a proteínas
funcionales se conocen como “nulos”. Estos cambios alélicos a su vez pueden ocurrir por
sustituciones de par de nucleótidos, deleciones, y duplicaciones. Esto puede dar lugar a mutaciones
de marco de lectura, donde la pérdida o adición o pérdida de uno o más nucleótidos causa que la
transcripción de todo el segmento esté incorrecto.
Puede haber diversas metodologías para el estudio de genes y sus actividades. Una es el aislamiento
de mutaciones que afectan un proceso biológico, revelando un componente genético del proceso y
su conexión a una serie de proteínas relacionadas. Otra metodología es el análisis de la progenie
con cruzas controladas entre mutantes e individuos wild type para identificar genes, sus alelos, y
localizaciones cromosómicas, así como patrones hereditarios. Un tercer enfoque es un análisis
genético de los procesos bioquímicos celulares, y ver como estos procesos son afectados en un
individuo variante y en uno no variante para así deducir el papel de uno o más genes. Un cuarto
enfoque es el análisis microscópico para ver la estructura y movimiento cromosómico, así como
localizaciones específicas en los mismos. Una quinta metodología involucra análisis directo de ADN
a través de secuenciado, haciendo uso de clonado de ADN. Todas estas metodologías dan lugar a la
genómica, que es el estudio de la estructura, función, y evolución de genomas completos y está
subdividida en bioinformática; el análisis matemático del contenido informacional de los genomas.
La genética clásica trata a las células con fenotipo “normal” (wild-type) con un agente como rayos X
o ciertos compuestos químicos para dar lugar a mutaciones. Después se debe determinar si la
mutación afecta más de un gen particular, para descubrir uno o más genes que hayan sido
afectados. Luego se debe determinar la función del gen o genes que fueron afectados para terminar
con su mapeo en la secuencia genómica del organismo. La genética inversa empieza con un gen de
función desconocida obtenido de una secuencia genómica; y luego intenta averiguar cuál es su
función. Se sigue haciendo uso de mutaciones en el gen para poder determinar su función,
usualmente haciendo uso de mutagénesis dirigida. No obstante, el orden de pasos cambia porque
primero se obtiene el gene y su secuencia, luego se muta, y de allí se determina su función. Todo
este proceso es facilitado por el clonado de ADN, que implica tomar un fragmento de ADN y
replicarlo muchas veces hasta que haya muchas copias del mismo. Este proceso también se conoce
como amplificación. Se pueden usar sondas de genes, que son fragmentos de una cadena de ADN o
ARN para encontrar genes o secuencias particulares en una mezcla a través del apareamiento de
bases. Es necesario hacer uso de secuencias de ADN separadas a través de enzimas de restricción,
las cuales cortan el ADN blanco en localizaciones y tamaños específicos. Se puede usar Southern
blot para ADN y Northern blot para ARN, pero ambos involucran el movimiento de secuencias
nucleotídicas con velocidad inversamente proporcional a su tamaño a través de una membrana
porosa con una corriente eléctrica. También se puede hacer un western blot, usando anticuerpos o
ligandos específicos para separar una proteína en una mezcla y después transportarla en una
membrana por electroforesis.
Los modelos con animales usan organismos elegidos por su buen ajuste a un problema de
investigación, ser fáciles y baratos de conseguir/mantener, y por la posibilidad de aplicar lo
aprendido con ellos en otras especies.
E
El hacer copias de ADN=Replicación. El pasar de ADN a ARN=Transcripción. El pasar de ARNm a
Péptidos=Traducción.
Los priones son diferentes porque NO siguen el dogma de la BM. Tiene proteínas (proteínas prion
mutantes) que permiten cambiar la conformación de proteínas nativas.
El grupo de Celera Genomics, liderado por Craig Venter y el grupo de PGH liderado por Francis
Collins compararon las secuencias del genoma humano que fueron desarrollando individualmente.
La estructura del ADN debe leerse de dirección 5’ a 3’. La hélice estabilizadora es antiparalela a la
hélice codificadora. La secuencia de ARNm es complementaria a la codificadora y la secuencia de
la hélice estabilizante es la misma que la del ARN, pero reemplazando los U con T.
En eucariontes, se eliminan los intrones a través del splicing, creando ARN maduro compuesto
únicamente de exones. ARN y ARN están hechos de cadenas de polinucleótidos unidos por enlaces
fosfodiéster. Cada nucleótido tiene una base nitrogenada, un azúcar, y un grupo fosfato. Por ende,
un nucleótido es la unión de un nucleósido y un fosfato (el fosfato da carácter ácido). El
nucleósido, a su vez, está compuesto de un azúcar (neutro) y una base nitrogenada (básica). Las
bases nitrogenadas son moléculas heterocíclicas de un solo anillo (pirimidinas: Citosina y Timina) o
de dos anillos (Purínicas: Adenina y Guanina). Entre A y T se forman 2 puentes de H y entre C y G
se forman 3 puentes de H. Cada 3.4 nm, se da un giro y el ADN tiene 2 nm de ancho. Aquellas
secuencias con muchas repeticiones pueden formar estructuras secundarias como tallo-asa en el
ADN. En el ARN se pueden formar horquillas o bucles. Generalmente hablando, se pueden tener
estructuras de doble hélice intercaladas por uniones entre A y U. El ARN-t también tiene
estructuras secundarias (brazos). En ARN ribosomal también hay estructuras secundarias por
emparejamiento de bases.
Los virus únicamente tienen ADN o ARN. Tienen funciones diversas al transmitir y expresar info
genética que depende de su localización de orden celular y su estructura de orden superior. Los
virus solo tienen ácidos nucleicos en la cápside.
La definición de gen se ha ido modificando a lo largo del tiempo. Anteriormente, estos conceptos
eran considerados adecuados para describir un gen: Gen=Enzima, cada gen codifica para una
proteína o cadena polipeptídica. Unidad funcional de herencia. Un gen ocupa un único locus en un
cromosoma. Es secuencia de ADN capaz de hacer una secuencia de ARN funcional. Secuencia del
genoma que puede dar lugar a uno o más productos funcionales, los cuales pueden ser
polipeptídicos o de ARN no codificante. Puede haber genes traslapados, genes dentro de genes,
señales alternativas de poliadenilación de diferentes tamaños con extremos 3’ diferentes con los
cuales se tienen propiedades diferentes. Hay uso de exones alternativos. El 20% de pseudo genes
se transcriben. 70% de ADN humano se transcriben en ambas cadenas. ARN mo o micro ARN. La
proporción de ADN codificante es de 1.1% (Codificante=Dar lugar a proteína).
En 1920, Hans Winkler propone el genoma como un conjunto de cromosomas haploides que
sirven como base para el material genético de la especie. Es el contenido genético total de un
organismo, tiene la info genética para constituir y mantener al organismo. Incluye a genes y a
genes no codificantes. En eucariontes, eso se denomina genoma nuclear.
Genoma humano compuesto de 3000 millones de pb (3.3 × 109 𝑝𝑏~20,500 𝑔𝑒𝑛𝑒𝑠). 1-2% del
genoma codifica para proteínas. El resto codifica para ARN no codificante, secuencias regulatorias,
intrones, y secuencias no codificantes. Los genes se distribuyen irregularmente en cromosomas
humanos. El genoma nuclear tiene 23 pares de cromosomas. Hay 22 cromosomas autosómicos y
un único par sexual. La porción más grande del genoma nuclear son repeticiones basadas en
transposones. El tamaño del completo del genoma nuclear humano es de 6 gigabases. El genoma
El genoma mitocondrial está compuesto de 16,569 pb y tiene 37 genes (ARN-t y ARN-r). Se hereda
de la madre y tiene miles de copias.
Exoma=Parte del genoma formada por exones. Los exones son las partes del ADN que conforman
al ARN maduro y que permiten traducirse a proteínas. El genoma humano tiene 180,000 exones
que representan solamente 1-2% del genoma humano completo, y están dentro de 20,000-25,000
genes totales. En las regiones codificantes es donde ocurren 90% de las mutaciones que dan lugar
a enfermedades.
Los eucariotes tienen más superenrollado su ADN. Los ARN m son monocistrónicos, por ende,
tienen áreas de regulación o espaciadoras de mayor tamaño. Los genes pueden estar en forma de
clústeres, pero tienen control individual.
Cromosoma=Estructura de proteínas y ADN organizada. Tiene un brazo largo y un brazo corto. Los
extremos de los cromosomas se definen como telómeros. El brazo corto es “p” y el brazo largo es
“q”. Los cromosomas 13, 14, y 15 son acrocéntricos, pero no hay cromosomas telocéntricos en el
genoma humano y estos no tienen brazos cortos.
Los patrones de bandeo cromosómico reflejan niveles de compartimentalización del ADN. Las
bandas C producen regiones oscuras (heterocromatina) que están altamente compactadas y con
ADN altamente repetitivo. Se localizan en los centrómeros, en los telómeros, y en el cromosoma Y.
Las Bandas b tienen patrón alterado de comparación de regiones de unión al andamio (SAR). En
resumen, las bandas claras tienen algo de condensación, son ricas en AT y tienen un alto
contenido de genes y se replican en una etapa temprana. Las bandas oscuras tienen un alto grado
de condensación, son ricas en GC y tienen pocos genes y su replicación es mucho más tardía en
comparación. El hecho de que el ADN esté altamente condensado evita que entre la maquinaria
de transcripción y por eso es que hay una menor cantidad de genes.
En el nucléolo están genes para ADN ribosomal. Aparece y desaparece a lo largo del ciclo celular
porque no siempre se requieren proteínas ribosomales. Nucléolo= Estructura más grande en el
núcleo de células eucariontes que da lugar a ribosomas, partículas de reconocimiento de señales y
dar lugar a las ARN polimerasas pol I y III transcribiendo ARN-r.
A lo largo de los cromosomas puede haber ADN repetitivo disperso (moderadamente repetitivo y
disperso en todo el genoma y entre mezclados con el ADN de copia única).
Las células sexuales son de naturaleza haploide. Tanto las somáticas como las sexuales llevan a
cabo un proceso de mitosis, pero las sexuales son las únicas que tienen meiosis. En la meiosis se
lleva a cabo la recombinación y entrecruzado de los cromosomas.
A las bandas centroméricas se les puede resaltar la heterocromatina constitutiva. Están altamente
compactadas, tienen ADN altamente repetitivo, y se encuentran en telómeros y centrómeros.
En los genomas están codificados ARN, y proteínas. Los genes no codificantes pueden dar lugar a a
ARN-t, ARN-r, etc.
En los procariontes hay una menor distancia entre regiones codificantes y más regiones
espaciadoras. En genes procariontes NO hay intrones.
Nucléolos aumentan al tener una alta demanda de síntesis proteica. El nucléolo biosintetiza
ribosomas para hacer ARN-r.
En ribosomas hay 4 tipos de ARN, un ARN de 18S en subunidad menor y ARN 28S, 5, 8S, y 5S. La
mayoría del ARN en nucléolo son 45S en parte fibrilar y 32S en parte granular Esto implica que el
ARN-R viene de un precursor. Para procesar ARN-r participan ARN nucleolar pequeño. Lo más
importante de esta sección es recordar los componentes y su localización cromosomal.
El proyecto ENCODE identificó 2608 transcritos de 487 locis totales. Encontraron que >50% tienen
2 o más promotores alternativos. Descubrieron los genes con primeros exones alternativos y cada
uno con su propio promotor.
Splicing alternativo da lugar a varias isoformas de una proteína a partir de un mismo transcrito.
Edición de ARN: A veces el ADN no corresponde a la secuencia del transcrito. Estos cambios
implican, inserciones, deleciones, o modificaciones del transcrito primario.
En el proyecto del genoma humano (HGP) se estimaron inicialmente que había de 100 a 20,500
genes. No obstante, es importante recordar que la complejidad de un organismo NO tiene que ver
con el tamaño del genoma. El genoma humano consigue tener una más amplia variedad proteica
gracias al splicing alternativo, extensas modificaciones post-traduccionales, mayor complejidad en
los genes. Los genes humanos tienen mayor # de dominios en comparación a los invertebrados. El
gen de distrofina es el más grande dentro del genoma humano.
Un sitio donador de splicing tiene GU y un sitio receptor de splicing tiene AG. Diferentes tipos de
células tienen diferentes tipos de splicing alternativo.
A veces, dentro de un marco abierto de lectura (ORF=Open Reading Frame) hay otros genes con
sus propios ORF. Por ejemplo, en intrón 26 de gen NFI hay 3 genes internos con 2 exones cada uno
de ellos. La cadena sentido es la cadena 5’ a 3’, tiene la misma secuencia y la misma polaridad que
el ARN-m. La cadena anti sentido o cadena molde va de sentido 3’ a 5’. ARN-m va de 5’-UTR
extremo 5’ hasta antes de ATG (O en su defecto AUG en ARN-m) en cadena sentido. 3’-UTR
extremo 3’ va después de codón de paro (UAA, UGA, o UAG).
ORF=Marco potencial de un producto proteico de ADN. Son potenciales porque por cada hebra de
ADN hay 3 ORF porque puede haber 3 inicios diferentes por cada codón individual. Por ende, ADN
de cadena sencilla tiene 3 ORF y el de doble cadena tiene 6 ORF. NO importa el tamaño del gen
particular con el que se esté trabajando.
Cuando se empieza a transcribir el ADN, las letras se vuelven mayúsculas (esta es la posición +1).
Los promotores pueden estar en posición -25 (es decir, 25 bases atrás de la 1era letra mayúscula).
La gran mayoría de los genes empiezan con el AA de Metionina. Se deben contar los codones a
partir de donde se empieza a transcribir (las primeras letras mayúsculas).
En genes procariontes hay una región regulatoria para iniciar transcripción, región codificante, y
señales de terminación de transcripción. NO tienen intrones.
Los genes mitocondriales representan el 0.3% del ADN total en la célula. Tiene 16,569 pb. La
replicación del genoma mitocondrial ocurre independientemente del genoma nuclear. Genoma
mitocondrial humano codifica para 37 genes diferentes, 21 ARN-t, 13 polipéptidos y 2 ARN-r.
Cadena pesada del genoma es rica en G, y la ligera es rica en C. Tiene una muy alta tasa de
mutación. Se hereda en forma materna y generalmente existen muchas mitocondrias por célula. El
tamaño y contenido varía ente organismos, así como el contenido de genes. N-formil metionina da
inicio a la traducción. La mitocondria se origina conceptualmente de la teoría de endosimbiosis
hecha por Lynn Margulis en los 70’s. Genes en la mitocondria NO tienen intrones.
Densidad génica es medida con el # de gene/millón de pares de base (Mb=Mega bases). Densidad
del genoma humano≅ 12 − 15 𝑔𝑒𝑛𝑒𝑠/𝑀𝑏. La distribución de los genes NO es uniforme a nivel
del genoma humano. El cromosoma 19 es el que tiene la mayor densidad génica. La densidad
génica es mayor en regiones subteloméricas. El gen de la titina es secuencia codificante más larga
del gen, con un total de 80,778 pb y el mayor # de exones (178).
El tamaño de intrones variable, la presencia de genes sin intrones (p.ej. los genes mitocondriales,
neurotransmisores) y la existencia de gene que se traslapan parcialmente; dan lugar a una mayor
variabilidad en proteínas.
Organización del genoma humano: Se pueden clasificar las secuencias del genoma humano es
genes codificantes de proteínas, genes para ARN no codificante, y genes procesados.
Para poder cuantificar el grado de similitud entre dos secuencias, hay que alinearlas y ver cuántas
sustituciones se pueden encontrar. Una sustitución es un cambio de residuo por otro. Si falta base,
decimos que hay gaps (pueden ser causados por deleciones o inserciones) y se puede calcular el %
de homología entre las secuencias.
Súper familia génica: Grupo de genes relacionados en estructura y función con débil homología en
secuencias y sin motivos de AA conservados. Un ejemplo es la súper familia de IgG que forman
dímeros consistentes de dominios extracelulares. Las súper familias de genes con segmentos
altamente conservados se denominan factores de transcripción (esta oración probablemente está
mal).
Genes para ARN no codificante: Los ARN nucleolares pequeños (sno ARN) sirven para procesar el
ARN-r.
Pseudogenes y genes procesados: Los pseudogenes son generalmente raros en el genoma porque
son muy compactos y son menos de 19,000. Han acumulado diversas mutaciones y no son
funcionales. NO tienen ORF. Los pseudogenes no procesados (30%) son copias de genes originados
por duplicación, que no se transcriben por carecer de promotor y por tener mutaciones sin
sentido. Los pseudogenes procesados son copias de ARN-m retro transcritos a cADN o insertados
en el genoma. NO tienen intrones ni promotores. Los pseudogenes solitarios son ortólogos de
genes funcionales en simios.
ADN no codificante altamente repetitivo: Puede venir repetido en tándem (dependiendo del
tamaño puede ser macro satélite o ADN satélite), VNTR (mini satélite), y microsatélite (STR). Puede
ser repetido disperso en forma de retro transposones como LINE, SINE, y elementos de LTR.
ADN satélite: Debido a alta repetición, tienen composición diferente de la del resto gel genoma.
Cuando ADN genómico se fragmenta y analiza en bandas de CsCl.
Se debe ver la cinética de renaturalización o re asociación (Curvas Cot) que ponen de manifiesto la
existencia de diversos tipos de secuencias. La complejidad del genoma es analizable por cinética
de reasociación de ADN.
Secuencias repetidas dispersas forman 45% del genoma humano. Las familias Alu es 12% del
genoma nuclear y se encuentran en zonas ricas en G-C.
Macro satélites (ADN satélite): Largos trechos de ADN repetidos en tándem. Consiste en
secuencias cortas de 50-1000 pb repetidas miles o millones de veces y que son muy ricas en AT.
Transcritos de ADN satélite se procesan en ARNsi que participan en procesos epigenéticos de
remodelamiento de cromatina. Se suele localiza en centrómeros, sobre todo en áreas
pericentroméricas y subteloméricas de heterocromatina constitutiva. Predomina el alfa satélite (3-
5% de cada cromosoma) que tiene secuencias de 171 pb que se unen al cinetocoro.
ADN satélite: Largos trechos de ADN altamente repetitivo que se localizan en centrómeros y son
detectables por FISH (Hibridación fluorescente inmunológica de cromosomas).
Mini satélites: 6-25 nucleótidos en tándem que hacen secuencias de 100-20,000 pb. El genoma
humano tiene 30,000 mini satélites. Se relacionan con procesos de expresión génica, control de
transcripción, splicing alternativo, o impronta. Se asocia a puntos de fragilidad cromosómica,
translocación y recombinación meiótica. Mini satélites teloméricos se encuentran en cromosomas.
Mini satélites hipervariables son altamente mutables (10%) y homólogos. Tienden a ser
polimórficos (VNTRs=Marcadores de ADN). 90% de mini satélite están en telómeros de
cromosomas. TTAGGG se repite hasta 10-15 Kpb en tándem, generando regiones de 5-20 kb que
conforman a los telómeros. Hay gran variabilidad entre individuos multialélicos. Establecen huella
genética de individuos a través de southern blot.
ADN telomérico tiene 100-1500 copias de repeticiones en tándem cortas. Está mantenido por la
telomerasa (un tipo de polimerasa). La actividad de la telomerasa ayuda a evitar el acortamiento
de telómeros.
Dinucleótido CA/TG es el más común (0.5% del genoma). Son altamente poliméricos. La expansión
de trinucleótidos son responsables de la enfermedad de Huntington, distrofia muscular miotónica,
ataxia de Friedrich, y SxX frágil. Pueden ubicarse dentro de genes o fuera de ellos.
Repetidos dispersos: Son elementos transponibles o elementos móviles dentro del genoma. Son
secuencias que se introducen en nuevos sitios a través de transcripción. Existen transposones que
tienen ADN como intermediarios y retro transposones que son intermediarios de ARN. Algunos
tienen enzimas que median la propia transposición (autónoma).
Elementos transponibles (TE): 45% de ADN humano deriva de TE. Los TE autónomos tienen
maquinaria necesaria para transposición. Los TE no autónomos usan maquinaria de los TE
autónomos. Son el origen de 47 genes, constituyen registro paleontológico de eventos como la
mutación y selección. Han reformulado el genoma al facilitar re-arreglos en cromosomas.
La inserción del LI dentro de genes puede causar enfermedades en humanos, pero esto es inusual.
Mutación genética es alteración permanente en secuencia de ADN que compone al gen y que es
permanente. Un polimorfismo es una variante con frecuencia mayor a 1%. No obstante, se
cambiaron los significados y ahora ambos se conocen como variantes, que pueden ser
patogénicas, probablemente patogénicas, de significado incierto, probablemente benigno, o
benigno. Los polimorfismos de 1% se usa en el análisis de genética de poblaciones.
Alteración en secuencia de nucleótidos de ADN puede ser inducido por factores ambientales (luz
UV o radiaciones ionizantes) o errores en replicación de ADN. Puede haber cambios a pequeña
escala (<10 Kpb) que pueden ser sustituciones, indels, duplicaciones, micro inversiones, o por
expansión de microsatélites. Puede haber SNP en región diferente que no altera la secuencia
(alterando el splicing). O puede haber una SNP en región distante que altera la secuencia. Es
necesario estudiar múltiples SNV dentro de un segmento de ADN para entender la asociación de
un SNV a un efecto de un fármaco. Cada combinación de SNV se llama Haplotipo, el cual es un tipo
de perfil de SNV.
Las variantes estructuras son variantes en número de copias (CNV), grandes segmentos de ADN de
miles a millones de pb. Algunos CNV son causantes de enfermedades como Parkinson o Charcot
Marie Tooth. La variación estructural es visible al microscopio e incluye hetero polimorfismo y re-
arreglos cromosomales balanceados que pueden tener tamaños mayores a 3 Mb. Variantes
microscópicas pueden ser re-arreglos cromosómicos, heteromorfismos.
INDEL: Tienen tamaño de 1-10,000 nt que están eliminados o insertados en la secuencia de tipo
silvestre.
Homología entre especies: Ortólogos (genes homólogos con función identificada en diferentes
especies). Estos mismos están derivados a partir de un ancestro común. Los parálogos tienen
diferentes funciones en el mismo organismo y son copias duplicadas dentro de un genoma que
pueden ser predichas por diferencias en tinción.
Segundo parcial:
En ExaC ya participaron más países, y hubo todo un estudio de filogenia para encontrar puntos
calientes de recombinación de ADN.
El ATG es el codón de inicio y de paro. En el intrón debe haber un receptor con GT y un aceptor
con AG.
Los exones pueden tener UTR y promotores. Recordar que siempre se empieza con codón de inicio
ATG y que por ende, de ahí se empiezan a contar los # de codones.
Gen de distrofina: DMD, Xp21.3. Distrofina es una proteína grande como un tubo, presente dentro
de las fibras musculares. Es parte del complejo distrofina-glicoproteína, lo cual cruza un puente de
citoesqueleto interno. El gen es de 2.4 Mb, 79 exones, 8 promotores. El transcrito Dp427m de
13,993 pb de ARN. La distrofina tiene 3685 aa y un PM de 427 kDa. Hay 8 isoformas, que son
producto de diferentes promotores.
El genoma mitocondrial está menos estable porque tiene nula recombinación y porque está
dentro de un ambiente con muchos radicales libres.
Los repetidos acumulados ocurren por eventos de inserción, lo cual da lugar a intrones
considerablemente más largos de lo normal.
Óxido nítrico sintetasa: Gen GULD permite sintetizar vitamina C y la manutención del orden en
línea de segmentos cromosómicos, lo cual da lugar a genes o bloques sinténicos.
Sintenia implica perseveración del orden en pequeñas regiones del cromosoma. La organización
puede cambiar, pero también pueden conservarse algunos bloques de hasta 2 genes de similitud.
El alineamiento de secuencias no es trivial, pero pueden diferir en tamaño por inserciones o
deleciones de nucleótidos.
Transcriptoma y proteoma: El genoma es lo que podría pasar, transcriptoma es lo que podría estar
sucediendo, y el proteoma es lo que verdaderamente está pasando. Se pueden usar métodos de
análisis globales para la genómica, transcriptómica, y metabolómica. La aplicación de nuevos
métodos de perfiles moleculares para diagnóstico de patologías incluyen: tomar tejidos, observar,
al microscopio, y detectar la patología en cuestión. La nueva metodología usa proteómica y
espectrometría de masas y genómica con microarreglos para poder detectar patologías u otros
problemas de salud. Puede haber mapeo, secuenciado y anotaciones de genoma (genómica
estructural), arreglos de ADN y chips (q-PCR, northern blot, y fusiones transcripcionales para
transcriptoma).
Las células de un tejido dan lugar a diferentes niveles de expresión génica (perfiles de expresión).
Son patrones de actividad o expresión de genes al mismo tiempo en las mismas células y
condiciones. Esta variación en expresión es base de diferentes procesos bioquímicos en un
genoma. La complejidad informacional aumenta de genoma, a transcriptoma, a proteoma. El
transcriptoma permite cuantificar niveles de expresión de genes con técnicas que analizan miles
de moléculas de ARN al mismo tiempo. Diferentes transcriptomas dan diferentes tipos celulares.
El transcriptoma nos dice lo que hace una célula, los genes que se expresan en un momento
específico y permite detectar cambios entre transcriptoma experimental y de referencia. También
permite ver variaciones de tipo celular, entre organismos, etapas de desarrollo, edad, ambiente, o
enfermedad. Permite entender de diferenciación normal si se estudia transcriptoma de células
troncales o de carcinogénesis si se estudia el transcriptoma de células cancerosas. El RNAseq es un
método de análisis masivo.
Transcriptómica: Estudio de transcriptoma con tecnología de gran escala para ver cuándo, cuánto,
y donde se expresa o no un gen. Algunos métodos para analizar expresión de uno o pocos genes.
Primero se hibrida in situ el tejido, se lleva a cabo una transferencia, un northern blot, hibridación
con dot-blot, uso de genes reporteros o RT-PCR. Estos métodos no sirven para transcriptoma.
Para detectar cambios en transcripción de genes múltiples se pueden usar métodos buscados en
hibridación (microarreglos). Portaobjetos pequeños con muchos genes en patrón regular, para
luego marcar los ARNm con fluorescencia e hibridarlos con muestra de portaobjetos, se pueden
determinar niveles de expresión de miles de genes al medir cantidad de ARNm en cada gen del
microarreglo. SAGE (Serial Analysis of Gene Expression) y MPSS para definir “firmas” de un
segmento específico de ARNm de un gen específico. Son transcritos de hasta 25 bases que se unen
por complementariedad.
Se tiene una muestra, se purifica, se hace retrotranscripción, se empareja con ADN codificante, se
hibridiza, se lava y se compara con transcritos de referencia.
Los estudios clásicos de perfiles de transcriptomas en humano fueron realizados en 1999 por
Goles et. Al e hicieron clasificación molecular de cáncer.
Tipos de ARNnc en humanos y funciones: Pueden ser específicos para tejidos o células
particulares. La mirnómica estudia a los miRNA. Los miRNA tienen pares GO en sus estructuras
secundarias. MiRNAs son procesados por las enzimas Drosha y Dicer y esto ayuda a regular
traducción proteica. Las interacciones entre el miRNA y ARNm pueden tener algunos errores de
pareado de bases. Pueden activar o silenciar a ARNm específicos.
Proteoma: Conjunto completo de proteínas expresado por un genoma en una célula o tejido en
tiempos y en condiciones particulares. Se debe conocer una estructura de proteínas del proteoma
y la interacción funcional entre proteomas. El proteoma es más grande que el genoma. El
procesamiento alternativo, la estabilidad proteica, las modificaciones post traduccionales
(fosforilaciones) dan lugar a gran variedad de proteínas.
La proteómica usa SDS-PAGE en 1-D para separar por pI, y en 2-D para separar por PM de
proteína. Identificación y secuencia parcial de proteínas requiere espectrometría de masas.
También se pueden usar microarreglos de proteínas para detectar interacciones proteína-proteína
con anticuerpos. El SDS-PAGE se puede acoplar a citometría para cuantificar niveles de proteínas.
Pasos de espectrometría de masas: Cortar manchas de gel con Ag+, digerir con tripsina para tener
péptidos de 5-10 aa, determinar masa/carga de péptidos en espectrómetro. Se pueden ionizar a
las proteínas por electrospray ionization (ESI) o matrix assisted laser deabsorption/ionization
(MALDI). No olvidar que hay que comparar los resultados con los de la secuencia de referencia.
El genoma tiene la misma concentración y es estático. El transcriptoma y el proteoma son de
naturaleza dinámica. Diferentes transcritos se originan de diferentes genes en un momento y
tejido particular. Puede haber edición, corte, y empalme alternativo para ARN.
Ontología génica: Función, dónde se localiza, y en qué proceso está involucrado el gen.
Mapa genético: Define distancias relativas entre genes por eventos de recombinación en la región
cromosómica que los contiene. En 90’s hubo esfuerzos para asociar genómicamente a un gen
(cromosomas son objetos físicos con patrones de banda característicos como referencias visibles.
La organización del material hereditario es lineal a lo largo del cromosoma.
Técnicas de mapeo o análisis genético: Define distancias relativas entre genes por eventos de
recombinación ocurridos en región cromosómica. Muestra posición de genes en cromosomas de
especie (relativa). Localiza genes asociados o detecta variaciones entre individuos.
El mapa genético muestra posición de genes en especie y permite buscar genes asociados con una
enfermedad. Debe mostrar posiciones de características distintivas y tiene marcadores genéticos.
Tiene asignación o localización de gen o cromosoma, genes sinténicos están en el mismo
cromosoma. Genes ligados segregan juntos a menos que haya recombinación. La frecuencia de
recombinación entre cromosomas homólogos permite medir distancia entre genes. Entre mayor
sea la distancia entre genes, mayor será la recombinación.
La sordera generalmente es autosómica recesiva, pero los eventos de recombinación dan lugar a
la enfermedad.
La meiosis informativa es cuando se puede determinar qué alelos vinieron de cada progenitor
individual. Para elegir marcadores adecuados, se deben tener heterocigotos en un % mayor o
igual al 70%; para asegurar que se pueda distinguir de qué progenitor se origina cada alelo
individual.
Si los genes están ligados, hay un mayor # de progenie parental que recombinante.
Mapa físico: Determina orden y espacio de segmentos de ADN. Cada uno identificado por
secuencias específicas. Elimina la necesidad de clonas enormes y es adaptable para completar
secuencia completa de ADN humano. Inicialmente se tenía un mapa híbrido del mapa de
restricción y un mapa contiguo que mostraba orden y distancia de sitios de corte.
Marcador genético: Cualquier carácter Mendeliano puede ser un carácter genético. DEBE ser
polimórfico. Harris describió en 1971 la presencia de variantes y el hecho de que muchas proteínas
tienen variantes heredables. Un ejemplo son los antígenos en diferentes grupos sanguíneos, o los
polimorfismos en proteínas séricas. RFLPs ayudan en localización física. STR reemplazan a VNTR y
luego los SNV. El marcador genético debe ser para variación conocida en una población, y se debe
saber su localización en el genoma.
El hecho de que una enfermedad sea autosómica, implica que no hay distinción de cuáles sexos se
van más o menos afectados por el padecimiento. Si el padecimiento también es dominante, se
transfiere o tiene probabilidad de transferirse en todas las generaciones.
Los RFLP solían hacerse con hibridación ADN-ADN. Ahora se amplifica, se corta fragmento de PCR
amente con enzima y se fraccionan por tamaño con electroforesis en gel. Puede generarse un
nuevo sitio en enzima de restricción. Los RFLP pueden hacerse muy baratos usando solamente
geles.
Los microsatélites como marcadores pueden ser muy útiles para mapeo genético y tienen alelos
múltiples. Son muy comunes a lo largo del genoma. El problema es que tienden a mutar
considerablemente.
Marcadores de SNP: Son ventajosos porque este polimorfismo es sumamente común en los
humanos. Son muy estables, métodos poderosos de genotipificación y son potencialmente
utilizables para mapear el genoma completo. Entre diferentes especies y sexos hay múltiples
diferencias en términos de cM.
En el caso de las SNV, solamente se pueden tener 2 variaciones diferentes. Para microsatélites
puede haber 5 o 7 variaciones diferentes.
Posterior a la realización de una genealogía con una familia grande o varias familias pequeñas. Se
puede ver con los colores de los progenitores individuales, si la herencia es autosómica dominante
o recesiva. Con los números después de la D en los marcadores se puede delimitar con qué
marcadores se transmite la enfermedad.
Para que haya ligamiento, se debe tener un LOD score de 3. Se puede seguir el árbol genealógico
para poder ver dónde hay recombinantes de ciertos marcadores en el árbol genealógico para
determinar que estos NO son transferidos con la enfermedad.
Posteriormente, usando la gráfica de LOD se puede determinar entre qué marcadores hay o no
ligamiento en base a cuál tiene un mayor puntaje de LOD. De esta forma se puede distinguir entre
qué marcadores está el gen mutante. Luego se puede investigar la función del gen, sus efectos por
mutaciones en OMIM, entre otras cosas.
Para los padecimientos autosómicos recesivos, hay que buscar grupos de homocigotos donde se
tengan los mismos marcadores. De nuevo hay que identificar entre qué marcadores está el gen
mutante.
Mapas físicos: Híbridos de células humano/ratón tienden a perder cromosomas humanos al azar y
por ende hay líneas celulares híbridas con menos cromosomas humanos. Si un gen siempre está
presente o ausente cuando un cromosoma desaparece o aparece en las células híbridas; se puede
establecer su localización cromosómica. La célula híbrida formada debe ser estable y después se
puede hibridar con FISH para detectar genes específicos en el cromosoma.
STS=Sequence Tag Sites. Similares a EST pero las EST si se expresan y fueron usadas para mapeo
genético. STS NO se repiten en el genoma.
La meiosis no informática puede ser un producto de que los padres son homocigotos, porque el
genotipo de los padres es igual al de los hijos, o porque hay un genotipo homocigoto en el hijo.
A pesar de que es muy tedioso hacer heterocariontes, el proceso sí tiene utilidad. Los mapas se
complementan entre sí y sólo son para enfermedades causadas por genes individuales (no
múltiples genes).
No se puede decir que dos loci estén ligados sólo por análisis de ligamiento en árbol genealógico.
Se pueden tener resultados de varias cruzas y luego usar chi-cuadrada para determinar el puntaje
de LOD, el cual es el logaritmo base 10 de la probabilidad de que 2 loci estén ligados entre sí.
Primero se establece el árbol genealógico, se calcula el valor de teta (fracción de recombinación)
(Recombinantes vs. No recombinantes) y se calcula el valor de LOD. Se asume que los Loci están
ligados entre sí si el valor de LOD es mayor o igual a 3 y por ende la probabilidad de que no estén
ligados es de 1/1000. Entre más marcadores se usen en este análisis, más precisión habrá en la
información obtenida. Si teta=0, no hay recombinación. Si Z (valor de LOD)<-2, implica que no hay
ligamiento entre dos loci específicos, pero también puede significar que no hay datos suficientes.
Las células somáticas híbridas para mapeo se basan en capacidad de células de hámster para
integrar material genético de otra especie. Las células humanas se fusionan con las de hámster y
se seleccionan aquellas con uno o más cromosomas humanos. La situación ideal es un panel
completo de híbridos en el que cada híbrido tiene un único cromosoma humano. Se obtiene una
mejor relación si solo se usan fragmentos de cromosomas.
12-14. En relación al gen PMP22 del humano, diga su localización cromosómica, tamaño del gen, tamaño
del transcrito, tamaño de la proteína.
Se localiza en el cromosoma 17, tiene un tamaño de 35,581 pb, una proteína de 160 aminoácidos.
Da lugar a la enfermedad de Charcot-Marie-Tooth. Es un grupo de transtornos hereditarios del
SNP que se caracteriza por la pérdida progresiva de tejido muscular y sensación de tacto en varias
partes del cuerpo. Es el resultado de una trisomía de PMP22. En el síndrome de Charcot-Marie-
Tooth, lo que se tiene es una pérdida de función comúnmente causada por una duplicación de una
gran región en el brazo corto del cromosoma 17. Se pueden detectar las CNV de PMP22 en el
laboratorio, y se puede usar la técnica de FISH (Hibridación in Situ con Fluorescencia). En esta
técnica, cuando hibride una sonda particular y se le incida con una luz de cierta longitud de onda,
va a ser fluorescente. En FISH se busca una secuencia específica con un fluóroforo y cuando haya
hibridación, este va a emitir fluorescencia. FISH se basa en exponer los cromosomas a una
pequeña secuencia de ADN (sonda) que tiene una molécula fluorescente pegada a ella. La
secuencia de la sonda se une a su secuencia correspondiente en el cromosoma. Las sondas se
pueden usar para determinar en qué cromosoma se encuentra el gen para determinar si a un
individuo le falta material genético de un cromosoma en específico o para examinar anomalías
cromosómicas.
Cada vez que se hacen estudios de ontología se ven funciones asociadas a algo. ExPASY es para
info más detallada y UNIPROT es para información más rápida y sencilla.
Herencia autosómica dominante: Afecta de la misma forma a hombres y mujeres, cada persona
afectada tiene un progenitor afectado. No se salta generaciones y por ende puede haber
generaciones afectadas (todas). Cada hijo de un progenitor afectado tiene 50% de riesgo de ser
afectado. Los individuos no afectados no transmiten la característica afectada a la progenie.
Algunos ejemplos, de padecimientos con este patrón incluyen la hipercolesteremia, osteogénesis
imperfecta, acondroplasia, enfermedad de Huntington, polidactilia, neurofibromatosis, entre
otros. Los individuos afectados generalmente son heterocigotos. Los individuos no afectados no
transmiten la característica a su progenie.
Síndrome de Marfan es causado por mutación en gen FBN1, que causa defectos en visión,
anomalías cardíacas, aracnodactilia. Son mutaciones de novo en 25% de los casos (antes no
presentes). Los grupos ABO son un ejemplo típico de codominancia en genes.
Familia génica PAX está involucrada en múltiples órganos. Las mutaciones capaces de truncar
proteínas pueden ser nonsense, splice, o insDel. Waardenburg es un ejemplo de síndrome donde
existe expresión variable (nivel en el que un genotipo se expresa en el fenotipo de un paciente).
Los pacientes pueden tener diferentes en una enfermedad a pesar de que la mutación se
encuentra en el mismo gen.
Dominancia negativa: Producto de un alelo defectuoso que interfiere con el producto del alelo
normal. Tienen efectos más severos que la haploinsuficiencia porque un producto anormal
insertado en un multímero proteico puede destruir la actividad de un complejo proteico. La
dominancia negativa se presenta en osteogénesis imperfecta más severa. El producto del alelo
mutante altera el empaquetamiento de la triple hélice de colágeno. La dominancia negativa se
presente en osteogénesis imperfecta de tipos II,III, y IV.
Ganancia de función: Una alteración de splicing causa que se obtenga una función. Por ejemplo, el
sitio de ruptura del propéptido N-terminal se pierde y se produce colágeno anormal; dando lugar a
síndrome de Ehlers Danlos tipo VII. La ganancia de función implica el desarrollo de funciones
anormales para el producto del gen. No obstante, la mutación no genera un producto
radicalmente diferente al producto nativo. Algunos ejemplos incluyen: Sobreexpresión en PMP22
que da lugar a síndrome de Charcot-Marie-Tooth, agregación de proteínas en HD en síndrome de
Huntington, o gen quimérico en BCR-ABL para leucemia mieloide crónica. Otro ejemplo es la
acondroplasia, causada por mutaciones en gen de receptor 3 de factor de crecimiento de
fibroblastos. Da lugar a crecimiento anormal de huesos que da baja estructura, cabeza grande,
estructura facial característica; pero sin alterar inteligencia y vida media promedio. El 80% de los
casos son mutaciones de novo y el 98% ocurre en FGF3. FGFR activa diferentes factores de
transducción de osteoblastos para iniciar replicación de osteoblastos, su diferenciación, y su
apoptosis.
En las sustituciones, solamente se usa un “>” para indicar que un nucleótido fue reemplazado por
otro. La IUPAC establece un código de ambigüedad que sirve para poder determinar qué
diferentes nucleótidos son reemplazados en una secuencia cuando puede haber más de una
variación. En el ADN codificante, el ORF empieza en la posición 1, y cualquier nucleótido previo es
un número negativo. Si van río abajo, se agrega “*” a la posición. Entonces, se puede decir que
c.9C>T es una sustitución en la citosina en posición 9 por una timina. No obstante, como la
proteína obtenida sigue siendo prolina; no hay efecto directo sobre la proteína final (P:pro3pro ó
P. p3=). Los alfa talasémicos afectan los componentes de la alfa globina en la hemoglobina nativa.
En la herencia dominante ligada al cromosoma X, no hay transición de varón a varón. Un varón
afectado con pareja sana tendrá 100% de sus hijas afectados y 100% de sus hijos sanos. Un
ejemplo es el síndrome de Rett (movimientos estereotipados con las manos y degeneración
motriz). Se puede distinguir entre una enfermedad autosómica dominante y una ligada al
cromosoma X viendo que en la 2da generación, NO hay herencia padre-hijo (varón-varón). En
herencia holóndrica (ligada al cromosoma Y) tiene muy pocos genes y poca relación de herencia.
Un ejemplo es la presencia de vello excesivo en las orejas.
Herencia autosómica recesiva: Patrón de herencia horizontal con uno o más hijos afectados, y
dónde la progenie y los progenitores están generalmente sanos. Tiene un riesgo de 25% de que se
presente la enfermedad bajo este patrón de herencia. Puede ser resultado de matrimonios
consanguíneos. Hay 25% de probabilidad de tener afectados, 25% de tener portadores sanos y
50% de tener individuos sanos. Algunos ejemplos de este tipo de herencia incluyen la fibrosis
quística, la anemia de células falsiformes, la fenilcetonuria, o el albisnismo. La hiperfenialanemia
es por deficiencia de PAH. Interviene en el metabolismo de phe, causando acumulación de líquidos
y retraso mental. Las sorderas también suelen tener herencia autosómica recesiva.
Los RFLPs son importantes para identificar alelos responsables de enfermedades monogénicas. Un
ejemplo es la anemia de células falsiformes, que es causada por cambios en cadenas beta de
hemoglobina y da lugar a hemoglobina S.
Herencia recesiva ligada a cromosoma X: Afecta principalmente a los varones. Nunca hay
transmisión de varón a varón. Padres e hijos son normalmente sanos. Puede haber tíos afectados.
Las madres portadoras tienen 50% de probabilidad de tener hijos afectados y 50% de tener hijas
portadoras.
Los alelos recesivos dan lugar a pérdidas de función totales o parciales en proteínas. La proteína
no se sintetiza o se sintetiza alteradamente, o en cantidades menores. Se debe a sustituciones de
un aminoácido por otro, codones de paro prematuros, o deleción/inserción de uno o varios
nucleótidos.
El hecho de que la proteína se altere o no depende del sitio donde ocurre el cambio, del aa
implicado en el cambio, y del tipo de mutación que origina el cambio. En Blink se puede hacer
comparación de árbol con otras especies. En dominios conservados se puede ver qué efecto tiene
el cambio de residuo en un dominio particular. Se puede usar polyphen para ver si una variación
de aa específica en una proteína da un resultado maligno o no (PSIscore alejado de 1). También se
pueden revisar dominios conservados en UNIPROT.
Mutaciones: Pueden ser germinales, o constitucionales y se pueden adquirir por herencia o ser de
novo en una célula germinal de uno de los padres. En el segundo caso, todas las células del cuerpo
adquieren la mutación. Un ejemplo son las enfermedades hereditarias, donde las mutaciones
somáticas se adquieren únicamente en el transcurso de la vida y son portadas únicamente por la
célula afectada y su descendencia.
Las enfermedades de inicio tardío muestran penetrancia relacionada a la edad. El genotipo queda
fijo pero el fenotipo se manifiesta antes de la adultez. En este caso, la penetrancia se asocia a la
edad.
Anticipación: Tendencia de algunas condiciones para ser más severas o tener menor edad de inicio
en generaciones sucesivas. Es frecuente en enfermedades causadas por mutaciones dinámicas
(nucleótidos repetidos en tándem) que son meióticamente inestables (microsatélites). Se pueden
localizar las mutaciones en cualquier parte del gen.