Академический Документы
Профессиональный Документы
Культура Документы
Licenciatura en Informática
Taller de Investigación II
Proyecto de Investigación:
Tabla de Contenido
Tabla de Figuras
Figura 1. La Bioinformática como convergencia multidisciplinaria (Fuente: Coltell i Simon, 2004) ... 9
Figura 2. La Informática Biomédica (Fuente: Cañedo Andalia & Arencibia Jorge, 2004) .............. 12
Capitulo 1: Introducción
Es importante señalar que para desarrollar el software que ayuda a solucionar los
problemas de estas áreas de la biología se requiere de diferentes conocimientos que incluyen,
además de la informática, las matemáticas aplicadas, estadística, ciencias de la computación,
inteligencia artificial, química y bioquímica, entre otros.
El presente proyecto de investigación nos dará a conocer de qué trata esta disciplina, así
como su historia. También describirá su situación en nuestro país y nos enlistará las principales
áreas en la que los egresados de las carreras relacionadas a las Tecnologías de la Información y
Comunicación podrían ejercer su profesión si estuvieran interesados en la Bioinformática.
Dentro de éstos organismos, se en encuentran aquellos que tienen alguna relación con la
biología y ciencias afines, que sin duda alguna han encontrado un gran apoyo, gracias al aporte
de software y equipo especializado, así como de nuevas tecnologías, que han permitido un gran
avance dentro de estas dependencias. Es por esto que dentro del área de la Informática, ha
surgido un campo en el cual se agrupan todas estas herramientas y tecnologías: La
Bioinformática.
Y aunque esta disciplina nació en los 50 y se consolidó en los 80, en México apenas está
empezando a desarrollarse (Cañedo Andalia & Arencibia Jorge, 2004). Por tal razón, esta
investigación nos ayudará a conocer lo que es la Bioinformática, y las principales áreas en que se
aplica este tipo de informática y en las cuales, los informáticos podríamos desempeñarnos.
1.2. Justificación
¿Qué es la Bioinformática?
¿Cuáles han sido los hechos relevantes dentro de la historia del desarrollo de la
Bioinformática?
¿Cómo ha sido el desarrollo de la Bioinformática en México?
¿Cuál es la situación actual de la Bioinformática en México?
¿Cuáles son las principales áreas en las que se aplica la Bioinformática en México?
¿Qué tan bien (o mal) esta remunerado el trabajar en estas áreas?
1.6. Metodología
Lo que sí se definirá será los campos laborales en los que se podría aplicar la
Bioinformática en México.
Desde los siglos XVIII y XIX, los biólogos se enfrentaron a problemas relacionados con el
procesamiento masivo de la información. Darwin, por ejemplo en su viaje en el Beagle, recolectó
y procesó manualmente una multitud de datos sobre las especies (Cañedo Andalia & Arencibia
Jorge, 2004).
Una definición más general, la ubica como el estudio de la información biológica a partir
de la teoría de la información, la computación y las matemáticas. El reto más importante al que
se enfrenta esta ciencia es responder a la avalancha de datos que provienen del proyecto
"Genoma humano" y de la genómica (Rivas M., citado por Cañedo Andalia & Arencibia Jorge,
2004).
La Bioinformática
La Biología Computacional
La Biocomputación
Figura 2 La Informática Biomédica (Fuente: Cañedo Andalia & Arencibia Jorge, 2004)
Durante la segunda mitad del siglo XX, la bioquímica mostró un avance acelerado, sobre
todo, a partir del desarrollo de nuevas técnicas como la cromatografía, la difracción de rayos X,
el marcaje por isótopos y la aparición del microscopio electrónico, que abrieron el camino para el
análisis detallado y el descubrimiento de muchas moléculas y rutas metabólicas de la célula. Y con
ella, avanzaron, también con un ímpetu desconocido, la biología celular, la biología molecular, la
biotecnología y la genética, entre otras (Barreto Hernández, 2008).
Así, al principio de los años 60, el número creciente de secuencias de aminoácidos era uno
de los factores principales que contribuyó al desarrollo de la biología computacional (Cañedo
Andalia & Arencibia Jorge, 2004). La cantidad de datos que debían analizarse y la mejora del
rendimiento, y los precios más asequibles de las computadoras, hicieron posible su introducción en
los ambientes biológicos y académicos. La tecnología proporciona las herramientas prácticas
para que los científicos puedan explorar las proteínas y el ADN. (Cañedo Andalia & Arencibia
Jorge, 2004).
Paralelamente, una perspectiva científica surge en los años sesenta, con la idea de que la
genética podría estudiarse considerando la codificación, almacenamiento y el flujo de
información entre las moléculas. Esta perspectiva queda en el origen de la disciplina conocida
como biología computacional (Cañedo Andalia & Arencibia Jorge, 2004).
En esta década también, aparecieron los primeros signos de una convergencia entre la
biología, bioquímica, ingeniería e informática que conduciría después al nacimiento de la
Bioinformática. No obstante, el uso de las computadoras para la investigación biológica durante
estos años no se reconocía como un elemento importante para la investigación en el laboratorio
(Cañedo Andalia & Arencibia Jorge, 2004).
Hacia finales de los años 80, comenzó a emplearse el término bioinformática, aunque
algunos pioneros habían aplicado las computadoras con éxito a los problemas de la biología
molecular, incluso una década antes de que fuera posible la secuenciación del ADN. Entre estas
aplicaciones, Margaret Dayhoff desarrolló los primeros programas para determinar la secuencia
de aminoácidos de una proteína en 1965 y preparó el primer banco de datos de secuencias de
proteínas que luego evolucionó para convertirse en PIR (Protein Information Resource) en 1983
(Cañedo Andalia & Arencibia Jorge, 2004).
aplicaron redes de neuronas artificiales, modelos de Markov ocultos o métodos de clustering para
analizar los conjuntos de datos no caracterizados (Cañedo Andalia & Arencibia Jorge, 2004).
Otro avance importante y fundamental fue el desarrollo del WWW, como un medio
universal para acceder a bases de datos biológicas y programas bioinformáticos. Esto permitió el
desarrollo de muchas bases en las que los investigadores pueden encontrar la información que
requiere su trabajo experimental. El WWW también es la infraestructura que soporta al
intercambio activo de información entre investigadores (Cañedo Andalia & Arencibia Jorge,
2004).
En el año 2003, con la conclusión del proyecto concertado por la Human Genome
Organization desde el año 1988, fue posible determinar el orden preciso de los cerca de 3 200
millones de nucleótidos que forman nuestro genoma y elaborar un mapa que ubica a sus genes.
Así es como nacieron la medicina molecular, y la Genómica, que estudia sistemáticamente, y a
escala global, la estructura y función de todos los genes de una especie. (Coltell O. y Corella D.,
citado en Cañedo Andalia & Arencibia Jorge, 2004).
Durante los últimos años, la bioinformática ha trabajado con muchas bases de datos que
almacenaban información biológica en la medida que aparecía. Esto conllevaba a que muchos
científicos se quejaran de la creciente complejidad que representaba encontrar información útil en
un "laberinto de datos". Para mejorar esta situación, se desarrollaron técnicas que integran la
información dispersa, gestionan bases de datos distribuidas, las seleccionan automáticamente,
evalúan su calidad y facilitan su accesibilidad a los investigadores (Cañedo Andalia & Arencibia
Jorge, 2004).
La revelación de la secuencia completa del genoma humano posibilitó conocer las causas
moleculares de las enfermedades, así como descubrir la significación de las diferencias genéticas
entre las personas para el desarrollo de enfermedades (Barreto Hernández, 2008).
La industria médica se erige sobre los conocimientos, los recursos y las tecnologías
emanadas de dicho proyecto para lograr una mejor contribución de la genética a la salud
humana. Durante los últimos años, la genética ha adquirido una significación especial para el
diagnóstico, seguimiento y tratamiento de las enfermedades (Cañedo Andalia & Arencibia Jorge,
2004).
Sin embargo, la secuenciación -determinación del orden en el que se disponen las bases
que forman una molécula de DNA- del genoma humano ha originado cantidades enormes de
información que debe procesarse para poderse utilizar convenientemente. Los datos obtenidos
deben analizarse. Es imprescindible encontrar la manera de almacenarlos para poder
recuperarlos y distribuirlos cuando se requiera. En todas las fases anteriores, la informática ocupó
un lugar sobresaliente para poder transformar los datos en información y ésta en conocimiento
(Barreto Hernández, 2008).
El crecimiento de los datos biológicos, que han pasado de 606 secuencias de ADN
almacenadas en 1982, a más de 82 millones hoy en día, fue impulsado por el desarrollo de la
técnica Reacción en Cadena de la Polimerasa (PCR) en el año de 1986, y ahora por la aparición
El inmenso volumen de datos que se está generando, una vez almacenados, requiere
también de nuevos modelos de análisis que permitan hacerlos comparables en la medida que son
obtenidos utilizando un variado conjunto de técnicas y condiciones experimentales. Así mismo, la
enorme generación de datos hace que muchos grupos de investigación en bioinformática se
encuentren desarrollando nuevas metodologías estadísticas de análisis que modelen factores de
variación, y permitan tener una medida estándar y confiable de la expresión de genes, que
posibiliten su comparación independientemente de la técnica experimental usada (Barreto
Hernández, 2008).
Aunque aún estamos lejos de entender por completo los sistemas biológicos debido a su
complejidad por tratarse de sistemas naturales, y de que no es posible conocer todas las
interacciones que ocurren a cierto nivel para modelarlas de forma integral, un esfuerzo mayor en
el desarrollo de herramientas bioinformáticas para la integración y modelación, nos acercará
cada vez más a esto, permitiéndonos nuevas e interesantes aplicaciones (Barreto Hernández,
2008).
Sin embargo, la bioinformática actual es uno de los pilares del estudio de los sistemas
vivos desde el punto de vista sistémico, y de hecho es conocida también como “Biología de
Sistemas”. En las ciencias de la salud comienza a revelarse su utilidad de forma paulatina, ya que
se ha observado un gran avance en la caracterización de la variabilidad genética en seres
La bioinformática combina dos de las tecnologías clave para el siglo XXI: la biotecnología
y la informática; y ha sido una de las primeras disciplinas científico-técnicas en aprovechar las
características de los sistemas basados en Internet para desarrollar sus soluciones y posibilitar la
compartición de datos, la distribución de software y el trabajo de colaboración entre grupos y
científicos (Martín Sánchez, 2000).
Los investigadores de esta área han luchado para desarrollar sus propios campos
independientes, con departamentos, conferencias y revistas científicas especializadas. En ambos
casos, la mayoría de los pioneros tenían alguna formación en campos técnicos como la informática
o la ingeniería. Así mismo, los profesionales de la bioinformática sienten que necesitan demostrar
que su especialidad es una disciplina científica establecida, que merece reconocimiento
académico y profesional. Sólo así, pueden lograrse programas universitarios, laboratorios
independientes, mecanismos propios de financiación y el desarrollo de verdaderas carreras
profesionales dentro de los departamentos tradicionales de biología, medicina o informática
(Cañedo Andalia & Arencibia Jorge, 2004).
En la medida que se engrana la información sobre los genes con la información sobre las
enfermedades, se asiste a una convergencia de la informática clínica con la bioinformática, que
se reflejará, en el futuro cercano, en la introducción de datos genéticos en la historia clínica de los
pacientes o en nuevos sistemas de apoyo a la toma de decisiones para el diagnóstico y la
terapia, entre otras áreas (Cañedo Andalia & Arencibia Jorge, 2004).
Esta disciplina se está desarrollando en nuestro país de manera discreta, pero se está
trabajando. Algunas de las instituciones que están desarrollando trabajos en esta área son
(Hernández Valdelamar, 2002):
Según este estudio, la Genética Médica constituye la especialidad que ha recibido mayor
influencia de la Bioinformática desde su aparición en 1990 (42,5 %), seguida por la Bioquímica
Clínica (19,5 %), así como por las Ciencias Farmacéuticas (5,8 %), la Filogenética (4,2 %), las
Neurociencias (3,8 %), la Inmunología (3,2 %), la Estadística Médica (2,5 %), la Fisiología (2,5 %)
y la Oncología (2,3 %) (Perezleo Solórzano, Arencibia Jorge, Conill González, Achón Veloz, &
Araújo Ruiz, 2003).
Para la medicina, la obtención del genoma humano, se reveló como una fuente de
conocimiento muy valiosa sobre las relaciones entre la estructura de los genes humanos y los
procesos fisiopatológicos. La consecución de la secuencia completa del genoma de nuestra
especie posibilitó, por un lado, conocer las causas moleculares de las enfermedades y por otro,
descubrir cómo las diferencias genéticas entre las personas causan o contribuyen al desarrollo de
enfermedades (Cañedo Andalia & Arencibia Jorge, 2004).
presencia y la regulación de las funciones biológicas que realizan de las diferentes entidades
moleculares en los organismos vivos. (Sánches F. y García V, citado en Cañedo Andalia &
Arencibia Jorge, 2004).
La medicina genómica, que se define como el uso rutinario de análisis genotípicos para
mejorar los cuidados de salud del individuo, tiene sus pilares en la capacidad de conocer los
polimorfismos de los nucleótidos de cada individuo y de modificar el medio ambiente en que se
desarrolla. El amplio espectro de la medicina genómica incluye un gran número de enfermedades,
atendidas por diversas disciplinas clínicas. El estudio de la función de los genes y sus
polimorfismos, asociados a enfermedades comunes, permitirán conocer mejor los mecanismos
moleculares que originan estas enfermedades, así como abrir nuevas oportunidades para su
prevención y tratamiento. (Doegemines.org, citado en Cañedo Andalia & Arencibia Jorge, 2004).
En el cáncer, los genomas de las células afectadas son reordenados en complejas y/o aún
impredecibles maneras. Se realizan esfuerzos masivos de secuenciación para identificar
sustituciones individuales de bases (o puntos de mutación de nucleótidos) todavía desconocidos en
una variedad de genes en el cáncer. Los bioinformáticos continúan produciendo sistemas
automatizados para gestionar el importante volumen de datos de secuencias obtenido, y crean
nuevos algoritmos y software para comparar los resultados de secuenciación con la creciente
colección de secuencias del genoma humano y de los polimorfismos de la línea germinal. Se están
utilizando nuevas tecnologías de detección física, como los microarrays de oligonucleótidos para
identificar pérdidas y ganancias cromosómicas (técnica denominada hibridación genómica
comparativa), y los arrays de polimorfismos de nucleótido simple para detectar puntos de
mutación conocidos. Estos métodos de detección miden simultáneamente bastantes cientos de miles
de posiciones a lo largo del genoma, y cuando se usan con una alta productividad para analizar
miles de muestras, generan terabytes de datos por experimento. De esta forma las masivas
cantidades y nuevos tipos de datos proporcionan nuevas oportunidades para los bioinformáticos.
A menudo se encuentra en los datos una considerable variabilidad, o ruido, por lo que métodos
como el de los modelos ocultos de Márkov y el análisis de puntos de cambio están siendo
desarrollados para inferir cambios reales en el número de copias de los genes (número de copias
de un gen particular en el genotipo de un individuo, cuya magnitud puede ser elevada en células
cancerígenas) (Bioinformática - Wikipedia, 2010).
3.3. Epidemiología
La Biología evolutiva es el estudio del origen ancestral de las especies, así como de su
cambio a través del tiempo. La informática ha apoyado a los biólogos evolutivos en diferentes
campos clave. Ha permitido a los investigadores (Bioinformática - Wikipedia, 2010):
Los esfuerzos futuros se centrarán en reconstruir el cada vez más complejo árbol
filogenético de la vida (Bioinformática - Wikipedia, 2010)
En los últimos años, la Minería de Datos (Data Mining) ha experimentado un auge como
soporte para las filosofías de la gestión de la información y el conocimiento, así como para el
descubrimiento del significado que poseen los datos almacenados en grandes bancos. Ésta
permite explorar y analizar las bases de datos disponibles para ayudar a la toma de decisiones;
además de facilitar la extracción de la información existente en los textos (Minería de Textos -
Text Mining-), así como crear sistemas inteligentes capaces de entenderlos (Febles Rodríguez &
González Pérez, 2002).
Ese conocimiento debe presentarse de una forma que se pueda entender sin un esfuerzo
excesivo.
Las componentes básicas de los métodos de la minería de datos son (Febles Rodríguez &
González Pérez, 2002):
Algunas de las técnicas más comunes usadas en la minería de datos son (Febles Rodríguez
& González Pérez, 2002):
Así, por ejemplo, en el caso de descubrir comportamientos de una misma patología, los
sistemas de Minería de Datos pueden encontrar subgrupos, dentro de una determinada
patología, que tienen características comunes dentro del mismo subgrupo y diferentes entre los
diversos subgrupos. Estas clasificaciones puede encontrarlas el sistema de manera automática, es
decir, a partir de las relaciones que el sistema encuentra por sí mismo y que no tienen por qué
atenerse a las clasificaciones clásicas realizadas con interés académico, clínico o fisiopatológico
(Cañedo Andalia & Arencibia Jorge, 2004).
3.7. e-Salud
especies, así como de sus descripciones, distribuciones, información genética, estado y tamaños de
las poblaciones, necesidades de su hábitat, y cómo cada organismo interactúa con otras especies.
Se usa software especializado para encontrar, visualizar y analizar la información; y, lo que es
más importante, para compartirla con otros interesados. La simulación computacional puede
modelar cosas tales como dinámica poblacional, o calcular la mejora del acervo genético de una
variedad (en agricultura), o la población amenazada (en biología de la conservación). Un
potencial muy excitante en este campo es la posibilidad de preservar las secuencias completas
del ADN, o genomas, de especies amenazadas de extinción, permitiendo registrar los resultados
de la experimentación genética de la Naturaleza in silico para su posible reutilización futura, aún
si tales especies fueran finalmente perdidas (Bioinformática - Wikipedia, 2010).
Capitulo 4. Resultados
En México, apenas se está empezando la exploración de este nuevo campo, por lo que no
se cuenta con mucha información al respecto. Afortunadamente son muchas las disciplinas en las
que se puede incorporar los investigadores y trabajadores relacionados con las áreas de las
tecnologías y la computación.
Conclusiones
Sin duda, la Bioinformática es un área que podría dar grandes oportunidad de desarrollo
a nuestro país, debido a la gran ayuda que proporciona la ciencia de la Biología y a todas las
disciplinas que se derivan de ellas.
Apenas se está empezando, y de forma discreta, este gran camino, pero si se le invierte el
suficiente apoyo económico y el esfuerzo de los investigadores, México podría ser un fuerte
desarrollador de herramientas y técnicas para el análisis de datos biológicos.
Referencias Bibliográficas
Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: en busca de los secretos
moleculares de la vida. Acimed .
Febles Rodríguez, J. P., & González Pérez, A. (2002). Aplicación de la Minería de Datos
en la Bioinformática. Acimed , 10 (2).
Guigó Serra, R. (2000). Bioinformática ¿una ciencia sin científicos? (J. Camí, Ed.) Quark
(18).
Perezleo Solórzano, L., Arencibia Jorge, R., Conill González, C., Achón Veloz, G., & Araújo
Ruiz, J. (2003). Impacto de la Bioinformática en las ciencias biomédicas. Acimed , 11 (4).