Вы находитесь на странице: 1из 8

Bioestadstica.

Definicin e importancia La Bioestadstica es la aplicacin de la estadstica en la biologa. Como los objetos de estudio de la Biologa son muy variados, tales como la medicina, las ciencias agropecuarias, entre otros, es que la Bioestadstica ha debido ampliar su campo para de esta manera incluir cualquier modelo cuantitativo, no solamente estadstico y que entonces pueda ser empleado para responder a las necesidades oportunas. De alguna manera, la Bioestadstica podra considerarse como una rama especializada de la informtica mdica (aplicacin de las comunicaciones y la informtica a la salud), complementada adems por la Bioinformtica (aplicacin de la tecnologa de las computadoras a la gestin y anlisis de datos biolgicos). Aplicaciones La aplicacin resulta hoy en da necesaria, en los campos: * salud pblica, que incluye: epidemiologa, nutricin, salud ambiental y en investigacin de servicios sanitarios. * Genmica y poblaciones genticas * medicina * ecologa * bioensayos La bioestadstica es aplicacin de la estadstica al campo de la medicina en el sentido ms amplio; los conocimientos de estadstica son esenciales en la planificacin, evaluacin e interpretacin de la investigacin. Entre las ms destacadas bondades en las cuales ha colaborado esta disciplina se cuentan: el desarrollo de nuevas drogas, comprensin de enfermedades crnicas como ser el cncer o el sida. En tanto, en la actualidad, la aplicacin de la Bioestadstica resulta ser fundamental y necesaria en mbitos como la salud pblica, entre los que se incluye la epidemiologa, salud ambiental, nutricin y servicios sanitarios, poblaciones genticas, medicina, ecologa y bioensayos. TRMINOS UTILIZADOS EN ESTADISTICA Curva Normal: La forma prevista de la distribucin normal. Datos: Son los valores cualitativos o cuantitativos mediante los cuales se miden las caractersticas de los objetos, sucesos o fenmenos a estudiar. Desviacin: Diferencia entre un valor y otro valor medio o tpico Entrevista y Encuesta: Son mtodos de recoleccin de datos, la entrevista es una serie de preguntas realizadas personalmente y la encuesta es llevada a cabo generalmente a travs de algn formulario que la persona debe llenar. Frecuencia: Nmero de veces en que se repite un dato. Frecuencia Acumulada: Es el nmero de estudiantes con calificaciones iguales o menores que el rango de cada intervalo sucesivo. (Frecuencia) Frecuencia Relativa: Es la proporcin entre la frecuencia de un intervalo y el nmero total de datos. Lmites del Intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase. Media Aritmtica: La media de un conjunto de N nmeros, X1, X2, X3, .. XN. Se define por: Mediana: La mediana de un conjunto de nmeros ordenados en magnitud es o el valor central o la media de los dos valores centrales. Ejemplo: El conjunto de nmeros 3,4,4,5,6,8,8,8 y 10 tiene mediana 6.

Ejemplo: El conjunto de nmeros 5, 5, 7, 9, 11, 12,15 y18 tiene mediana. Observacin de Campo: Es la observacin que realiza el investigador en el lugar donde ocurren los sucesos o eventos, para extraer los datos. Probabilidad: Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo determinado. Dichos eventos pueden ser medibles a travs de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una probabilidad de 0 y uno que ocurra con certeza es de 1. Tamao de la Muestra: Es la cantidad de datos que sern extrados de la poblacin para formar parte de la muestra. Validez: Importancia predictiva para los propsitos que se persiguen. LEVANTAMIENTO DE DATOS. Proceso mediante el cual el analista recopila datos e informacin de la situacin actual de un sistema, con el propsito de identificar problemas y oportunidades de mejora. Muestra aleatoria: muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad. DATOS NO AGRUPADOS Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin. Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las observaciones se distribuyen. DATOS AGRUPADOS Medidas de Dispersin: Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Medidas de Tendencia central: La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son : Media aritmtica Mediana Moda Media geomtrica Media armnica Los cuantiaos

Tipos de Datos: Variables estadsticas


Variable cualitativa Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal: Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasi cuantitativa Una variable cualitativa ordinal presenta modalidades no numricas, en las que existe un orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3,... Medallas de una prueba deportiva: oro, plata, bronce. Variable cuantitativa Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable contina Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales. DATOS AGRUPADOS 1.- Su fin es resumir la informacin. 2.- Generalmente, los elementos son de mayor tamao, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias. 3.- Se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque contemos con ms de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la informacin sea repetitiva, tambin debemos de verificar que los datos puedan clasificarse. Y que dicha clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos esta pidiendo). Una vez que ya hemos ordenado y clasificado, presentaremos la informacin obtenida mediante unatabla de frecuencias 4.- La agrupacin de los datos puede ser simple o mediante intervalos de clase. DATOS NO A GRUPADOS. 1.- Los datos son brutos(es decir, no se presentan clasificados) 2.- No es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene mucho sentido. 3.- Elementos que menor tamao (generalmente menor a 20 elementos).Esto no sucede as siempre. Aunque contemos con menos de 20 elementos, debe de verificarse que los datos no sean significativos, Esto es: que la informacin no sea repetitiva, de esta forma, sabremos que no se podr clasificar y por lo tanto ser resumida en una tabla de frecuencias. En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos. Procedemos a clasificarlos (si es posible, ya que tambin debemos de buscar la lgica al clasificar los elementos) para convertirlos en datos agrupados. Por ejemplo: *si nos pidieran obtener la informacin del territorio de cada uno de los estados de Mxico. No tiene mucho sentido que que tratemos de agrupar, ya que

solo nos pide el nombre del estado de la repblica mexicana y la extensin territorial. Para que necesitaramos una tabla de frecuencia de 32 elementos, cuando estos se repiten solo 1 vez? 4.- los datos no agrupados, tambin pueden ser ordenamos y de la misma forma, tambin se pueden obtener graficas, determinar media, desviacin estndar, etc. El hecho de que los datos no agrupados pueden ordenarse, no significa que se conviertan en datos agrupados. Ejemplos: Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados (es decir, vienen los 20 nios y as como te dan la edad as la anotas 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 nios) Estos son datos no agrupados por qu no los has clasificado y contado 1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 nios) Los datos no agrupados tambin los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no estn contabilizados ni clasificados solamente estn ordenados Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuntos nios haba de cada ao. (y siguen siendo 20 nios) Edad..........Frecuencia 1..................2 2..................4 3..................7 4..................4 5..................2 6..................1 Total............20 o tambin los puedes agrupar (Serie agrupada) en clases, rangos, grupos o intervalos por ejemplo de 2 aos para este caso (y siguen siendo 20) Edad..........Frecuencia 1-2...............6 3-4...............11 5-6...............3 Total.............20 Histograma: En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso.

Medidas de tendencia central. Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas como medidas de posicin. Entre las medidas de tendencia central tenemos: * Media aritmtica. * Media ponderada. * Media geomtrica. * Media armnica. * Mediana. * Moda. Media La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumandos. Por ejemplo, las notas de 5 alumnos en una prueba: Alumno Nota 1 6,0 Primero, se suman las notas: 2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6 3 3,1 Luego el total se divide entre la cantidad de alumnos: 4 7,0 27,6/5=5,52 5 6,1 La media aritmtica en este ejemplo es 5,52 La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos. Se le llama tambin promedio o, simplemente, media. Definicin formal Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas, esto es, tambin puede calcularse para variables agrupadas en intervalos. Moda La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se lleva. Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolacin.

Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-56-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5. Mediana La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que stos estn ordenados de menor a mayor. Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2: En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores: Se toma como mediana Existen mtodos de clculo ms rpidos para datos ms numerosos. Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto por interpolacin. Desviacin La desviacin estndar o desviacin tpica () es una medida de centralizacin o dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que representan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. La varianza representa la media aritmtica de las desviaciones con respecto a la media que son elevadas al cuadrado. Si atendemos a la coleccin completa de datos (la poblacin en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atencin slo a una muestra de la poblacin, obtenemos en su lugar la varianza maestral. Las expresiones de estas medidas son las que aparecen a continuacin. Expresin de la varianza maestral: .Hallar la desviacin media, la varianza y la desviacin tpica de la series de nmeros siguientes: 2, 3, 6, 8, 11. 12, 6, 7, 3, 15, 10, 18, 5. 2, 3, 6, 8, 11. Media

Desviacin tpica

12, 6, 7, 3, 15, 10, 18, 5. Media

Desviacin tpica

Ejercicios: Desviacin media, Varianza poblacional y muestral


EJERCICIO 1: Las edades de una muestra de turistas canadienses que vuelan de Toronto a Hong Kong, fueron 32 21 60 47 54 17 72 55 33 41

a) Calcule la amplitud de variacin

b) Determine la desviacin media

c) Evale la desviacin estndar

MEDIDAS DE DISPERSIN,: tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza). Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin. Amplitud o recorrido La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres veces al da y que cierto da los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cul es la Amplitud en pulsaciones para cada paciente? Para calcular la amplitud de los datos necesario identificar el valor ms grande y el valor ms pequeo del conjunto de datos de cada uno de los pacientes. Para el Paciente 1: A = 77 - 73 = 4 Para el Paciente 2: A = 90 - 64 = 26 La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas: En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.

Вам также может понравиться