0 оценок0% нашли этот документ полезным (0 голосов)
106 просмотров4 страницы
Este documento presenta una introducción a la estadística descriptiva monovariante. Explica los tipos de variables, cualitativas y cuantitativas, y cómo se pueden representar y analizar los datos de cada tipo. También describe las medidas de tendencia central como la media, mediana y moda, y las medidas de dispersión como el rango e intervalo intercuartílico. Finalmente, introduce conceptos estadísticos morfológicos para comparar la forma de la distribución de datos con una campana de Gauss.
Este documento presenta una introducción a la estadística descriptiva monovariante. Explica los tipos de variables, cualitativas y cuantitativas, y cómo se pueden representar y analizar los datos de cada tipo. También describe las medidas de tendencia central como la media, mediana y moda, y las medidas de dispersión como el rango e intervalo intercuartílico. Finalmente, introduce conceptos estadísticos morfológicos para comparar la forma de la distribución de datos con una campana de Gauss.
Este documento presenta una introducción a la estadística descriptiva monovariante. Explica los tipos de variables, cualitativas y cuantitativas, y cómo se pueden representar y analizar los datos de cada tipo. También describe las medidas de tendencia central como la media, mediana y moda, y las medidas de dispersión como el rango e intervalo intercuartílico. Finalmente, introduce conceptos estadísticos morfológicos para comparar la forma de la distribución de datos con una campana de Gauss.
MONOVARIANTE 1. Introduccin a la estadstica En la estadstica gracias a la informacin que extraemos de un grupo seleccionado mediante tcnicas de muestreo de la poblacin obtenemos una muestra de personas que se ajustan al objetivo de nuestra investigacin para mediante la estadstica descriptiva clasificarlas y estimar unos ciertos parmetros poblacionales que ms tarde podamos extrapolar y aplicar a grupos ms amplios, es decir a partir de una muestra seleccionada de la poblacin podemos inferir frecuencias de parmetros en la propia poblacin (inferencia estadstica) !entro de este mbito de inferencias debemos distinguir, adems de muestra"poblacin, los trminos estadstico"parmetro# Estadstico# caractersticas numricas de la muestra a partir de las cuales estimar un parmetro (estimar lo mismo en el grupo amplio de individuos del que $emos extrado la muestra) " Parmetro# caractersticas numricas de la poblacin %a estadstica se emplea en muc$as situaciones, por ejemplo nos exponen una ancdota del bombardeo de los aviones y se nos plantea si es correcto el modo de trabajo &ara adelantarse a los enemigos se pretenda refor'ar en las flotas de aviones, mediante una optimi'acin con restricciones de la estructura, las 'onas en las que reciban impactos $abitualmente de modo que fuesen (nica y exclusivamente estas 'onas para evitar a)adir exceso de peso %a muestra de aviones escogida era la de aquellos que volvan con impactos *es esto correcto+# no, por el $ec$o de que no se trata de una muestra representativa ,de la poblacin- ya que estos aviones que volvan con impactos no sufran alteracin de sus funciones bsicas, es decir, el $ec$o de que volviesen no $ace el impacto recibido peligroso !e este modo, la muestra vlida deba ser una escogida entre los aviones que no volvan sino que se estrellaban para refor'ar las 'onas que en caso de colisin impiden la continuacin del vuelo e interrumpen sus funciones 2. Tipos de variables
.ipos de variables /ualitativas"/ategricas (no medibles) 0ominales (no importa el orden 1 sexo) 2rdinales (importa el orden 1 grado de dolor) /uantitativas (medibles) !iscretas (valores aislados 1 n3 de $ijos) 14 tablas de frecuencia /ontinuas (valores infinitos entre dos valores 1 altura) En el caso de las variables cuantitativas podemos $acer una clasificacin y agrupar los valores en rangos convirtindolos en categoras para as poder discreti'arlas para tratarlas como variables cualitativas o categricas y aplicarles valores clnicos y diagnsticos &or ejemplo# podemos discreti'ar la presin arterial es una variable cuantitativa pero si queremos que la informacin sea aplicable mejor debemos $acerla cualitativa o categrica y de este modo son las mediciones en rangos que se)alan si un sujeto es $ipo"normo"$ipertenso 2. 1 Variables cualitativas y cuatitativas !iscretas %as variables cualitativas y cuantitativas discretas son aquellas de valores aislados, con ellas es frecuente el uso de tablas de frecuencias en las que se exponen los valores para cada opcin de la variable, por ejemplo si es el sexo se nos pueden mostrar el n(mero de ni)os y de ni)as (frecuencia) Es com(n que en muestras de tama)os grandes $aya alguna laguna de informacin, seran valores perdidos que aplicado al ejemplo, aunque en este caso no $ay porque la muestra es peque)a, sera tener un individuo que no sabemos si es ni)o o ni)a .ambin se muestra en la tabla el porcentaje de unos sobre otros y el porcentaje vlido (con el que $abitualmente se trabaja en investigacin, no tiene en cuenta los valores perdidos porque no son informacin exacta) o el porcentaje acumulado que en este caso no tiene muc$o valor pero que puede ser utili'ado para extrapolar datos en rangos /omo modos de representacin grfica de los datos se emplean los diagramas de barras y los de sectores (de quesito) 2. 1. 1 N"#eclatura !e las tablas !e $recuecia Frecuencia absoluta (fi) 1 n(mero de veces que se repite un determinado valor en un estudio estadstico Frecuencia relativa (fr) 1 n(mero de casos de un parmetro de los existentes r = ] N
&or ejemplo, podemos tener una fr(ni)os)567 as sabemos que la fr(ni)as)568 &or lo tanto se cumple que fr9:fr;:<:frn59 Porcentaje - frecuencia relativa sobre cien r x 1uu
2. 2 Variables cuatitativas = partir variables cuantitativas, es decir medibles podemos $acer tablas de frecuencia de clase con datos como pueden ser medidas de la talla en cm de ni)os, esta informacin $a sido categori'ada en rangos de die' en die' centmetros y los datos de la tabla son la frecuencia, el porcentaje, el porcentaje vlido (excluye los valores perdidos) y el porcentaje acumulado que en este caso nos puede servir para por ejemplo decir los ni)os que tienen una talla $asta >6 cm (seran un 89?) %a representacin grfica de estos datos se reali'a en histogramas Estadsticos de tendencia central @edia @ediana &ercentiles @oda no tiene sentido en una variable cuantitativa pura porque no $ay nadie Aque mida igual que tuA se emplea en variables cualitativas o en cuantitativas discreti'adas Besumen con tendencia central los datos para tratar de expresar de forma representativa cmo es la muestra 0o debemos confundir los $istogramas con los diagramas de barras, una de las diferencias es que en los diagramas de barras en el eje x tenemos la variable cualitativa pero no valores como en los $istogramasC otra diferencia sera que en el diagrama de barras los datos se colocan en el eje y de modo que lo que da informacin es la altura, pero en un $istograma no lo es porque la informacin se extrae del rea debajo de la curva =l depender de la precisin de las medidas que se realicen de la variable cuantitativa podemos decir que $ay valores infinitos, cuanta ms precisin en medir la altura de un ni)o, ms decimales llevar la talla y ms complicado que $aya otro ni)o que mida igual 3. Descriptiva monovariante %a descriptiva monovariante com(nmente se emplea para variables cuantitativas puras) y se caracteri'a por la presencia bsica de tres factores que describen los datos# forma, posicin y dispersin Estadsticos de dispersin Bango Bango intercuartlico (relacionado con percentiles) Darian'a (desviacin de la media) !esviacin estndard"tpica (a partir de la varian'a) /oeficiente de variacin (media y desviacin estndard) Beflejan $asta que punto estas medidas de tendencia central son representativas como sntesis de la informacin %as medidas de diispersin cuantifican la separacin, dispersin y variabilidad de los valores de la distribucin respecto al central
%. 1 Esta!&stic"s !e te!ecia cetral
%a media para un conjunto de valores en rangos puede $acerse a partir las medias de los intervalos multiplicada por los individuos sumando los resultados y dividiendo entre el total, es la media agrupada por clases, de manera que el resultado es muy aproximado a $acer la media real En caso de que la muestra presente valores extremos/outlayers la media se desva muc$simo, es sensible a valores extremos, mientras que la mediana es ms fiel al centro de equilibrio real de la muestra Ee recomienda el uso de la mediana para evitar la desviacin de los datos /uando no $ay presencia de estos valores ambas tendencias no difieren de manera significativa respecto al resultado Estadsticos morfolgicos Eesgo /oeficiente de &earson /urtosis %os estadsticos morfolgicos permiten establecer una relacin de forma con la campana gausiana tpica %a media x ! es el promedio de los datos, el valor medio de la variable en la muestra x = x1 +x2 ++xn n = xi n =1 n xi# n(mero de valores concetros n# tama)o de la muestra Ejemplo: 3,12,9,6,1 x = xi n I=1 n = S +12 +9 + 6 + 1 S = 6.2 %a mediana x ! es el valor de la muestra que deja a ambos lados el mismo n(mero de observaciones, deja la mitad de los datos de la variable por debajo una ve' $an sido ordenados de menor a mayor 03 casoso impar# 7,9;,>,F,9 9,7,F,>,9; 14 F 03 casos par# 9,7,9;,F,>,9 9,9,7,F,>,9; 14 media de los dos del centro 14 (F:7)";5GH !ado un conjunto de datos, los percentiles y cuartiles son aquellos elementos que una ve' $emos rdenado la serie numrica de forma creciente y consideramos que el centro es la mediana, sera el segundo cuartil (I;), podemos fijarnos en# 1 El primer valor que supera o iguala al "#$ (primer cuartil 1 I9) o al %#$ (tercer cuartil 1 I7) 1 &ara otros valores como el 96? o el J6? $ablamos de los percentiles die& y ochenta (&96, &J6) - El percentil ;H sera el 93 cuartil, &H65I;, &8H5I7 %a moda x ! es el valor ms repetido de una muestra, sera el dato de la variable con mayor ferecuencia absoluta Ee calcula a partir del recuento de los datos .endencia central %. 2 Esta!&stic"s !e !is'ersi( .enemos dos posibles poblaciones con sus dos posibles promedios, el rango es la diferencia entre el mnimo y el mximo valor de una dispersin El rango intercuartilico es la distancia entre el percentil 8H y el ;H (la mitad de las observaciones) .rabajar con estos datos da muc$o juego porque dividimos las observaciones seg(n nos interesa Ei evaluamos el rango intercuartlico podemos saber la precisin, un rango intercuartilico ms peque)o nos da una precisin mayor porque el recorrido es ms peque)o y $ay ms densidad de individuos, nos puede servir para ver la precisin, la $eterogeneidad o la $omogeneidad de las muestras &or ejemplo, en una tabla de tres columnas calculamos el promedio de la primera observacin de valores, en la segunda ponemos el promedio de la primera y la tercera columna es la diferencia del promedio y la primera medicin, esto nos sirve para valorar el promedio Ei estamos anali'ando tensin sana y alguien est alejado tal ve' es porque el parmetro est alterado Este es un modo de identificar si una observacin se ajusta al promedio o no Ei sumamos la tercera columna o la de promedio dar 6 porque es el punto de equilibrio, a lo largo de la tabla $abr compensaciones debido a la resta %a suma de los valores al cuadrado no nos interesa porque no nos aporta informacin pero si la promediamos dividiendo entre las tensiones, s =s es como se obtiene la varian&a Ee divide seg(n los grados de libertad que son (n19) porque si conocemos la media y eliminamos al a'ar uno de los valores, lo podemos identificar (pej# 7:8:96:9H:H5G6, si eliminamos el 8 sabemos el que me falta), podemos prescindir de uno de los valores porque ya tenemos definido el valor de la media En resumen, los grados de libertad son el n(mero elementos independientes necesarios para definir el sistema K=02D=# anlisis de la varian'a %a varian'a debe estar en las mismas unidades, no es (til para aplicar tal cual porque si estoy midiendo mmLg me dar mmLgM;, me dar las unidades al cuadrado, para evitarlo le $acemos la ra' cuadrada y obtendremos la desviacin estndar o desviacin tpica /uanto ms dispersa sea, mayor es la desviacin estndar
/uando estimamos la varian'a en la muestra empleamos los grados de libertad porque trabajamos con muestras para estimar parmetros que creemos que se comportan igual en la poblacin, al utili'ar el promedio, utili'amos la suma y podemos prescindir de un caso sabiendo el que quitamos %a variacin estndar solo tiene sentido si las medias son iguales Bango intercuartlico peque)o : precisin, poco recorrido Bango intercuartlico grande 1 precisin, ms recorrido El coeficiente de variacin no tiene unidades porque comparar desviaciones no tiene sentido si las dispersiones tienen diferentes unidades, es decir, si tienen medias diferentes no podemos compararlas /omparando ambos coeficientes de variacin sabremos cual tiene mayor dispersin porque el cv &odemos utili'ar la desviacin tpica cuando tienen la media igual pero si las medias son diferentes tenemos que utili'ar el coeficiente de variacin @s disperso, mayor variabilidad EJERCICIO 1.2# /alcular la media, la desviacin tpica y la mediana de los dos grupos de datos sabiendo que los datos del grupo = son n3 de $ijos de una familia y los del N pesos en Og de H personas */ul de los dos grupos tiene mayor dispersin de datos+ PBQ&2 = PBQ&2 N ; H 9 8 7 ;
!esviacin tpica (sx) 14 /alculamos la varian'a 5 88GG (sx) 5 V77.44 5 JJ Og /oeficiente de variacin (cv) 5 s x 5 2.2 3.3 56F8, F8? /oeficiente de variacin (cv)5 s x 5 8.8 96.6 5697, 97? El grupo =, es decir, los datos de la cantidad de $ijos tienen mayor dispersin que el peso de las H personas de los datos del grupo N Esta imagen demuestra que para comparar dispersin entre grupos como en la varian'a est directamente implicada la media, solo podemos trabajar con la misma media /omo esto es improbable, cuando las medias sean distintas, trabajaremos con el coeficiente de variacin 3. 3 Estadsticos morfolgicos
El sesgo es la estadstica respecto a un promedio, cuando una cola est ms estirada que la otra podemos decir que tiene un sesgo, ser positivo si tiene a :infinito, si tiende a Rinfinito ser un sesgo negativo %a frmula que se emplea para determina el sesgo es la que mide el grado de asimetra Prado de asimetra# g9 5 (x- x) 3 n l=1 ns x 3
(sim)trica positiva# g9 mayor que 6 (es :) sesgado a la derec$a, $acia :infinito g956 sim)trica (sim)trica negativa# g9 ms peque)a que 6 (es 1), sesgado a la i'quierda, $acia 1 infinito
El coeficiente de Pearson es negativo cuando la mediana es muc$o mayor que la media pero si es positivo se debe a que la media es muc$o mayor que la mediana : = x - x s
Estadsticos morfolgicos Eesgo# simetra respecto a un promedio, puede estar sesgado $acia la derec$a (:) o $acia la i'quierda (1) /oeficiente de &earson# ndice para medir el grado de relacin de dos variables siempre y cuando ambas sean cuantitativas /urtosis# proporcin de la varian'a que se explica por la combinacin de datos extremos respecto a la media en contraposicin con datos poco alejados de la misma %a curtosis anali'a el grado de concentracin que presentan los valores alrededor de la 'ona central de la distribucin *esoc+rtica es una campana de gauss Platic+rtica (g;S7) ms dispersa de lo esperado EpssS6 ,eptoc+rtica (g;47) menos dispersa de lo esperado Epss46 %a frmula que se emplea para calcular la curtosis es g2 = (x- x ) 4 n i=1 nsx 4
ETEB/U/U2 9G# Ee consideran ;6 grupos de G pacientes con bronquitis crnica, estudiando en cada paciente si fuma ms de un paquete diario (V) o no (0) %os resultados obtenidos son# !escribir la variable ,n3 de personas por grupo que fuman ms de un paquete diario-, mediante# media, mediana, moda, desviacin tpica, coeficiente de variacin Media (x) = 4+10+18+16 20 = 48 20 = 2.4 personas Mediana (x) = 2.5 0 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 Moda (x) = 3 Desviacin tpica (s) =1.2 Coeficiente de variacin = s x = 1.2 2.4 = u.496, 49.6% respecto a la media Sesgo, g1 = (x- x) 3 n l=1 ns x 3 =-0.22 < 0 (asimetra negativa, sesgada hacia la izquierda, es decir, hacia infinito) Coeficiente de Pearson: : = x - x s = 2.4-2.5 1.2 = -u.u8S
Curtosis, g2 = (x- x ) 4 n i=1 ns x 4 =1.88 < 3 (platicrtica ms dispersa que una camapana gausiana clsica)