Вы находитесь на странице: 1из 4

BIOESTADSTICA Y ANLISIS DE DATOS

TEMA 1 ESTADI STICA Y DESCRIPTIVA


MONOVARIANTE
1. Introduccin a la estadstica
En la estadstica gracias a la informacin que extraemos de un grupo seleccionado mediante
tcnicas de muestreo de la poblacin obtenemos una muestra de personas que se ajustan al
objetivo de nuestra investigacin para mediante la estadstica descriptiva clasificarlas y
estimar unos ciertos parmetros poblacionales que ms tarde podamos extrapolar y aplicar a
grupos ms amplios, es decir a partir de una muestra seleccionada de la poblacin podemos
inferir frecuencias de parmetros en la propia poblacin (inferencia estadstica) !entro de
este mbito de inferencias debemos distinguir, adems de muestra"poblacin, los trminos
estadstico"parmetro#
Estadstico# caractersticas numricas de la muestra a partir de las cuales estimar un
parmetro (estimar lo mismo en el grupo amplio de individuos del que $emos extrado la
muestra) " Parmetro# caractersticas numricas de la poblacin
%a estadstica se emplea en muc$as situaciones, por ejemplo nos exponen una ancdota del
bombardeo de los aviones y se nos plantea si es correcto el modo de trabajo &ara adelantarse
a los enemigos se pretenda refor'ar en las flotas de aviones, mediante una optimi'acin con
restricciones de la estructura, las 'onas en las que reciban impactos $abitualmente de modo
que fuesen (nica y exclusivamente estas 'onas para evitar a)adir exceso de peso %a muestra
de aviones escogida era la de aquellos que volvan con impactos *es esto correcto+# no, por el
$ec$o de que no se trata de una muestra representativa ,de la poblacin- ya que estos aviones
que volvan con impactos no sufran alteracin de sus funciones bsicas, es decir, el $ec$o de
que volviesen no $ace el impacto recibido peligroso !e este modo, la muestra vlida deba ser
una escogida entre los aviones que no volvan sino que se estrellaban para refor'ar las 'onas
que en caso de colisin impiden la continuacin del vuelo e interrumpen sus funciones
2. Tipos de variables

.ipos de
variables
/ualitativas"/ategricas
(no medibles)
0ominales (no importa el
orden 1 sexo)
2rdinales (importa el orden 1
grado de dolor)
/uantitativas
(medibles)
!iscretas (valores aislados 1 n3 de
$ijos) 14 tablas de frecuencia
/ontinuas (valores infinitos entre
dos valores 1 altura)
En el caso de las variables cuantitativas podemos $acer una clasificacin y agrupar los valores
en rangos convirtindolos en categoras para as poder discreti'arlas para tratarlas como
variables cualitativas o categricas y aplicarles valores clnicos y diagnsticos &or ejemplo#
podemos discreti'ar la presin arterial es una variable cuantitativa pero si queremos que la
informacin sea aplicable mejor debemos $acerla cualitativa o categrica y de este modo son
las mediciones en rangos que se)alan si un sujeto es $ipo"normo"$ipertenso
2. 1 Variables cualitativas y cuatitativas !iscretas
%as variables cualitativas y cuantitativas discretas son aquellas de valores aislados, con ellas es
frecuente el uso de tablas de frecuencias en las que se exponen los valores para cada opcin
de la variable, por
ejemplo si es el sexo se
nos pueden mostrar el
n(mero de ni)os y de
ni)as (frecuencia) Es
com(n que en muestras
de tama)os grandes $aya alguna laguna de informacin, seran valores perdidos que aplicado
al ejemplo, aunque en este caso no $ay porque la muestra es peque)a, sera tener un
individuo que no sabemos si es ni)o o ni)a .ambin se muestra en la tabla el porcentaje de
unos sobre otros y el porcentaje vlido (con el que $abitualmente se trabaja en investigacin,
no tiene en cuenta los valores perdidos porque no son informacin exacta) o el porcentaje
acumulado que en este caso no tiene muc$o valor pero que puede ser utili'ado para
extrapolar datos en rangos
/omo modos de representacin grfica de los datos se emplean los diagramas de barras y los
de sectores (de quesito)
2. 1. 1 N"#eclatura !e las tablas !e $recuecia
Frecuencia absoluta (fi) 1 n(mero de veces que se repite un determinado valor en un
estudio estadstico
Frecuencia relativa (fr) 1 n(mero de casos de un parmetro de los existentes r =
]
N

&or ejemplo, podemos tener una fr(ni)os)567 as sabemos que la fr(ni)as)568 &or lo
tanto se cumple que fr9:fr;:<:frn59
Porcentaje - frecuencia relativa sobre cien r x 1uu

2. 2 Variables cuatitativas
= partir variables cuantitativas, es decir medibles podemos $acer tablas de frecuencia de clase
con datos como pueden ser medidas de la talla en cm de ni)os, esta informacin $a sido
categori'ada en rangos de die' en die' centmetros y los datos de la tabla son la frecuencia, el
porcentaje, el porcentaje vlido (excluye los valores perdidos) y el porcentaje acumulado que
en este caso nos puede servir para por ejemplo decir los ni)os que tienen una talla $asta >6
cm (seran un 89?) %a representacin grfica de estos datos se reali'a en histogramas
Estadsticos de tendencia
central
@edia
@ediana
&ercentiles
@oda
no tiene sentido en
una variable
cuantitativa pura
porque no $ay
nadie Aque mida
igual que tuA
se emplea en
variables cualitativas
o en cuantitativas
discreti'adas
Besumen con tendencia
central los datos para tratar
de expresar de forma
representativa cmo es la
muestra
0o debemos confundir los $istogramas con los diagramas de barras,
una de las diferencias es que en los diagramas de barras en el eje x
tenemos la variable cualitativa pero no valores como en los
$istogramasC otra diferencia sera que en el diagrama de barras los
datos se colocan en el eje y de modo que lo que da informacin es la
altura, pero en un $istograma no lo es porque la informacin se
extrae del rea debajo de la curva
=l depender de la precisin
de las medidas que se
realicen de la variable
cuantitativa podemos decir
que $ay valores infinitos,
cuanta ms precisin en medir la altura de un ni)o, ms decimales llevar la talla y ms
complicado que $aya otro ni)o que mida igual
3. Descriptiva monovariante
%a descriptiva monovariante com(nmente se emplea para variables cuantitativas puras) y se
caracteri'a por la presencia bsica de tres factores que describen los datos# forma, posicin y
dispersin
Estadsticos de dispersin
Bango
Bango intercuartlico
(relacionado con percentiles)
Darian'a (desviacin de la
media)
!esviacin estndard"tpica (a
partir de la varian'a)
/oeficiente de variacin (media
y desviacin estndard)
Beflejan $asta que punto estas medidas
de tendencia central son
representativas como sntesis de la
informacin
%as medidas de diispersin cuantifican
la separacin, dispersin y variabilidad
de los valores de la distribucin
respecto al central

%. 1 Esta!&stic"s !e te!ecia cetral

%a media para un conjunto de valores en rangos puede $acerse a partir las medias de los
intervalos multiplicada por los individuos sumando los resultados y dividiendo entre el total, es
la media agrupada por clases, de manera que el resultado es muy aproximado a $acer la
media real
En caso de que la muestra presente valores extremos/outlayers la media se desva muc$simo,
es sensible a valores extremos, mientras que la mediana es ms fiel al centro de equilibrio real
de la muestra Ee recomienda el uso de la mediana para evitar la desviacin de los datos
/uando no $ay presencia de estos valores ambas tendencias no difieren de manera
significativa respecto al resultado
Estadsticos morfolgicos
Eesgo
/oeficiente de &earson
/urtosis
%os estadsticos morfolgicos
permiten establecer una
relacin de forma con la
campana gausiana tpica
%a media x ! es el promedio de los datos, el valor
medio de la variable en la muestra
x =
x1 +x2 ++xn
n
=
xi
n
=1
n
xi# n(mero de valores concetros
n# tama)o de la muestra
Ejemplo: 3,12,9,6,1
x =
xi
n
I=1
n
=
S +12 +9 + 6 + 1
S
= 6.2
%a mediana x ! es el valor de la muestra que deja a
ambos lados el mismo n(mero de observaciones,
deja la mitad de los datos de la variable por debajo
una ve' $an sido ordenados de menor a mayor
03 casoso impar# 7,9;,>,F,9
9,7,F,>,9; 14 F
03 casos par# 9,7,9;,F,>,9
9,9,7,F,>,9; 14 media de los dos del centro 14
(F:7)";5GH
!ado un conjunto de datos, los percentiles y cuartiles
son aquellos elementos que una ve' $emos rdenado
la serie numrica de forma creciente y consideramos
que el centro es la mediana, sera el segundo cuartil
(I;), podemos fijarnos en#
1 El primer valor que supera o iguala al "#$ (primer
cuartil 1 I9) o al %#$ (tercer cuartil 1 I7)
1 &ara otros valores como el 96? o el J6? $ablamos
de los percentiles die& y ochenta (&96, &J6)
- El percentil ;H sera el 93 cuartil, &H65I;, &8H5I7
%a moda x ! es el valor ms repetido de una muestra,
sera el dato de la variable con mayor ferecuencia
absoluta Ee calcula a partir del recuento de los datos
.endencia
central
%. 2 Esta!&stic"s !e !is'ersi(
.enemos dos posibles poblaciones con sus dos posibles promedios, el rango es la diferencia
entre el mnimo y el mximo valor de una dispersin El rango intercuartilico es la distancia
entre el percentil 8H y el ;H (la mitad de las observaciones) .rabajar con estos datos da muc$o
juego porque dividimos las observaciones seg(n nos interesa Ei evaluamos el rango
intercuartlico podemos saber la precisin, un rango intercuartilico ms peque)o nos da una
precisin mayor porque el
recorrido es ms peque)o y
$ay ms densidad de
individuos, nos puede servir
para ver la precisin, la $eterogeneidad o la $omogeneidad de las muestras
&or ejemplo, en una tabla de tres columnas calculamos el promedio de la primera observacin
de valores, en la segunda ponemos el promedio de la primera y la tercera columna es la
diferencia del promedio y la primera medicin, esto nos sirve para valorar el promedio Ei
estamos anali'ando tensin sana y alguien est alejado tal ve' es porque el parmetro est
alterado Este es un modo de identificar si una observacin se ajusta al promedio o no Ei
sumamos la tercera columna o la de promedio dar
6 porque es el punto de equilibrio, a lo largo de la
tabla $abr compensaciones debido a la resta %a
suma de los valores al cuadrado no nos interesa
porque no nos aporta informacin pero si la
promediamos dividiendo entre las tensiones, s =s es como se obtiene la varian&a Ee divide
seg(n los grados de libertad que son (n19) porque si conocemos la media y eliminamos al a'ar
uno de los valores, lo podemos identificar
(pej# 7:8:96:9H:H5G6, si eliminamos el 8
sabemos el que me falta), podemos prescindir
de uno de los valores porque ya tenemos
definido el valor de la media En resumen, los grados de libertad son el n(mero elementos
independientes necesarios para definir el sistema K=02D=# anlisis de la varian'a
%a varian'a debe estar en las mismas unidades, no es (til para aplicar tal cual porque si estoy
midiendo mmLg me dar mmLgM;, me dar las unidades al cuadrado, para evitarlo le $acemos
la ra' cuadrada y obtendremos la desviacin estndar o desviacin tpica /uanto ms
dispersa sea, mayor es la desviacin estndar

/uando estimamos la varian'a en la muestra empleamos los grados de libertad porque
trabajamos con muestras para estimar parmetros que creemos que se comportan igual en la
poblacin, al utili'ar el promedio, utili'amos la suma y podemos prescindir de un caso
sabiendo el que quitamos %a variacin estndar solo tiene sentido si las medias son iguales
Bango intercuartlico
peque)o
: precisin, poco recorrido
Bango intercuartlico grande 1 precisin, ms recorrido
El coeficiente de variacin no tiene
unidades porque comparar desviaciones no
tiene sentido si las dispersiones tienen
diferentes unidades, es decir, si tienen
medias diferentes no podemos compararlas /omparando ambos coeficientes de variacin
sabremos cual tiene mayor dispersin porque el cv &odemos utili'ar la desviacin tpica
cuando tienen la media igual pero si las medias son diferentes tenemos que utili'ar el
coeficiente de variacin @s disperso, mayor variabilidad
EJERCICIO 1.2# /alcular la media, la desviacin tpica y la mediana de los dos grupos de datos
sabiendo que los datos del grupo = son n3 de $ijos de una familia y los del N pesos en Og de H
personas */ul de los dos grupos tiene mayor dispersin de datos+
PBQ&2 = PBQ&2 N
; H 9 8 7 ;

89 FJ 87 HF J6
@edia (x) 5
2+5+1+7+3+2
6
5 77 $ijos

@edia (x) 5
71+68+73+56+80
5
5 F>F Og
@ediana x! ';H $ijos
91;1;171H18

@ediana x! ' 89
HF R FJ 189 1871J6
!esviacin tpica (sx) 14
/alculamos la varian'a5H6FJ
(sx) 5 VS.u685 ;; $ijos

!esviacin tpica (sx) 14
/alculamos la varian'a 5 88GG
(sx) 5 V77.44 5 JJ Og
/oeficiente de variacin (cv) 5
s
x
5
2.2
3.3
56F8,
F8?
/oeficiente de variacin (cv)5
s
x
5
8.8
96.6
5697, 97?
El grupo =, es decir, los datos de la cantidad de $ijos tienen mayor dispersin que el peso de
las H personas de los datos del grupo N
Esta imagen demuestra que para comparar dispersin entre grupos como en la varian'a est
directamente implicada la media, solo podemos trabajar con la misma media /omo esto es
improbable, cuando las medias sean distintas, trabajaremos con el coeficiente de variacin
3. 3 Estadsticos morfolgicos

El sesgo es la estadstica respecto a un
promedio, cuando una cola est ms
estirada que la otra podemos decir
que tiene un sesgo, ser positivo si
tiene a :infinito, si tiende a Rinfinito
ser un sesgo negativo
%a frmula que se emplea para determina el sesgo es la que mide el grado de asimetra
Prado de asimetra# g9 5
(x- x)
3 n
l=1
ns
x
3

(sim)trica positiva# g9
mayor que 6 (es :) sesgado a
la derec$a, $acia :infinito
g956 sim)trica (sim)trica negativa# g9 ms
peque)a que 6 (es 1), sesgado
a la i'quierda, $acia 1 infinito

El coeficiente de Pearson es negativo cuando la mediana es muc$o mayor que la media pero si
es positivo se debe a que la media es muc$o mayor que la mediana
: =
x - x
s






Estadsticos
morfolgicos
Eesgo#
simetra respecto a un
promedio, puede estar
sesgado $acia la derec$a (:)
o $acia la i'quierda (1)
/oeficiente de &earson#
ndice para medir el grado de
relacin de dos variables
siempre y cuando ambas
sean cuantitativas
/urtosis#
proporcin de la varian'a
que se explica por la
combinacin de datos
extremos respecto a la
media en contraposicin
con datos poco alejados de
la misma
%a curtosis anali'a el grado de concentracin que presentan los valores alrededor de la 'ona
central de la distribucin
*esoc+rtica es una campana de
gauss
Platic+rtica (g;S7) ms dispersa de lo
esperado EpssS6
,eptoc+rtica (g;47) menos dispersa
de lo esperado Epss46
%a frmula que se emplea para calcular la curtosis es g2 =
(x- x )
4 n
i=1
nsx
4

ETEB/U/U2 9G# Ee consideran ;6 grupos de G pacientes con bronquitis crnica,
estudiando en cada paciente si fuma ms de un paquete diario (V) o no (0) %os
resultados obtenidos son#
!escribir la variable ,n3 de personas por grupo que fuman ms de un paquete diario-,
mediante# media, mediana, moda, desviacin tpica, coeficiente de variacin
Media (x) =
4+10+18+16
20
=
48
20
= 2.4 personas
Mediana (x) = 2.5
0 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4
Moda (x) = 3
Desviacin tpica (s) =1.2
Coeficiente de variacin =
s
x
=
1.2
2.4
= u.496, 49.6% respecto a la media
Sesgo, g1 =
(x- x)
3 n
l=1
ns
x
3
=-0.22 < 0 (asimetra negativa, sesgada
hacia la izquierda, es decir, hacia infinito)
Coeficiente de Pearson:
: =
x - x
s
=
2.4-2.5
1.2
= -u.u8S

Curtosis, g2 =
(x- x )
4 n
i=1
ns
x
4
=1.88 < 3 (platicrtica ms dispersa que una camapana
gausiana clsica)

$ttp#""WWWeduteXaorg"proyectosp$p"9"76H7

Вам также может понравиться