Академический Документы
Профессиональный Документы
Культура Документы
B IB L IO T E C A D E L U N IV E R S IT A R IO
M AN UA LES /M E D IC IN A
Estadística médica
DOMINGO A. LEDESMA
INTRODUCCION . . . : ................................................................. XI
PRIMERA PARTE
CONCEPTOS FUNDAMENTALES
son, 15. *
III. REPRESENTACIONES GRAFICAS........................................ 17
Cuadriláteros, 17; Sectores, 18; Histograma, 20; Ejemplo de his-
tograma, 21; Ejemplo, 22; Curvas, 22; Curva normal o de Gauss.
23.
IV. PARAMETROS ESTADISTICOS ........................................... 25
Parámetros fundamentales, 25; Parámetros derivados, 25; Pará
metros de posición, 26; Proposición de Cauchy, 30; Promedio y
mayoría, 30; Desvío, 30; Parámetros de dispersión, 31; Media
del universo, 34; Parámetros derivados, 3S; Promedio ponderado.
38; Error probable, 39; Error relativo, 39.
Vil
SECUNDA PARTE
LA MUESTRA NORMAL NUMEROSA O MUESTRA NORMAL DE
VIL VARIANCIA...................................................................... 61
la. observación. 61; 2a. observación. 62; 3a. observación, 63;
CUARTA PARTE
LA MUESTRA B1NOMIAL NUMEROSA O MUESTRA DE BERNOUILLI
XIII. DISTRIBUCION BINOMIAL ............................................... 131
XIV. SERIE BINOMIAL DE BERNOUILLI................................... 145
XIX. ASOCIACION.........................................................
Correlación, 263; Probabilidad de un coeficiente de o
dón, 271; Regresión, 273; Tarjetas y dameros, 278;
pruebas de correlación, 287; Análisis de la covarianza, 29
X
INTRODUCCION
XI
ESTADISTICA MEDICA
1. Conceptos fundamentales.
2. El estudio estadístico de Ias muestras numerosas con una distri
bución normaI de las frecuencias de sus datos, o sea de lo que puede
llamarse muestra de GAUSS. y de las técnicas que le son aplicables
3. El estudio estadístico de las muestras poco numerosas también con
una distribución normal de la frecuencia de sus daros o muestras de
GOSSET "STUDENT", y de ¡as técnicas correspondientes
4. El estudio de las grandes muestras con una distribución binomial
de la frecuencia de sus datos, o muestra de BERNOUILLI, y sus técnicas
5. Las grandes muestras con un resultado poco numeroso y una dis
tribución de frecuencia próxima a la binomial o muestras de POISSON y
sus técnicas.
6. El método de PEARSON o de J i Cuadrado fx1) para la compara
ción entre una muestra real y una teórica, y su técnica en los diversos
XUI
CONCEPTOS FUNDAMENTALES
CAPITULO I
3
Por trabajar con números la estadística participa de las ciencias ma
temáticas, pero al igual que en muchas otras ramas del conocimiento
-física, química, etc.,- éstas son el instrumento que debe ser aplicado a
una materia, en este caso las observaciones o experiencias similares valo-
Importancia en medicina
La importancia de la estadística en medicina se debe a la capacidad
de la primera en valorar la magnitud del azar en la segunda.
El azar o casualidad
Estc azar pudo haber tenido una gran participación en los resultados,
o, por el contrario, sólo una insignificante, pero de antemano eso no
podemos saberlo; es decir, directamente, al azar no podemos medirlo.
Necesitamos por lo tanto de algún procedimiento indirecto capaz de
medir el tamaño, o sea la magnitud de la importancia del azar. Este mé-
CONCEPTOS GENERALES
vención del azar es superior al 5%, opinan que dicho resultado puede
considerarse debido simplemente a la casualidad.
5
Observación y dato
La muestra es el conjunto de observaciones valoradas cuantitativamen
te y también el conjunto de los valores numéricos individuales. Estos, los
valores numéricos individuales, se denominan “datos”. Por ejemplo, el
conjunto de las observaciones de las horas dormidas por los pacientes del
ejemplo dado anteriormente constituye los datos. El dato es el valor numé
rico de la observación individual.
Cuando las observaciones se clasifican cualitativamente (por ejemplo:
gordos, medianos o flacos), el conjunto de observaciones de igual clasifi
cación constituye una clase. A las clases se las simboliza genéricamente
con una x minúscula. En este caso el valor de cada observación es igual a
Luego el dato también debe ser clasificado, esto es. reconocido como
una cantidad continua o discontinua. Por ejemplo, si so trata del número
de glóbulos rojos por milímetros cúbicos, el dato es discontinuo, pues en
un volumen dado de sangre no puede haber sino un número entero de
glóbulos rojos y la diferencia con otro volumen de sangre implicará tam-'
bien un número entero de ellos.
Pero'si se trata de la hemoglobina contenida en un volumen de san
gre, el dato será continuo, ya que la cantidad será un número fraccionado
de la unidad que se utilice (difícilmente un número entero de esa unidad)
y podrá presentar toda la gama posible de valores intermedios entre un
número entero de unidades y el siguiente. La diferencia con otro volumen
de sangre será asimismo un número fraccionado de unidades, difícilmente
Tabulación
Finalmente, los datos deben ser tabulados, es decir presentados en
una tabla, colocándolos en columna vertical (aunque puede hacérselo tam
bién en línea horizontal).
A partir de este momento se está en condiciones de iniciar el análisis
estadístico propiamente dicho. Así la muestra de las horas de sueño pro
ducidas por un hipnótico deben ser tabuladas como muestra el cuadro 1.
EJEMPLO DE TABULACION
(Horas de sueño producidas por un hipnótico
CAPITULO II
CONCEPTOS PARTICULARES
ESTADISTICA MEDICA
Serie estadística
El resultado del ordenamiento es transformar un conjunto desorde
nado de números en una serie ordenada de ellos. Por tratarse de los datos
o valores de observaciones similares, el conjunto ordenado de los datos se
denomina serie estadística.
Cada uno de los datos toma ahora el nombre genérico de término de
la serie. La serie consta de tantos términos como de observaciones la
Intervalo o módulo
Cuando los grupos comprenden no solamente datos iguales, sino muy
próximos, es necesario fijar los límites dentro de los cuales tendrán cabida
los datos de cada grupo. La distancia entre los límites de cada grupo se
denomina intervalo o módulo,
10
CONCEPTOS PARTICULARES
Por ejemplo, si se trata de una muestra formada por observaciones de
hemoglobina expresada en porcentaje de un valor que se considera nor
mal, podemos reunir los datos comprendidos entre SI y 60 en un solo
gmpo, los entre 61 y 70 en otro, los entre 71 y 80 en otro, etcétera. En
este caso decimos que el intervalo o módulo es 10.
Como valor representativo del grupo se toma el equidistante a los
límites del mismo. En los grupos del ejemplo dado se toman como repre
sentativos los valores SS para el 1°, 65 para el 2°, 75 para el 3°, etcétera.
Por lo tanto, se considera como si cada una de las observaciones del
grupo valiera lo que el valor representativo del grupo. La realidad es que
unos valen más y otros menos, pero la verdad es que muy probablemente
esos más y esos menos, es decir esas diferencias, se compensarán o el error
será muy pequeño, lo cual autoriza a proceder a dicho agrupamiento.
Frecuencia
Es el número o cantidad de observaciones iguales o semejantes de la
muestra. Es. por lo tanto, la población de los grupos. Se denomina igual
mente frecuencia absoluta.
También, frecuencia es la relación entre esa cantidad o población del
grupo y la cantidad o población total de la muestra. Se llama entonces
frecuencia relativa. A esa frecuencia algunos autores la denominan proba
bilidad.
Se la simboliza generalmente por una f minúscula.
En el primer caso, frecuencia es simplemente f.
En el segundo, frecuencia =* -f-
En el primer caso, la suma de las frecuencias es igual a la población
de la muestra,
n = 2 f.
En el segundo, la suma de las frecuencias es igual a la unidad,
Probabilidad
Es la relación entre la cantidad de hechos equivalentes y la cantidad
ESTADISTICA MEDICA
Distribución de frecuencias
Con la ordenación de los grupos según la ordenación de los datos,
quedan también ordenadas las frecuencias de acuerdo con la ordenación
de los datos. Esta ordenación especial se denomina distribución de fre
cuencias (d. de f.).
La d. de f. es la serie de frecuencias de los datos ordenados, con espe
cificación de los datos o de las clases a que correspondan.
Al tabular los grupos, éstos van en la primera columna encabezada
por una x, hallándose cada grupo representado por el dato repetido o
representativo del grupo.
En la segunda columna, encabezada por una f, va la frecuencia del
grupo. Ya dijimos que la suma de esta columna (2f) es igual a la pobla
ción de la muestra (n).
En la tercera columna, encabezada por la multiplicación indicada f x
van los productos de multiplicar el dato repetido o representativo del gru
po por su frecuencia. La suma de esta columna (Efx) es igual al tamaño
de la muestra (Sfx —T).
Aun cuando las muestras pueden tener distribuciones de frecuencia
muy variadas, en medicina las distribuciones más comunes son estas cua
tro: 1) la de Gauss; 2) la Gosset "Student” (derivada de la anterior); 3) la
de Bernouilli y 4) la de Poisson (vecina a la anterior).
Las dos primeras corresponden a datos continuos y las dos segundas a
datos discontinuos o discretos (véase clasificación de los datos).
12
CONCEPTOS PARTICULARES
ba entre 56 y 65
66 y 75
76 y 85
86 y 95
96 y 105
106 y 115
116 y 125
126 y 135
136 y 145
13
Ejemplo de distribución binomial
Se investigó el grupo sanguíneo de 36 personas hijos de padre y ma
dre grupo AB y se encontró lo siguiente:
CONCEPTOS PARTICULARES
18 = 2X 3X 3
(3 + 3)2 = 3* + 2 X 3 X 3 + 3’ .
15
desarrollo del binomio elevado:
REPRESENTACIONES GRAFICAS
Cuadriláteros
17
ESTADISTICAMEDICA
Cuadro 3
EJEMPLO DE REPRESENTACION GRAFICA: CUADRILATEROS
lProporción de nacimientos según el sexo¡
900 : 10 :: 850 : X
10 X 850
18
REPRESENTACIONES GRAFICAS
Hislograma
Cuando los grupos son mis numerosos es preferible recurrir al histo-
grama: éste, como se verá, corresponde a las representaciones ortogonales,
es decir, que se funda en dos ejes que se corlan perpendieularmente (ejes
ortogonales o coordenadas cartesianas).
Aqui se trata también de cuadriláteros, pero pegados unos a otros.
Además, las bases de éstos, las que descansan sobre el eje horizontal o de
las abscisas, representan y miden lo que los módulos o intervalos (i) de los
grupos; y las alturas, o sea las ordenadas, la población o frecuencia del
grupo dividido por el intervalo (f/i); en esta forma el área del cuadrilátero
representa la población del grupo, y el área total del hislograma, la pobla
ción de la muestra.
2(hX i) = £ f = n
2(h X i) = £ - = = — = 1.
20
ENTACIONES GRAFICAS
Ejemplo de histograma
la correspondiente es el que r
Cuadro 5
EJEMPLO DE REPRESENTACION GRAFICA: HISTOGRAMA
Edades de 488 pacientes afectadas de carcinoma uterino
21
ESTADISTICA MEDICA
Ejemplo
Las 488 pacientes con cáncer de cuello recién vistas pueden ser tabu
ladas como se observa a continuación:
Cuando los grupos son muy numerosos, lógicamente los intervalos son
relativamente muy pequeños: en este caso, si la diferencia de población
entre grupos próximos es también muy pequeña, el polígono se confunde
con una curva. Lo mismo ocurre en el histograma con la línea quebrada
formada por las bases superiores de los cuadriláteros y las porciones co
rrespondientes de los lados laterales de los mismos. Esta línea quebrada,
RFPRFSF.NTACIONES GRAFICAS
Cuadro 6
EJEMPLO DE REPRESENTACIONGRAFICA: POLIGONO
Edades de 488 pacientes afectadas de carcinoma uterino
CURVA DE GAUSS
23
CAPITULO IV
PARAMETROS ESTADISTICOS
srsssrsss
ESTADISTICA MEDICA
Parámetros de posición
Algunos de los parámetros fundamentales tratan de fijar la posición
del valor que pueda darse como representativo de los valores de los datos
de la muestra. Son los llamados parámetros de posición, o también pro
medios.
Según sea el procedimiento que se siga para la elección de este pará
metro, el promedio se denomina modo, mediana o media.
26
Como la suma de los dalos se denomina tamaño de la muestia y la de
las obseivaciones población, se puede decir que la media aritmética es
igual al tamaño de la muestra dividida por la población de la misma.
- 1 x - I = S xf
m “ Sf = ' ” 2 f
La media aritmética cr el promedio más utilizado en medicina. Presen
ta, sin embargo, algunos puntos débiles, de los cuales los mis importantes
son: 1°) Frecuentemente no corresponde a ningún dato de la muestra. 2°)
Puede pertenecer a un grupo poco numeroso. 3o) Se ve fuertemente in
fluida por los datos extremes.
Además de esta media aritmética ma, existen otras medias, menos
geométrica mg y la armónica mh,
Media geométrica
lo cual satisface más, porque indica que el aumento del primer día habría
sido 82.843 y el del segundo día 117.157, es decir 34.314 más que el
primer día.
PARAMETROSESTADISTICOS
Media armónica
En esta media, en vez de dividir la sumatoria de los datos (£ x) por la
población (n), dividimos la población por la sumatoria de la inversa o re
cíproca de los datos:
media armónica = ——
15 + 20 + 30 + 60 = 125 min
, ... distancia
velocidad = — --------
29
PARAMETROS ESTADISTICOS
Como hay datos cuyos valores son mayores que la media y otros que
son menores, los primeros tendrán desvíos positivos (afectados con el sig
no más), y los segundos, desvíos negativos (afectados con el signo menos).
Como el valor de la media es igual al tamaño de la muestra dividido
por la población, puede decirse, en términos generales y aproximadamen
te, que el valor de la media es intermedio entre los valores del primero y
del último término de la serie, e igualmente intermedio entre los del se
gundo y del penúltimo, y entre los del tercero y del antepenúltimo, et
cétera. Es decir, la distancia en magnitud del primer término a la media es
igual a la distancia en magnitud de la media al último, y del segundo a la
media que de la media al penúltimo, etcétera; y en términos exactos, que
la suma de las distancias, en magnitud a la media, de los términos que la
preceden, es igual a la suma de las distancias, en magnitud, de los térmi
nos que la siguen.
Nótese que decimos distancia, que del punto A al B es la misma que
la del B al A, pero no decimos que las sumas de las diferencias sean igua
les, porque no es lo mismo A menos B que B menos A. Como se sabe, la
diferencia entre estas dos restas está en el signo que afecta al resultado,
siendo la cantidad la misma.
Parámetros de dispersión
Se denominan parámetros de dispersión aquellos que tratan de fijar el
valor de la dispersión (véase pág. 9) de los datos de una muestra. Entre
éstos se cuentan la amplitud, el desvío medio o simple o aritmético, el
desvío medio standard y el error standard.
Amplitud
Es la diferencia de valor entre el dato mayor y el menor de la mues
tra, y también entre el último y el primer término de la serie.
Se lo denomina también, a veces, intervalo de variación, o rango.
Puede servir como medida de la extensión de la muestra, pero no nos
da una idea exacta de la dispersión de los datos. Dos muestras pueden
tener la misma amplitud, pero una con los datos concentrados en las pro
ximidades de la media y la otra con los valores de los datos alejados de
ella. Por tanto, es un parámetro poco usado.
31
Se lo calcula suprimiendo el signo que afecta a los desvíos, sumando*
los después y dividiendo esa suma por su número o cantidad, o sea por la
población de la muestra.
Suele lomarse por los profanos en estadística como valor representa
tivo de los desvíos. Pero esto no es correcto, porque no todos los desvíos
son valores positivos. La mitad de ellos son negativos, y no es lo mismo
un valor positivo que un negativo, es decir, no es posible ignorar o su
primir el signo que afecta a un desvío.
Además de esta dificultad doctrinaria para aceptar el desvio medio arit
mético como representativo de los desvíos de los datos, existe la dificul
tad práctica de ser un valor chico, por lo tanto tener una magnitud pe
queña que lo hace inútil o poco útil en los cálculos estadísticos ulteriores
en los que se necesita un valor representativo de los desvíos.
■ =\ [
Es decir que el desvío medio standard es la raíz cuadrada de la media
de los cuadrados de los desvíos simples.
El valor así obtenido es suficientemente grande cuando se trata de
muestras numerosas, con una población de 60 o más observaciones, o por
lo menos de 30 o más, es decir de una muestra de Gauss; pero resulta
todavía pequeño cuando la muestra es poco numerosa, o muestra de
Gauss “Student".
En este caso es necesario un valor todavía mayor, y tanto más cuanto
32
Se ha encontrado que este valor útil puede obtenerse multiplicando la
cantidad subradical por el cociente "población sobre población menos
uno”, es decir n-j y , factor conocido con el nombre de “Factor de co
rrección de Bessel”, o sea
Z (x - m)’
4 + 24-2 + 4 12
■ -*
Error standard
Es el cociente del desvío standard dividido por la raíz cuadrada de la
población.
33
PARAMETROS ESTADISTICOS
■ _ 20 _ 20 _ 20 X 14 _ 280 g
m ~ ío o m “ 100 _ 100 100 ~ ‘ *
Parámetros derivados
Se denominan parámetros derivados a valores calculados indirecta
mente a partir de los valores de los dalos.
Los parámetros derivados son, e indican, relaciones entre otros pará
metros y generalmente se expresan como cocientes. Modifican cuantitati
vamente al parámetro principal o fundamental, del que derivan, pero no
cualitativamente. Por eso suelen denominarse también parámetros sccun-
35
ESTADISTICA MEDICA
. si - (JH2Z )’,
PARAMETROS ESTADISTICOS
Significado
El desvío reducido es el desvío simple expresado en unidades de des
vío standard, o sea: el desvío reducido expresa cuántas veces 'el desvio de
la observación es menor o mayor que el desvío medio standard de la
37
ESTADISTICA MEDICA
Dispersión de la media
Bs la relación entre la variancia (o sea. entre el cuadrado del desvío
standard) y la población de la muestra.
D. de la M. =
ca „ - .-5 1 _ _ SL
" iS T T n•
Significado
Como la variancia y el error standard, de los que deriva, y como su
nombre lo indica, es un parámetro de dispersión, lo cual se ve claramente
Promedio ponderado
Bs la relación del tamaño total de varias muestras, con la población
38
PARAMETROS ESTADISTICOS
Significado
El promedio ponderado es la media de un conjunto de muestras de
cada una de las cuales se conoce la media y la población.
Error probable
Es el error standard multiplicado por 2/3 (más exactamente, multipli
cado por 0,67449).
E. Prob. = 0,67449 S , ? y S„ - y ^ = -
Significado
El error probable de una muestra indica que el 50% de las medias de
las muestras similares a dicha muestra caerán dentro de los limites media
± 1 B.P. de dicha muestra.
Se puede aceptar además que hay un 50% de probabilidades de que la
media del universo caiga también dentro de dichos limites.
Error relativo
Es la relación entre la media y el error standard.
Error relativo = ~
Significado
Si el error relativo es igual o superior a 2, es decir, si la media es igual
o superior al doble del error standard, éste es suficientemente pequeño
39
ESTADISTICA MEDICA
40
SEGUNDA PARTE
Método fundamental
Se habla de cálculo de parámetro por el método fundamental cuando
se refiere a aquel que se basa directamente en las fótmuias que expresan
simbólicamente el concepto del parámetro. Así, el cálculo fundamental de
la media es aquel que hace uso directo de la fórmula conceptual.
43
servaciones y la dispersión de las medias de muestras similares a la mués-
2 f= 44
44
MEDIA, DESVIO STANDARD YERROR STANDARD
2 * f = 146,9 = T
Cuadro 7
EJEMPLO DE AGRUPAMIENTOYORDENACIONDE LOS DATOS:
PALOTES
siguiente.
Coloquemos ahí
segunda observación
vos valores de los te
Vemos así que la nueva media es igual a la media real menos el valor
de la escala en que se colocó 0*. Es decir:
De (1) se deduce:
m = m' + v.a. (2)
m = 5 + 160 = 165
PROPIEDADES DE LA MEDIA Y DEL DESVIOSTANDARD
Ejemplos
Se nos pide la estatura media de 4 personas cuyas tallas, se dan en
cm, en la siguiente forma; La Ira. mide ISO cm, la 2da. 160; la 3ra. 170,
y la 4a. 180 cm.
De acuerdo con el procedimiento fundamental tendríamos que sumar
esos 4 valores y la suma dividirla por 4.
Asi
150 + 160 + 170 + 180 = 660
m = 660 •/. 4 = 165
51
ESTADISTICA MEDICA
50 + 60 + 70 + 80 = 260
m- = 260 •/. 4 - 6 5
53
ESTADISTICA MEDICA
Lo mismo de siempre.
Coloquemos ahora, el 0- sobre el último valor de la muestra, es decir
sobre 180.
Entonces los valores derivados son:
-30;-20;-10; 0
54
faltan SO cm para medir 2 m; a la 2a. Ic faltan 40; a la 3a„ 30, y a la 4a.,
20 cm?
Ahora los valores derivados son:
-50; -40; -30 y - 20
m = m’ + valor arbitrario,
que es lo que dijimos al principio (2)
De (3) se deduce:
m = m- r 4
()
Es decir que: la media real (m) de los valores originarios es igual a la
media de los nuevos valores (m-) multiplicada por el factor de reducción
W-
55
ESTADISTICA MEDICA
Ejemplo I
PROPIEDADES DE LA MEDIA Y DEL DESVIOSTANDARD
- V¡66
= 12,88
= V ¡66
= 12,88
57
ESTADISTICA MEDICA
S8
PROPIEDADES DE LA MEDIA Y DEL DESVIO STANDARD
Sx' = — S* = r S*’
59
CAPITULO VII
v „ . = z ( x ~ m)1
la. observación
Si al hacer el cálculo de la variancia, en vez de tomar las diferencias
de los datos a la media se toman a un valor arbitrario (v. a.) distinto de
ella, se obtiene un resultado mayor, independientemente que el valor arbi
trario sea mayor o menor que la media. (Es decir que los cuadrados de las
diferencias de los datos a la media (x - m)1, son cuadrados mínimos.)
,Ejemplo 1
x m x- m (x - mí1
2 -3 9
61
ESTADISTICAMEDICA
E(* - v.a.)J = 36
(X - V.O.Í1
1
1 E(x - v.a.)» 36
£(x - v.».)1 ■
3a. observación
Si al hacer el cálculo de la variancia se toman las diferencias de los
datos a un valor arbitrario distinto de la media, el resultado difiere de la
variancia en el cuadrado de la diferencia entre la media y el valor arbitra-
J ^ £ - V a , = 9 -5 = 4
S (x —yj.)a _ yac —9 _ 5 = 4
(m - v.a.)1 = (5 - 3)a = 2a = 4
Por consiguiente:
63
Es decir que cuando los desvíos de los datos se toman restando' de
ellos un valor arbitrario (v.a.) distinto de la media (n)), la variancia real
(var.) es igual al nuevo resultado menos el cuadrado de la diferencia de la
4a. observación
Cuando el valor arbitrario hasta el que se toman las diferencias de los
datos es 0, dichas diferencias son los propios datos, ya que cualquier
número es igual a la diferencia entre él y 0, o sea cualquier número es
igual a si mismo menos 0. Lo mismo ocurre con la diferencia de este
valor arbitrario 0, de la media. O sea
64
E x 2 (Sx)J _ _120 400 _ 120 _ 100 _ 20 ,
Sa. observación
La fónnula 2 bis,
Var.= -
- (Ex)»/n E x » -T » /n
fónnula (3)
Ex = mn = T
Var = £ ~ m2 * = S <*-"■
ESTADISTICAMI
S* = 20 m= 5 y = 120
Í5 Ü 1 - — = ion
'■x = S X 20 = 100
n = 25 X 4 = 100
Sx* - T*/n _ I r 1 - n i
=53 —25
Se'3 - T'3-/. n 120 - 400 /. 4
120 - 100 20
En el ejemplo dado:
20 25 X 20
Var = 53 X
67
CAPITULO VIII
- Sxf
Ejemplo
En un problema donde se dan los datos del número de resfríos .te
nidos en un aflo por cada una de las 641 personas que constituyen la
ESTADISTICAMEDICA
70
Ejemplo
En elproblema de la talla media de 4 personas que miden respecti
vamenteISO, 160, 170 y 180 cm podemos transformar estosvalores en
otros menores y por lo tanto más manuables, dividiéndolos por un de
nominador común, que puede ser 2, 5 6 10. Dividiéndolos por este último
factor de reducción obtendremos los siguientes nuevos valores:
1S; 16; 17 y 18,
71
ESTADISTICA MEDICA
72
SIMPLIFICACION DLLCALCULO DE LA MEDIA
, _ S (v.C. - V.a.)f 95
m n 30 “ '
. £ (v e. - v.a.) f
73
ESTADISTICA MEDICA
74
SIMPLIFICACION DI
- 15
- 10
- 5
,7
- 5 = — = 2,8
75
Tomando como factor de reducción el intetvalo, como se hizo en este
caso, puede suprimirse la columna 3 y los cálculos necesarios para con-
62.5
67.5
72.5
77.5
82.5
87.5
92.5
97.5
102.5
107.5
112.5
76
SIMPLIFICACION DEL CALCULO DE LA MEDIA
ler. procedimiento:
Cuando los valores de una muest
ción de la propiedad A del desvio st
más chicos, simplificando asi el cálcul
2do. procedimiento
l F : = / ñ 5 = 7,9
77
ESTADISTICAMEDICA
3er. procedimiento
Naturalmente, estos dos procedimientos pueden aplicarse en combi
nación; por ejemplo, si se nos solicita el desvío standard de estas cinco
densidades de orinas, podríamos proceder así:
4to. procedimiento
La 2da. observación relativa al cálculo de la variancia nos permite cal
cular el desvío standard de una manera diferente del método clásico, que
también puede resultar un cálculo simplificado.
Como se recordará, dicha manera consistía en tomar la diferencia de
las observaciones a un valor arbitrario distinto de la media, en cuyo caso
78
Recordemos que, tratándose de mué;
debe ser ampliado multiplicándolo por
observación.
Entonces
79
ESTADISTICA MEDICA
-V p -
= 2,58
n procedimiento de cálculo
80
Cualquiera de las fórmulas de la variancia derivadas de la anterior y
que vimos en la 4ta. y Sta. observación con los nros. (2), (2bis,). (2bis,),
(3), (4) y (5) pueden aplicarse para el cálculo del desvio standard. Estas
últimas son especialmente útiles por su sencillez y porque para las peque
ñas muestras de GOSSET •‘STUDENT" basta hacer el denominador subra-
O bien:
, I 220 - 5 X 63 . I 220 - 180
81
ESTADISTICA MEDICA
7mo. procedimiento
!e ellos puede combinarse con las anterio-
s , . Sx = r 2 y¡
o bien
82
SIMPLIFICACION DEL CALCULO DE LA MEDIA
2 X 1,58 = 3,16
v - V W '-
S, -= S,1 = 3,16
Verificación de los cálculos
La complejidad de los cálculos estadísticos hace que con facilidad
puedan deslizarse errores inadvertidos. Debemos verificar, pues, nuestros
resultados antes de darlos por correctos.
Dos de los métodos más comúnmente usados para realizar esta verifi
cación son los llamados: De "la media más o menos tres desvíos stan
dard” y el "método de Charlier”. Veámoslos mediante un ejemplo. To-
fie" fx " 2
5 3 - 6 0 - 18 108
15 8 - 5 0 40 200
25 9 -4 0 - 36 144
3S 19 - 30 - 57 171
45 1 5 -2 0 - 30 60
55 28 - 10 - 28 28
65 30 0
75 34 + 10
85 36 +20
95 38 + 30
105 13 + 40
115 7 +50
125 9 + 60
135 1 +70
Z f=250 = n Efx” = 159 1987 = ££*"’
83
m = va + — f - r = 65 + 10 -^¡j- = 65 + 6,36 = 71.36
^ ■V W ^ T W - ■«V W H T -
= 10 y f 7, 948 - 0,636’ = 10 -J 7,948 - 0.4045 = 10 V 7,5435 =
= 10 X 2,74 = 27,4
m + 3 Sx = 71 + 3 X 27 = 71 + 81 = 152
m - 3 Sx = 71 - 3 X 27 = 71 - 81 = -10
.Prueba de Charlier
2 f x ”’ + 2 2 f Jr” + 2 f = 2 f ( x " + l ) J
El valor del primer miembro de esta igualdad lo podemos obtener por
los valores ya calculados en nuestra planilla. En efecto
da en la anterior
84
SIMPLIFICACION DEL CALCULO DE LA MEDIA
85
CAPITULO IX
y=-
S*= 1
88
Por lo tanto, en un caso concreto, en el que tanto la población “n"
como el desvío standard Sx tengan un valor distinto de 1, el valor dado
por la tabla debe multiplicarse por la. población de nuestra muestra (n) y
dividirse por el desvio standard (Sx) de nuestra muestra. 0, lo que es lo
mismo, el valor '*y” dado por la tabla tiene que multiplicarse por el •
cociente -jj- de nuestra muestra.
En resumen:
x, reducida = c = d = —g m
Por lo tanto:
x = m + Jt, Sx
v = y' ”
Significado de "y"
Es la ordenada del punto de la curva de nuestra muestra cuya abcísa
Construcción de la curva
Tomemos como ejemplo la siguiente muestra de muertes por nefro-
patía diabética:
De cien diabéticos con glomérulo-esclerosis intercapilar:
Estos serían los valores de "y” en una muestra en la que "n" y "Sx"
valiesen I. Pero en nuestra muestra "n” vale 100 y S, vale 10,3. Por lo
tanto, nuestras ordenadas serán iguales a las ordenadas "y", dadas por las
tablas multiplicadas por el cociente -2-
"jt"o V 9,7y, = y
0,0 9,7 X 0,40 = 3,88
0,5 9,7 X 0,35 = 3,39
1.0 9,7 X 0.24 = 2,33
14 9,7 X 0,13 = 1,26
2.0 9,7 X 0,05 = 0,48
2,5 9,7 X 0,02 = 0,19
Con estos elementos dibujemos la curva.
Trazamos, en primer lugar, un sistema de ejes ortogonales.
A objeto de qne le ~'nra no nos resulte demasiado chata, tor
90
Area subtendida a la curva. Area parcial
91
ESTADISTICAMEDICA
en la figura.
negro en la figura.
94
ECUACION DE LACURVA DE GAUSS
95
ESTADISTICA MEDICA
partir del cual sus valores se confunden con los de las tablas anteriores.
Al consultar esta clase de tabla debe tenerse en cuenta la población
Para eso lo más fácil es recurrir a alguna de las tablas recién expues
tas. Cualquiera de ellas puede servir con tal de conocer bien la tabla que
se maneja. Supongamos que elegimos la que tenemos en el apéndice
(Tabla 1).
Así, si quisiéramos saber el número de observaciones que en una
muestra teórica normal, que tenga los parámetros de la muestra de los
diabéticos con esclerosis intercapilar recién vista, se hallan comprendidos
entre X| = 50 y Xj = 60, tendríamos que ver en la tabla cuál es el área
comprendida entre la media y la ordenada correspondiente a X| = 50 y
restarle el área comprendida entre la media y la ordenada correspondiente
96
97
ESTADISTICA MEDICA
98
CAPITULO X
Significación de la media
La significación de la media está dada por su error relativo (c)
ER = c = — = m = m s/ñ~
sm S, ■/. v r rT S,
99
ESTADISTICA MEDICA
100
VARIACION DE LAS MUESTRAS
43-46 1
47-50 2
Sl-54 6
5Í-58 22
S9-62 52
63-66 79
67-70 118
71-74 165
75-78 186
79-82 165
83-86 103
87-90 82
91-94 45
95-98 19
99-102 11
103-106 3
107-110 1
m = 76,9 S, = 8,9
m * 2 Sx = m± 2 X 8.9 = 76,9 ± 17,8 = 59,1 a 94,7.
101
ESTADISTICA MEDICA
102
VARIACION DE LAS MUESTRAS
103
VARIACION DE LASMUESTRAS
109
ESTADISTICA MEDICA
s, = *“ •
En cuanto al error standard, este aumento resulta todavía insuficiente
y es necesario'aumentar su valor, disminuyendo su denominador, restán
dole una unidad a la cantidad subradical. Entonces,
Sx l £ (x -m )*
V" - 1 \ | n (n -l)
112
están encabezadas por los valores de las áreas exteriores desde "menos
infinito” a la ordenada levantada sobre menos “t" y desde la levantada
sobre más “t" a "más infinito”, y en la que las líneas horizontales co
rresponden a los “grados de libertad". En la intersección de una línea
horizontal con una columna vertical se halla el valor aproximado del des
vío relativo "t” correspondiente.
En la práctica, conocido el grado de libertad se sigue la horizontal
hasta colocarse entre los dos valores, uno inferior y otro superior al valor
de nuestro desvío relativo “t” y después se levanta la vista para ver a qué
área exterior corresponden.
Significación de la media
Igual que en la pág. 99, pero ahora m —“t”; o mejor:
113
ESTADISTICAMEDICA
US
Si se desea dar una mayor precisión a la significación (o a la no signi
ficación de la diferencia) hay que tomar el error relativo de la diferencia
E.R. (mi - m¡) como “t" y en una tabla de Gosset “Student", en la
horizontal correspondiente a un grado de libertad v, + - 2 ver entre
qué desvíos relativos se halla situado; luego levantar la vista y ver a qué
áreas parciales externas corresponden esos desvíos relativos. La probabi
lidad de hallar diferencias iguales o mayores en muestras extraídas de un
Hubo, por lo tanto, una diferencia de 3 horas entre las horas medias
dormidas por los pacientes de una y otra muestra. Se pregunta si esa dife
rencia es significativa o no.
Por comodidad en los cálculos tomaremos los cuadrados de los datos,
es decir de las horas dormidas.
116
MUESTRA NORMAL
Ex? = 300 Ex
117
ESTADISTICA MEDICA
118
CAPITULO XII
SUMARIO. Signific
Su significación y determinación
Cuando las personas o cosas que integran dos muestras son las mis
mas, una diferencia puede ser significativa, y no serlo si se trata de
personas o cosas distintas. La razón de ello es que entonces hay una ho
mogeneidad mucho mayor, en las muestras. Asi, ocurre siempre que se
hagan las observaciones pareadas en las mismas personas o cosas, una
antes y otra después de la intervención de un factor en estudio; o una
después de la intervención de un factor y otra después de la intervención
de otro factor, sobre las mismas personas o cosas.
Por lo demás, en estos casos, no se trata de la significación de una
diferencia entre medias, sino de la significación de una media de un
conjunto de diferencias.
Ejemplo (Datos modificados del Southern Medica! Journal, 1950, 43.
678)
A un grupo de pacientes se les suministró un hematinico y después de
un tiempo sus valores medios en Hgb se compararon con los de un grupo
control. La diferencia no resultó significativa; pero aquellos mismos valo
res obtenidos en las mismas personas (y no en personas distintas usadas
como control) mostró diferencias francamente significativas.
Los datos son:
119
ESTADISTICA MEDICA
xl
163,84 148,84
174,-24 127,69
249,64 216.09
179,56 129,96
132,25
184^96 161,29
0,36
3,61
1.21
5,29
0,81
í d ! = 15,28
122
MEDIA DE UNA DIFERENCIA DE DATOS DE OBSERVACIONES PAREADAS
— ■
T, = I x , T=2 x
123
ESTADISTICA MEDICA
Var. ir - 2 x2 - (H /n , + Tl/na +
Para ello hay que dividir la mayor de ellas por la menor, obteniéndose
loque se conoce como cociente F,,2 (F. es la inicial del apellido del
creador del método).
A continuación se averigua, en tablas especiales, el valor del cociente
T = T, + T, + Tj = 6176
126
32400 39601 36481
31329 41209 37636
30625 40000 40401
28900 37636 37249
33124 38025 38809
32761 41616 38025
31329 42436 41209
32400 42849 39601
33489 40804 39601
34225 40000 40401
----------- 42136
■320582 2x1 = 404176 38809
2x3 = 470658
127
CUARTA partí:
DISTRIBUCION BINOMIAL
SUMARIO: Desarrollo de
131
ESTADISTICA MEDICA
(a + b)1 —la1 b° + —
j— a° b1.
Monomio
1 a' b° = I a
El 2do. factor de le
132
ESTADISTICA MEDICA
5a. observación
El coeficiente del 3er. monomio es también un quebrado cuyo nume
rador es el numerador del 2° monomio multiplicado por el número que le
precede en la serie natural de los números y el denominador, el denomi
nador del 2 monomio multiplicado por el número que le sigue en la serie
natural de los números.
6a. observación
En el 1er. monomio aparece el 1er. término del binomio, elevado al
exponente del binomio; en el 2°, elevado a dicho exponente menos 1. y
en el 3°. elevado a dicho exponente menos 2. Es decir que el exponente
de este 1er. término de los monomios, que en el primero es igual al ex
ponente del binomio, disminuye en una unidad en cada uno de los mo
nomios siguientes.
7a. observación
El 2° factor de los monomios es el 2° término del binomio, elevado,
en el 1er. monomio, a 0; en el 2°, a 1, y en el 3o, a 2.
Ser. ejemplo
Desarrollemos en forma similar el binomio elevado
(a + b)J
N° de orden
DISTRIBUCION BINOMIAL
Observaciones
Podemos repetir las mismas observaciones anteriores. En efecto:
1) El número de monomios es igual al exponente del binomio ele
vado más 1.
2) Cada monomio está formado por un coeficiente seguido del pro
ducto de ambos términos del binomio, elevados a un exponente deter
minado.
3) El 1ro. (y el último) monomio tienen el coeficiente 1.
4) El coeficiente de los monomios, a partir del 2° está fotmado por
un quebrado. Este quebrado, en el 2o monomio tiene por numerador el
exponente del binomio elevado, y por denominador la unidad. En el 3 y
siguiente los coeficientes tienen como numerador el numerador del coefi
ciente anterior multiplicado por el número natural que le precede en la
serie natural de los números y por denominador el denominador anterior
multiplicado por el número natural que le sigue. Estos coeficientes se
Daman coeficientes newtonianos, o monomiales (también suelen deno
minarse "binomiales", por referirse a los monomios correspondientes al
desarrollo de un binomio).
4lo. ejemplo
Desarrollemos en igual forma el binomio
(a + b)‘
7V° de orden Monomio
■t
3"
13S
ESTADISTICA MEDICA
6„ 6X SX 4X 3X 2
1X 2X 3X 4X 5
^ 6X SX 4X 3X 2X 1
1 X 2X 3X 4X 5X 6
Observaciones
Podríamos repetir las mismas observaciones anteriores.
5o ejemplo
Reemplacemos por números, no solamente el exponente, sino también
los términos del binomio. Reemplacémoslos primeramente por números
naturales, por ejemplo,
(2 + 3)'.
Y ahora desarrollémoslos como antes:
/Vo de orden Monomio
1° 1 X 2 'X 3 ° = 1X2 X 1 - 2
t | X 2 ° X 3 '= IX 1X 3 = 3
Observaciones
Podríamos hacer las observaciones del 1er. ejemplo.
6o ejemplo
Desarrollemos ahora el binomio
(2 + 3)1
AIo de orden Monomio
1° 1 X 2 'X 3 " = I X 2* X 1 = 4
t - X 21 X 3' = 2X 2‘ X 3'= 12
DISTRIBUCION BINOMIAL
Observaciones
Podríamos repetir las observaciones del 2° ejemplo.
7o ejemplo
Desarrollemos el binomio
(2 + 3)J
2o X 3S = 1X 1 X 3 ’ = 27
Desarrollemos ol binomio
Monomio
l X 2‘ X 3° = 1 X 2‘ X I = 64
-X 2 ! X3‘ = 6 X 2S X 3‘ — 576
= 15 X 2* X 34 = 4860
ESTADISTICA MEDICA
Observaciones
Las mismas de siempre.
Reemplacemos ahora los términos del binomio por números quebra
dos cuya suma sea igual a la unidad.
Desarrollemos el binomio
U + 4 V - .■ - ,
'• ■ ( { ) • ( * ) • - ■ ( i) *
f t (Í)'(Í)' -«-(i)
Observaciones
10° ejemplo
Desarrollemos el binomio
( i -i)'-
138
DISTRIBUCION BINOMIAL
' « - ‘(i)'
»(I) (i) - í
Observaciones
Las 8 de antes.
1 1 ° ejemplo
Desarrollemos el binomio
W + z )
A" de orden Monomio Valor
'(;)■(!) - ■er« - ¿
■(i)’(i)- 5
m i j m ’ i! ,’ ,
> ü )(i)1 ;
1X 2X 3 \ 2 / \2 ) (i) (i)- i
Observaciones
Las de siempre
12° ejemplo
Binomio ^ j - 1* - 1
139
ESTADISTICA MEDICA
W° de orden
- ■ (!)*> i
i ( y '( f ) ‘ - (t ) ( ! ) !
Observaciones
Las de siempre
13° ejemplo
Desarrollemos el binomio
(T 7=i
Ai° de orden Monomio
t° ejemplo
Binomio
140
DISTRIBUCION B1NOMIAL
Observaciones
Las de siempre
16 ejemplo
Binomio = l2 = l
V6 6 /
N° de orden Monomio
Observaciones
Las 8 de siempre
Reemplacemos ahora los términos del binomio por números decimales
cuya suma sea también igual a uno.
17° ejemplo
X I (0.5)1 0,25
3' 7 F 2( 0,5)0 (°,S)3 =
Observaciones
Las de siempre.
180 ejemplo
Binomio (0.5 + 0,5)3 1
142
DISTRIBUCION BINOMIAL
19° ejemplo
Binomio (0,3 + 0,7)* = 1* = 1
N° de orden Monomio
143
CAPITULO XIV
EJEMPLO 1
Si arrojamos una moneda al aire, es posible que caiga “cara", pero es
también posible que caiga "ceca", esto es que “no caiga cara".
La probabilidad de que “caiga cara" es igual a la de que “no caiga
cara", y si a la probabilidad de ambas juntas, a la probabilidad total, es
decir, a la probabilidad de que “caiga cara más la de que no caiga cara" le
damos el valor uno, el valor de la probabilidad de que "salga cara" es
igual a la mitad, es decir a un medio, y otro tanto, la de que "no caiga
cara". Esto significa que presumimos que arrojando infinidad de veces una
moneda, la mitad de las veces "caerá cara” y la otra mitad "no caerá
146
SERIE BINOMIAL DE BERNOUILLI
147
ESTADISTICAMEDICA
Observación N°2
El 2 término del binomio elevado indica la probabilidad del resultado
Observación N°3
El exponente del binomio indica el número de monedas arrojadas
cada vez y también el valor máximo del resultado.
Observación N°4
El valor del exponente más uno indica el número o cantidad de resul
tados diferentes.
Resumen
Razonando sobre los resultados de arrojar una moneda, y calificando
esos resultados desde el punto de vista de “caer cara" o “no caer cara" y
dando al 1° el valor 1 y al 2° el valor 0, podemos construir una serie
148
SERIE BINOMIAL DE BERNOUILLI
149
SERIE BINOMIAL DE BERNOUILLI
EJEMPLO 3
Si arrojamos un dado sobre la mesa, puede salir el número "seis" o
salir cualquier otro número, siendo la probabilidad de que salga el “seis"
igual a la probabilidad de que salga cualquiera de los otros números, y si a
la probabilidad total, es decir a la suma de probabilidades de todos ellos
les damos el valor 1, la de “salir el seis" será igual a ~ y la de “no salir
1. 0, 0, 0. 0, 0
I (D. 0(5)
o también:
* f. Sr
( i *
ESTADISTICAMEDICA
Observaciones
154
SERIE BINOMIAL DE BERNOUILLI
La frecuencia del resultado máximo está dada por el valor del primer
monomio y la del resultado mínimo por el del último.
La tercera columna debe leerse uno sobre cuatro, dos sobre cuatro, y
uno sobre cuatro, respectivamente.
Resumen
Razonando sobre los resultados de arrojar dos monedas, desde el
punto de vista de "caer cara" o “no caer cara", hemos construido una
serie con una distribuciún binomial de las frecuencias, las cuales respon
den a los valores de los monomios resultantes del desarrollo del binomio
elevado ( y + ? )’ •
Observaciones
En este binomio el 1er. término indica la probabilidad de salir cara
arrojando una moneda; el 2° la de no salir cara, y el exponente el número
de monedas arrojadas simultáneamente. A su vez este exponente indica el
valor máximo de los resultados posibles, o sea de los términos de la serie,
y el valor del exponente más uno el número o cantidad de resultados
posibles, o sea de términos distintos de la serie.
1SS
Las combinaciones en que aparece una sola bolilla roja, si ísta es R |,
son dos Ri - Vj y R, - Aj y las en que aparece la Rj también son dos
Rj - V| y Ra - Ai; por lo tanto, las combinaciones o resultados en que
aparece una sola bolilla roja, cualquiera de ellas que sea, son cuatro. La
probabilidad de este resultado (una bolilla roja) es, por lo tanto, -5-.
Y por fia las combinaciones en que no aparece ninguna bolilla roja
son también 4, como puede verificarse fácilmente. Esta probabilidad
(“ninguna bolilla roja”) es, por consiguiente, también igual, a -y .
Es decir, hemos obtenido los mismos resultados que por los cálculos.
Si al resultado “sacar 2 bolillas rojas” le damos el valor 2, al "sacar 1
bolilla roja” el valor I y al “ninguna bolilla roja” el valor 0, ía serie
mínima representativa de la serie infinita de sacar bolillas de dos bolilleros
con las condiciones dichas sería la siguiente
2, 1. 1, 1, 1, 0,0, 0,0
o sea
2(1), 1(4), 0(4)
o también
157
ESTADISTICA MEDICA
Resumen
De nuevo hemos construido y visto una serie estadística con una repe
tición de términos, o sea con una distribución de frecuencias, de índole
binomial, en la que esta frecuencia está dada por los valores de los mo
nomios resultantes del desarrollo del binomio elevado
Observaciones
El ler. término de este binomio indica la probabilidad de un resultado
en un caso individual, el 2° la probabilidad de no obtener ese resultado en
ese caso individual, y el exponente el número de casos individuales. A su
vez el exponente indica el valor del resultado máximo, o sea del término
máximo de la serie, y el exponente más uno el número o cantidad de
resultados distintos, o sea de términos diferentes de la serie.
SERIE BINOMIAL DE BERNOUILLI
Ejemplo 6
Si en vez de arrojar un dado arrojamos dos, el cuadro de resultados y
frecuencias de esos resultados desde el punto de vista de sacar "seis"
puede construirse sobre la base del desarrollo del binomio (4“ + T ) asl"
Resultados Monomio Frecttencia
Ejemplo 7
En vez de 2 monedas arrojemos 3 y veamos la serie de resultados
desde el punto de vista de caer cara.
El cuadro de los resultados y frecuencias sería el siguiente, desarro
llando el binomio
■ . ' ( i H t r = ■(;)' - 5
! ' « - ( * ) ■ ( * ) ■ - i
' f H Í Í ) , (3), - ( i ) , (3)‘- i
• S ü í (*)•(*)'-(i)' - i
160
SERIE BINOMIAL DE BERNOUILLI
Observaciones
El 1er. término de este binomio indica la probabilidad individual de
un resultado en un caso individual; el 2° la probabilidad individual de no
obtener dicho resultado en el mencionado caso individual, y el exponente
el número de casos individuales puestos en un juego simultáneamente,
indicando además el valor máximo de los resultados, o sea de los términos
de la serie; y el mismo más uno el número o cantidad de resultados, o sea
de términos diferentes de la serie.
Ejemplo 8
En vez de 2 bolilleros tengamos 3 en las mismas condiciones ante
riores y construyamos la serie de resultados desde el punto de vista de
que salgan bolillas rojas. El cuadro de resultados y frecuencias sería el
siguiente, desarrollando el binomio elevado:
Hemos visto una nueva serie estadística con una distribución binomial
de frecuencias de la misma naturaleza que las anteriores.
Ejemplo 9
Construyamos finalmente una serie con una distribución binomial de
frecuencias recogiendo los resultados de arrojar 3 dados al mismo tiempo,
SERIE BINOMIAL DE BERNOUILLI
a * f r
lesultados Monomios Fi
•ayay-ay -
163
ESTADISTICA MEDICA
de frecuencias.
'( ! ) ■ ( ! / - '(i)' = 4
i (;)’(;)■-10(1)7;)’- w
a e n y - w - n s
a r e - w - i i
» ( ; ) * ( ! ) ’- 1(!)‘ -m
7776
25
7776
250
7776
1250
7776
3125
3125
7776
3125
3125
7776
n = 2 / = 7776 Z/r= 1
165
ESTADISTICA MEDICA
Primera técnica:
El numerador es igual al producto del coeficiente del monomio an
terior multiplicado por el exponente del primer término de este mismo
monomio, y el denominador es igual al exponente del segundo término
también del monomio anterior aumentado en una unidad.
Ejemplo: desarrollo del binomio
(a + b)‘
6X I _ _6
5+ 1 ~ 6
Segunda técnica
El numerador del quebrado del monomio correspondiente al 2° resul
tado, es decir al resultado cuyo valor coincide con el valor de exponente
del binomio menos 1, es justamente el valor del exponente.
166
El numerador del quebrado del monomio siguienle. es decir del co
rrespondiente al resultado cuyo valor es el exponente del binomio menos
2. es el numerador anterior multiplicado por el número que le sigue en la
serie descendente de los números naturales.
El numerador del quebrado del monomio siguiente es igualmente el
numerador del monomio anterior multiplicado por el número que le sigue
en la serie descendente de los números naturales.
Y asi todos, incluso el último. Pero éste, ya sabemos, al igual que el
primero, vale 1; de modo que no hace falta calcularlo. Veamos ahora el
(a + b)‘
6 X SX
3X 2 X
6 XSX4
5X 4X 3X 2X
< I) (4 X 3 X 2 X 1)
(6 X 5 X 4) (3 X 2 X 1)
4 X3X 2X 1 X 3 X 2 X 1) (2 X 1)
6X SX 4X 3X 2 (6 X S X 4 X 3 X 2) (1)
5X4X3X2X1 (5 X 4 X 3 X 2X 1)(1)
Observaciones •
1) Observando estos coeficientes expresados en forma de factoriales,
vemos que todos los numeradores no son más que el factorial del expo
nente del binomio y
2) que los denominadores están formados por el producto del facto
rial del resultado multiplicado por el factorial de la diferencia entre el
exponente del binomio y el resultado;
3) si genéricamente el exponente del binomio lo simbolizamos por N
y al resultado por R, el coeficiente binomial puede simbolizarse por una
N y una R puestas una encima de otra y ambas encerradas entre parén-
/ N
\ R /
\m » ____
R! (N -R )l
Ejemplo
¿Cuál es el coeficiente binomial correspondiente al resultado 3 en el
desarrollo del binomio (a + b)5?
I 5 ) Ni S!
\ 3 / R! (N - R)1 3! 2!
170
SERIE BINOMIAL DE BERNOUILLI
120 120
10 .
6 X 2 “ 12
Por el método originario el cálculo de este coeficiente hubiese sido
(D-m-T
En este ejemplo hubiese sido más sencillo el método originario que el
derivado, debido a que tanto el exponente como el resultado son números
pequeflos; pero otra cosa hubiera sido si, por ejemplo, el problema hubie
se sido: ¿cuál es el coeficiente binomial correspondiente al resultado 25
en el desarrollo del binomio (a + b)‘°°?
En este caso el coeficiente, de acuerdo con el método originario,
hubiera sido
/ 100 \ 100 X 99 X 98 X . . . X 26 (75 multiplicaciones)
\ 25 / I X 2 X 3 X . . . X 75 (75 multiplicaciones) *
Es decirque para calcular este coeficiente por el método original
necesitaríamos realizar nada menos que 150 multiplicaciones, lo cual
evidentemente es una tarea larga y laboriosa.
En cambio, por el método deducido el cálculo indicado es el si-
N! _ 100!
R! (N - R)! “ 25! 75! '
Se recurre ahora a una tabla de factoriales, con lo cual tenemos
Vimos anteriormente que los otros factores de los monomios son los
dos términos del binomio elevado, cada uno de ellos elevados, a su vez, a
un exponente determinado cuyos valores son los que ahora debemos
Digamos ante todo que esta parte del asunto es sumamente sencilla.
En efecto, el primer factor del monomio se halla elevado invariable
mente al resultado, y el segundo factor a la diferencia entre el exponente
y el resultado.
(a + b)5
La primera forma es
tabla de coeficientes binomiales
o de sus logaritmos.
173
R! <» - W
■nToí' *TT•5T■1
( i4 ) ‘
SERIE BINOMIAL DE BERNOUILLI
■-MU (f)'
120 _l 25_
6 X2 216 36
I20X 1 X 25 125
175
CAPITULO XV
cuencias son pasibles de los mismos tratamientos que las otras muestras o
series estadísticas normales, es decir que el cálculo de sus parámetros
puede hacerse por los métodos comunes aplicables a cualquier muestra o
3, 2, 2, 2, 1, 1, I, 0 .
íf» ! - m£ fx
m = pN
178
füJili
más la probabilidad que salga ceca llamamos una probabilidad total del
100%. la de que "salga cara" será del 50% y la de que “no salga cara”,
también del 50%.
A fin de que el valor del binomio se mantenga igual a la unidad, estos
porcentajes se expresan en centesimos.
En este caso el binomio, por lo tanto, es
(0,50 + 0.SO)1
(0,50 + 0,50)'
Monomio Probabilidad
1 (0,50)' (0,50)° = 0,50 0,50 = 50%
181
ESTADISTICAMEDICA
Observaciones
Hs evidente que en estos casos se trata de series de series, y no de
series de datos.
Cuando digo que la serie es
100%(50), 0 %(50)
digo
100%, 100%, 100%... (50 veces). 0%. 0%, 0%... (50 veces),
es evidente que cada término de la serie es a su vez una serie formada por
100 términos, en este caso todos iguales. Si uno de los términos fuese
50%. ello significaría igualmente una serie de 100 términos, de los cuales
SO serian iguales a un valor determinado y los otros cincuenta iguales a 0.
Hasta ahora habíamos visto que tas muestras y las series se formaban
con observaciones individuales y con datos individuales. Aquí nos encontra
mos con series formadas por series, o si se quiere, los datos se refieren a
series. Podríamos decir que se trata de una SERIE (con mayúsculas) de
series (con minúsculas).
En la serie del ejemplo, que dijimos era
100%(50), 0%(50),
cada uno de los términos de esta serie se refieren a una Serie de 100 tér
minos; los 50 primeros formados por series con el valor o resultado máxi
mos, y los 50 siguientes por series formadas por el valor o resultado nulo.
De ello resulta que el desvío standard no es un parámetro represen
tativo de los desvíos de los datos, sino de las series, expresadas por sus
medias; el desvio standard es, por lo tamo, el desvio de las medias, es
decir, es un error standard. Un desvío standard de las medias, no un
desvío standard de los datos.
Como siempre, el exponente N del binomio (p + q)N indica el núme
ro o cantidad de objetos que se juegan en las series primitivas, y N + I es
el número o cantidad de resultados diferentes, así como el de términos
distintos de la serie final.
En el ejemplo dado, el exponente I indica que se jugó una moneda
por vez, y N + 1 que se obtuvieron 2 resultados distintos.
Ejemplo 2
Si, en vez de ser una, las monedas fueran 2, los resultados (relati
vos a salir cara) 2, 1.0. pueden valorarse 100%. 50%, 0%y y la frecuen-
Resultado Monomio Probabilidad
100% (o sea 2) 1 (0,S0)s (0.50)° = (0.50)J = 0,25 = 25%
50% (o sea I) ~ (0.50)1(0.S0)1 = 2 (0.50) (0,50) = 0,50 = 50%
0% (o sea 0) 1 (0.50)° (0,50)’ = (0,50)’ = 0,25 = 25%
- = 50%
(0,50 + 0.S0)3
Monomios Probabilidad
100 (%) (o I (0,50)3 (0,50)° = (0,50)3 — 0,125= 12,5%
3x 2
33,33 (%) (o —(0,50)' (0.50)3 = 3 (0,50)3 = 0,375 = 37,S%
1(0,50)° (0.50)3 = (0,50)3 = 0,125 = 12,5%
1250000,00
1663312,5
PARAMETROS MEDIA Y DESVIO STANDARD
Probabilidad de un resultado
Cuando una mueslra, o una serie estadística, presenta una distribución
de frecuencias de carácter binomial, la solución del problema de la proba
bilidad y el de la significación de un resultado puede verse extraordinaria
mente simplificada.
Ejemplo
Problema. ¿Cuál es la probabilidad de que un matrimonio tenga por
resultado 7 hijos seguidos todos ellos varones?
Respuesta. Aceptando que la probabilidad de que un matrimonio
tenga un hijo varón es igual a la de tener una hija mujer, la probabilidad
de "tener un varón" es igual a -y y la de "no tener un varón” es también
igual a -J-. Por lo tanto, las probabilidades de tener I. 2, 3 „., 7 hijos
varones, en otros tantos partos seguidos, están dadas por los valores de los
monomios correspondientes al desarrollo del binomio elevado
I8S
ESTADISTICA MEDICA
•(i)’(i)‘-(y)’- y -á r
Por consiguiente, la probabilidad de tener un séptimo hijo varón en 7
nacimientos seguidos es de 1/128. Es decir, que de 128 matrimonios que
tengan 7 nacimientos, uno, como promedio estadístico, tendrá los 7 naci
mientos varones.
Significación de un resultado
El concepto "significación de un resultado" vamos a aclararlo median
te ejemplos.
Ejemplo 1
Problema. Si de 9 enfermos de reumatismo cardíaco, 5 son hombres y
4 mujeres, ¿indica ese resultado una preferencia por los hombres, en el
reumatismo cardíaco?
Respuesta. Si no hay pieferencia sexual alguna, al producirse un caso
de reumatismo cardíaco, éste podrá ser tanto de un varón como de una
mujer. Aceptar esto equivale a aceptar que en casos de enfermedad la pro
babilidad de que el enfermo sea varón es de y y la de no ser varón,
también de .
Al producirse 9 reumatismos cardiacos, los enfermos podrían ser
todos hombres, por mera casualidad, como al arrojar 9 veces una moneda
las 9 veces puede salir cara, también por mera casualidad, y lo mismo
decimos si en vez del resultado 9 tuviésemos el 8, el 7, el 6, etcétera.
Todos estos resultados pueden darse por obra de la casualidad, sin que
haya una predisposición especial, por los hombres en el caso del reumatis
mo cardíaco, o por las caras en el de arrojar la moneda. Si bien todos
estos resultados son posibles, sus probabilidades son distintas, y estas
probabilidades coinciden con los valores de los monomios resultantes del
desarrollo del polinomio elevado:
PARAMETRO:- MEDIA Y DESVIO STANDARD
( r) (l)
(1) es igual a:
( ;) -.»
5
( ) X^ = 126 X ° '001954 = ° ’246
(0,5 - 0,5)’
log ( 5 ) “ 2.10037
Este valor multiplicado por 0,59 nos daría también el valor del mono
mio de referencia: 0,246.
H
\ r )- N!—
R! ( N - R)!
9! _ 3,6288 X 10s
5! X 4! 1,2 X 103 X 2,4 X 10‘
0,246 = 24,6%
188
PARAMETROS MEDIA Y DESVIOSTANDARD
(» )* x m “
|og 67l,2-^ - X0,5' ;3 =log 123! + 123 log 0,5+ log 1/67! +log 1/56!
123! X 0,Sia
= 1,64762 -
°8 67! X 56!
1,64762 - 3 = 0,64762 - 2 = 2,64762
antilog de 2,64762 = 0,044
D.R.
190
PAI' \MI I KOS MEDIA Y DESVIOSTANDARD
167-61.51 5,5
D' - S3 — ■ 3T - 1 '
Otro ejemplo
Problema n° 3 (Bancroft. p. 130)
En un total de 1523 muertes por una determinada enfermedad, 774
correspondieron a varones y 749 a mujeres; es decir, murieron 25 varones
más que mujeres.
Se pregunta: ¿Indica esa superioridad de muertes masculinas una pre
disposición especial en los hombres hacia la enfermedad en cuestión?
Razonamiento y solución. En un universo sin predisposición alguna, la
mitad de las muertes serían de varones (y la otra mitad de mujeres). Si
esto se repitiese fielmente en una muestra de 1523 muertes, 761,5 ten
drían que ser masculinas y otras tantas femeninas.
Pero, por otro lado, en una muestra de muertes sin ninguna predispo
sición especial por los individuos de un sexo determinado, por pura
casualidad, la totalidad podría estar formada exclusivamente por hombres;
es decir que por simple obra del azar, sería perfectamente posible encon
trar una muestra de 1523 muertes en la que todos fueran hombres, como
seria igualmente posible encontrar otra de igual cantidad de muertes en
las que los hombres sumaran 1522 y las mujeres 1, en otra con 1521
hombres y 2 mujeres, etcétera. La posibilidad existe siempre. Lo que
ocurre es que la probabilidad de que asi acontezca es muy remota; debe
mos precisar entonces cuál es la probabilidad de que ocurra de ese modo,
y por supuesto que la probabilidad será mucho menor para muestras
como las que acabamos de señalar, que para otras en las que las cantida
des de hombres y mujeres fallecidos sean aproximadamente las mismas.
Para resolver cuál es la probabilidad de hallar 774 varones muertos en
una muestra de 1523 defunciones, sin que haya ninguna predisposición
especial de la enfermedad por matar varones, es decir aceptando que la
probabilidad individual en caso de muerte sea la misma para hombres que
para mujeres (como la probabilidad individual de caer cara, arrojando una
191
PARAMETROS MEDIA Y DESVIO STANDARD
Problema A'1’4
Si de un total de 5 muertes por una determinada enfermedad, cuatro
corresponden a varones, ¿constituye ello para dicha enfermedad una mor
talidad masculina significativa, mucho mayor que la femenina?
Razonamiento: En una muestra de 5 muertes, en la que la probabili
dad individua] de muertes sea la misma para varones que para mujeres, es
decir del -y, pueden darse todas las posibilidades, esto es, que las 5 muer
tes correspondan a varones, o que corresponda 4, 3, 2. I, o ninguna; pero
la probabilidad de que asi ocurra es diferente.
La probabilidad de cada uno de esos 6 resultados está dada por el
valor del monomio correspondiente en el desarrollo del binomio elevado
ESTADISTICA MEDICA
(WJ
Estos, colocados en la planilla conocida, se
194
■'ARAMETROSMEDIA Y DESVIOSTANDARD
D.R. = t4 = 1,34
Conclusión
Los resultados 4 ó 5 es 18,75%, haciendo el cálculo de las probabili
dades individuales de cada uno de estos resultados y es en cambio del
25% haciendo el cálculo de la probabilidad del desvío reducido. Es decir,
195
ESTADISTICA MEDICA
Quiere ello decir que el Sm es tanto mayor, es decir que los límites
dentro de los cuales oscila la media de las distintas muestras estarán más
alejadas, cuanto mayor sea el desvío medio standard de los datos; o cuanto
menor sea la población de la muestra: y será tanto menor, es decir los
limites estarán tanto más próximos o más cerca, cuanto menor sea el Sx o
cuanto mayor sea la población de la muestra.
Frecuentemente se plantea el problema de saber qué población debe
tener la muestra para que los límites de oscilación de la media se encuen
tren a determinada distancia, es decir para que el S„ no sea superior a
una determinada cantidad o magnitud.
Decimos que tratándose de series que presenten una distribución bino
mial de sus frecuencias, y que sus términos se expresen en porcentaje del
resultado o término máximo, este problema se soluciona muy fácilmente.
Veámoslo mediante un ejemplo:
Problema: En un medio ambiente en el que la diabetes afecta al 4%
de la población, ¿cuál ha de ser la población de la muestra para que las
medias que se obtengan no sean menores de 3 ni mayores de S%?
196
(0.04 + 0,96)5*4
s ,( -s .),y S A •
Es decir que en estos casos las muestras tendrían que tener una pobla
ción de 3.456 observaciones.
muestras hay 27 muestras que quedan fuera de estos Iimites, por lo cual
Esta es la razón por la cual el desvío standard (S*) de los datos de las
muestras binomiales expresadas en porcientos, es el error standard (Sm)
de la media.
Al hacer el cálculo de los limites del i. de c. de la m. debe expresarse
la media en porcentaje de! valor máximo independientemente de que los
datos de la muestra se expresen en valores absolutos, fraccionados o por
centuales.
Cuando se trata de una muestra binomial con una población grande,
superior a den, y "p” se halla entre uno y nueve décimos, su distribudón
de frecuencias puede asimilarse a una distribución normal y en consecuen-
da los lJ.c. de la m. se encuentran a 2 Sm (2SX) a derecha y a izquierda
de la media.
Ejemplo: Sobre un total de 1.923 nadmientos, 988 lo fueron de va
rones. La media es, por lo tanto, del 51%, se pregunta ¿dentro de qué
límites variará la media en el 95% de muestras similares a la nuestra?
Solución:
Respuesta
Como la media variará dentro de los dos errores standards alrededor
de nuestra media,
Respuesta
En el 95% de las muestras similares a la nuestra la media variará entre
el 48,8 y el 53.2%. A su vez, la media del universo ha de hallarse también
entre esos límites con una probabilidad del 95%.
Los límites del intervalo de confianza para ciertas “N" comprendidas
entre 10 y 100, o entre 2 y 1.000, pueden hallarse directamente sin
cálculo alguno, en las tablas correspondientes; por ejemplo, en Lamotte,
M., Estadistic Biológica, Trad. esp., ed. Toray-Masson, págs. 78 y 79, o,
en forma más completa, en Geigy Tablas Científicas, 6a. ed„ págs. 85 a
103. Ver Apéndice, Tabla 4.
202
INTERVALO DE CONFIANZA DE LA MEDIA
* - ( # ) ' - V
Notemos que eliminamos la radicación de este cociente, pero no la
del denominador del E.R. de la diferencia, que persiste.
Por lo tanto, el error relativo de la diferencia entre las medias es igual
_ Pi N, + Pa Na
N, + N,
Subsecuentemente Q = I - P
204
INTERVALO DE CONFIANZA DE LA MEDIA
1.
D
* -(mi - m ,)
_
j
lmi mil
-------- ---
* PQ , PQ
m, ( = P ,) = ^ = 0,062 = 6.2%
y en las segundas
205
ESTADISTICA MEDICA
Por consiguiente.
0 i P = I - 0.04S = 0.95S = 95,5%
Entonces:
V 1010 2015
Siendo el E.R. de la diferencia entre las medias muy superior a 2,
dicha diferencia es altamente significativa.
Con un ligero error en el resultado, error que no siempre afecta
mayormente a la respuesta . pueden lomarse “p" y
cada muestra. Entonces
206
INTERVALO DE CONFIANZA DE LA MEDIA
-------------------- - - o
^ Pi qi , Pi q» a 7S X 25 + 85 X 15
\ N, N, V 1010 2015
Veamos un ultimo ejemplo
Entre 50 varones encontramos un 4% de resfriados y entre 50 mujeres
un 14%; se pregunta: ¿hay una diferencia significativa entre varones y
mujeres a este respecto? Tengamos cuidado con P y 0.
I 9 X 91 , 9 X 91
207
ESTADISTICAMEDICA
208
muestras formadas por 64 observaciones, como es la nuestra, pero si para
muestras de 60 y de 70 observaciones; en este caso, decimos, tenemos que
hallar los límites, por interpolación de los tamaños de las muestras.
Recordemos que el tamaño (T) de una muestra es igual al producto
de la media (m) multiplicada por la población (n). Es decir
T = 16
En la tabla vemos que para r= 16 los límites inferiores son 0,161
para n = 60 y 0,137 para n = 70. Estos son los valores inferiores de las
209
ESTADISTICA MEDICA
siendo mayor T sup 2, que coresponde a n = 70, que T sup I, que corres-
(X, + X2).
f (x) = C? p‘ qN - \
211
ESTADISTICA MEDICA
Ai _ A3 . X! _ Xa
N, Na N, N, '
Ejemplo
En una región, entre 125 individuos (N| = 12S) se han encontrado
bocios en 3 (X, =3), y en otra, entre 155 (N, = 155) no se ha encon-
trado ninguno (X3 = 0). ¿La diferencia hallada es significativa?
Estamos en presencia de muestras en las que cada observación signi
ficó una alternativa o dilema: o se estaba en presencia de un bocio o no
se estaba. Se trata, por lo tanto, de muestras binomiales.
En esta muestra, si bien la suma de efectivo, y aun los efectivos de
cada muestra, supera a cien, "p” en una de ellas es igual a 77, =
= 0,024 = 2,4% y en la otra es igual a jf*- = 0 = 0%; es decir que en
ambas muestras (basta con una sola) “p” es menor del 10%. No podemos,
pues, asimilarlas a una muestra normal. Para calcular la significación de la
diferencia entre sus medias, debemos calcular la probabilidad de extraer
de un mismo universo uno o varios pares de muestras con los mismos
212
Anlilog. 2,94343 = 0,08778 = 8,8% = f — , — .
Otro ejemplo
Con un determinado medicamento aplicado.a 16 pacientes se curaron
7 (Ni = 16; X| =7); con otro medicamento aplicado a 20 pacientes se
curó 1 (Na = 20; X2 = 1). La diferencia entre y ^ ¿es o no sig
nificativa?
También aquí estamos ante un ejemplo en el cual cada observación
significó una alternativa: el paciente se curó o no. Se trata entonces tam
bién de muestras binomiales. La suma de los efectivos (16 + 20 = 36) es
inferior a cien. Tampoco podemos, por consiguiente, asimilarlas a una
muestra normal. También aquí para valorar la significación de la dife
rencia entre sus medias debemos calcular la probabilidad de obtener de un
universo único uno o varios pares de muestras cuyos efectivos sean los de
nuestras muestras, cuya suma de resultados sea igual a la suma de resul
tados de nuestras muestras, y cuya diferencia entre sus medias (o frecuen
cia de los resultados) sea igual o mayor que la diferencia de las medias
N, N, 16 20 '
Necesitamos conocer la suma de probabilidades de estos tres pares de
lucstras. Si esta suma es inferior al coeficiente de riesgo del 5%, la dife*
:ncia observada es significativa.
Para el 1er. par tenemos
f ( M ) ñ i
< (?) = ¿!
, „ c(f)c(f) ¿ j'A . . .
f 16 ' 20 r /36 \ J 6!_ 818! 36!
8! 28!
16! 28!
< (“ ) ' ¿ i
ESTADISTICA MEDICA
M U E S T R A S D E P O IS S O N
CAPITULO XVII
MUESTRAS DE POISSON
0,367879
0,061323 = 6%
Obtención de la media
Algo parecido ocurre con la media. Cuando en una distribución
binomial se desconoce el valor de "p”, no se puede hallar el valor de la
media, puesto que en una distribución binomial ésta es igual a “p” (si se
trata de porcentajes) o a “pN" (si se trata de valores absolutos). Pero si se
trata de frecuencias muy escasas en muestras muy numerosas, es decir si
se trata de una distribución de Poisson, el conocimiento de la frecuencia
de un resultado cualquiera, hasta de un resultado nulo, nos permite co
nocer la media. Por ejemplo, trabajando con virus no se puede saber, por
los métodos comunes, la pululación media de ellos en los diversos cul
tivos, por la razón de que no se los puede contar, pero como se puede
saber la frecuencia con que aparecen cultivos indemnes, es decir en que la
pululación es cero, podemos calcular el valor de la media aun cuando en
este caso el resultado es nulo, obteniéndolo de la ecuación
f(o )= ^
0!
221
ESTADISTICA MEDICA
f(o) = 0,3679 ,
entonces
-log 0,3679 - ( -1 + 0.S6S73)
m loge 0,43429
= » ~ 0.56S73 _ 0,43427 ^
0,43429 ~ 0,43429 * '
Es decir que el número medio (m) de virus por cultivo es muy apro
ximadamente igual a I.
Naturalmente, el problema puede resolverse más fácilmente y sin
cálculo alguno recurriendo a las Tablas de distribución de Poisson. como
la recién vista, y buscando en la horizontal del resultado cero, es decir en
la primera línea de la tabla, un valor de frecuencia igual o próximo al
nuestro. Hallado éste, basta levantar la vista y leer a qué media corres
ponde. Así encontraremos que en la primera columna se halla el valor
0,3679, el cual corresponde a la media uno: el mismo resultado obtenido
por el cálculo.
Como vimos que
e = f(o) .
también
f(o) = 0,3679 = e-1" .
222
MUESTRAS DE POISSON
0,367879 = e-1
de donde concluimos que
Ejemplo
¿Cuáles son los limites del intervalo de confianza del 95% del resul
tado “x" o "r" = 33 en una muestra cuya población “n" = 12.000?
223
Lj .c j. = 22,715 y 46,345
224
S exta P arte
CONCEPTO
X es la suma de los desvíos cuadráticos relativos obtenidos compa
rando clase a clase las frecuencias absolutas observadas en cada clase real
con las frecuencias absolutas calculadas para la clase correspondiente, en
una muestra de la misma población que la muestra observada, pero cuyas
frecuencias de clases sean las de dichas clases en el universo del que pro
viene la muestra calculada.
Los desvíos cuadráticos relativos (d.c.r.) se calculan dividiendo el
cuadrado de la resta de la frecuencia absoluta observada en una clase
menos la frecuencia absoluta calculada para dicha clase en la muestra teó
rica, por la frecuencia absoluta calculada. Es decir:
228
METODO DE PEARSON
229
METODO DE FEARSON
Grado de libertad
Los valores de X1 aumentan con el grado de libertad, llamando asi al
número de clases de la muestra teórica que puede variar su población o
efectivo de clase sin afectar la población o efectivo de la muestra, la cual
está fijada de antemano, pues debe ser igual al de la población de la mues
tra real.
Es evidente que si una muestra está formada por un número n de
clases (tres, por ejemplo: n = 3), sólo podrán variar sus efectivos libremen
te, n - 1 clases (en nuestro ejemplo, n - 1 = 3 - I = 2 clases); ya que,
una vez fijado el efectivo o población de estas n - I clases, el efectivo o
población de la clase restante queda automáticamente fijado, pueí debe
ser igual al efectivo de la muestra menos la suma de los efectivos de las
otras clases: es decir que esta última ciase carece entonces de libertad para
variar su efectivo o población.
El grado de libertad de una muestra teórica es igual, cuando más, al
número o cantidad de clases menos uno.
Y decimos cuando más porque si la muestra teó ca además de la
condición de tener la misma población o efectivo que la muestra real
tiene que satisfacer alguna otra condición, por ejemplo, que tenga algún
otro parámetro del mismo valor que el de la muestra real, el grado de
libertad será igual a la resta del número o cantidad de clases, menos el
número o cantidad de condiciones. Por ejemplo, si la muestra teórica debe
tener no sólo la población o efectivo igual a la muestra observada, sino
también la media con igual valor que la media de la muestra real, el grado
de libertad será n - 2. Y si, no sólo la población y la media deben tener
igual valor en una y otra muestra, sino también el desvío tipo, el grado de
libertad será n —3: etcétera.
Cuando en vez de ser una sola la muestra observada son dos o varias
las observadas al mismo tiempo, el grado de libertad de las muestras teó
ricas que se calculan a! mismo tiempo es igual al producto del grado de
libertad de las muestras por el número de muestras (m) menos uno. Por
ejemplo: si el grado de libertad de las muestras es n —1, el grado de li
bertad del conjunto de las muestras teóricas es (n - I) (m —1).
Restricciones
Al trabajar con x3 hay que tomar en cuenta las siguientes resfrie
231
METODO DE PEARSON
± + i_ + ü = ± + i. + 11= 12 = 0,,
25 50 25 25 25 25 25
Grado de libertad n - 1 = 3 - 1 = 2.
En una tabla reducida, de coeficiente de seguridad o intervalo de
confianza del 95%, o en la columna correspondiente a una probabilidad
de error del 0,05, vemos que el valor límite de xi es 5,99. Como nuestro
nificativa.
En resumen: X1 = 0,88 nos dice que la diferencia hallada es simple
mente casual. Veamos otro ejemplo.
233
ESTADISTICA MEDICA
n significativamente diferentes?
Como en la muestra teórica las dos primeras clases, asi como la úl
tima, están formadas por un número de observaciones menor a 5, reuni
remos en cada muestra las tres primeras clases y las dos últimas. En esta
forma, ninguna de las clases teóricas tendrá un efectivo menor de 5.
Las muestras que comparar serán ahora
234
5,66
gnificativas.
Se recurre al método del xJ •
236
Los valores calculados se obtuvieron suponiendo que no hay dife
rencia de resultados siguiendo uno u otro procedimiento terapéutico; es
237
METODO DE PEAKSON
v? . 3-é - 1-8
Discusión y solución
La planilla de operaciones la armamos de la siguiente manera: Colo
camos en linea horizontal las distintas muestras y en columna vertical las
distintas clases, dejando un espacio a la derecha de cada valor observado
para colocar el valor que calcularemos después. Así:
239
METODO DE PEARSON
N° de val. indep. = (2 - I) X (2 - I) = 1 X I = 1 .
Calculados los valores de acuerdo con la hipótesis, corresponde armar
Dijimos que:
« ..s - fc S l
(o -ty
c
(10 - 15)a _ <- 5>] 25
1,66
15 1S 15
(30 - 2S)* = <+ S>* 25
1,00
25 25 25
(6S - 60)* „ (+ 5 >* 25
= 0,41
60 60
(95 - 100)1 ( - 5)’ 25
- 0,25
100 100
! = 3,32
Observación I
De paso observaremos que, tratándose de una tabla de 2 muestras con
2 clases cada una, o, como suele decirse, una tabla de 2 X 2, los cual'
241
ESTADISTICA MEDICA
numeradores son ¡guales, por lo cual basta calcular uno y ponerle después
como denominador el valor calculado correspondiente.
Observación 2
d D
Entonces
(ad - cb)2 Z
X1 = A BC D
simple casualidad.
En otras palabras, las diferencias encontradas entre los valores obser
vados en nuestros vacunados y no vacunados por un lado, y los valores
242
METODO DE PEARSON
Sohtción
Se recurre a la prueba de Ji cuadrado, organizando la planilla de ope
raciones en la siguiente forma:
243
Sobre la base de esta hipótesis se calcula cuál será la proporción de
recidivas con cualquiera de los dos tratamientos. Para ello se juntan las
dos muestras y se encuentra que sobre 237 pacientes tratados 166 presen
tan recidivas.
Según esta proporción, se calcula cuántos de los 139 pacientes que
recibieron el tratamiento A debían presentar recidiva: 444* 139 =
(O - C)»
(106 - 97,3)»
97,3
(33 - 41.7)1
(60 - 68,7)a
68,7
(38 - 29,3)»
29,3
245
246
METODO DE PEARSON
247
en inmaduros, prematuros y maduros. En cada una de estas muestras se
valoró el volumen de la hemorragia en menos de 14 litro, entre 14 y 1 litro
y más de 1 litro. El número de casos observados en cada categoría es el
que aparece en la planilla.
Para su solución se siguió el método de x*-
SOLUCION: Se confeccionó la planilla de operaciones en la siguiente
248
METODO DE PEARSON
250
1 (0,515)» (0,485)° = (0,515)»
- “ “ (O.SIS)7 (0,485)' = 8 (0.515)7 (0,48
(342 - 264)*
264
(2092 - 1994)*
252
METODO DE PEARSON
(14959 - 14627)» _ 332a _ 110224
14627 “ 14627 “ 14627
(10649 - 11035)» _ 386» _ 148996
11035 “ 11035 = 11035
(5331 - 5203)» _ 12£ = 16384
5203 “ 5203 5203
METODO DE PEARSON
255
ESTADISTICA MEDICA
2S6
METODO DE PEARSON
(C - 1) (F - 1) = (8 - 1) (2 -.1 ) = 7 X 1 = 7 nos da 7.
ESTADISTICAMEDICA
258
METODO DE PEARSON
259
ESTADISTICA MEDICA
Correlación. Concepto
Cuando son dos las variables observadas al mismo tiempo en cada
objeto de la muestra, puede ocurrir que ambas están asociadas, es decir,
reciprocamente relacionadas, o como se dice en estadística, que estén
correlacionadas, o que no lo estén. Correlación es, por lo tanto, la rela
ción reciproca u asociación que puede existir entre dos variables simultá
neas de una misma observación.
En este caso, una modificación cuantitativa en una de ellas irá acom
pañada de otra modificación, también cuantitativa, en la otra.
Esta asociación o correlación puede ser visible a simple vista con sólo
observar un cuadro de valores o un diagrama de dispersión.
Por ejemplo, en cinco pacientes de la sala se ha tomado simultánea
mente el pulso y la temperatura y se ha obtenido el siguiente cuadro de
TEMPERATURA
60 36,6
70 37.2
80 37.8
90 38.3
100 38.9
263
ESTADISTICA MEDICA
100
90
80
70
60
36 37 38 39 409 Temp.
264
horizontal, es decir paralela al eje de las x) tendría una rampa o pendiente
más o menos pronunciada. En estos casos diríamos que el diagrama
muestra una asociación rectilínea ascendente o positiva, en un caso, o des
cendente o negativa, en el otro.
El diagrama obtenido con los datos del pulso y la temperatura nos
muestra una asociación o correlación rectilínea positiva o ascendente.
El diagrama de dispersión de un8 muestra de distintas concentraciones
de un soluto en un solvente, en la que se tomase nota simultánea de la
concentración y de la dilución, nos mostraría una asociación o correlación
rectilínea descendente o negativa, pues los puntos se ordenarían siguiendo
una línea recta descendente o negativa, indicándonos gráficamente que a
medida que disminuye la concentración aumenta la dilución.
El diagrama de dispersión de una muestra de un conjunto de adoles-
265
en estas fórmulas “x” e "y" simbolizan cada una de las variables observa
das simultáneamente.
Esta fórmula puede presentarse asi:
S(x —x ) ( y - y )
S, Sy
uc ‘ ~ iTsTsy sTs,
o sea, el coeficiente de correlación es igual a la covarianza dividida por el
producto de las desviaciones standard de ambas series de variables.
En este caso, si al hacer el cálculo de la covariancia, en vez de tomar
las diferencias de los datos a la media, se toman las diferencias de los
datos a 0, el resultado debe disminuirse en el cuadrado de la media com
binada (co-media), es decir en el producto de ambas medias x e y.
Entonces:
Esta fórmula puede sufrir las siguientes transformaciones:
2 (x y) n x y 2 (x y) - n x y
lísTS ■ <6)
2 (x y) - (2 x) y
2 (x y) - 2 x 2y/N_________ m
r ' x/ 2 xJ - (2 x)2/N -J 2 y J - (2 y)2/N
Todas estas transformaciones de la fórmula primitiva tienen por
objeto simplificar los cálculos, evitando la necesidad de calcular el D.R. y
aun el D. simple de cada observación.
Variaciones deI coeficiente de correlación
El C. de C. puede variar desde -1 hasta +1. pasando por 0.
Si r = 0, no existe correlación.
Si r = +1 ó - 1, la correlación es perfecta.
Si r es positivo, la variación en ambas variables tienen el mismo sen-
267
Solución Lo primero que debe hacerse es conslruir un cuadro de valo
res y después un diagrama de dispersión, como ya lo hemos hecho, para
ver si hay o no evidencia de correlación.
Eslc último, el diagrama, es especialmente importante, ya que el
cuadro, si está formado por muchos valores, puede no ser muy claro, y el
diagrama, en cambio, sí lo es, al mostrar gráficamente una tendencia al
agrupamicnlo de los puntos.
Vamos ahora a confirmar la existencia de dicha asociación y de su
signo y precisar su grado, calculando el C. de C. de nuestra muestra.
Haremos uso primeramente de la fórmula 1 bis, página 266.
Z (x -x )(y -y )
(n -l)S * S y '
x; y; (x - x); (y - y); (x - x) (y -
Tomaremos como x los valores de las tempcri
s del pulso, es decir que consideraremos el p
(x -x l(y -y )
36,6 60 -1 1339,56
37.2 70 -0 1383.84
37,8 80 +0 1428.84
38.3 90 +0 1466,89
1513,21 10000
7132,34 33000
ASOCIACION
- = 37,76 ; y = -
y para el S* y el S
1339.S6 3600
1383.84 4900
1428.84 6400
1466,89 8100
1513,21 10000
7132,34 33000
V S *1 - * Z X ~ ^ P ~132'34 ~ 37'76 X 188,8 = 09
33000 - 80 X 400 1J g
»->)■ * "l : T * J -
_ £ ( x y ) - n y y = 15161 - S X 37.76 X 80 = +
' ~ (n - 1)S, S,. 4 X 0,9 X 15,8
Regresión. Concepto
Cuando dos variables están asociadas (correlacionados), la magnitud
de la variación de una de ella está relacionada con la magnitud de la varia
ción de la otra.
La variable que se considera dependiente de la otra suele simbolizarse
por "y", y la otra, la independiente, por "x".
A veces se dice que "y" es función de "x" y se escribe así:
y = f(x)
bn estos casos interesa saber cuáles son los valores de “y" para cada
valor de ”x", o sea, como se dice en estadística, conocer la regresión de
“y" a “x”. Regresión es, por lo tanto, la relación cuantitativa entre la va
riación de una variable y la variación de la otra variable a la cual se Italia
asociada o correlacionada.
Esta relación se expresa simbólicamente por una ecuación que se
denomina ecuación de regresión.
Hemos visto que llevando los valores de “x” e "y" presentados por
puntos a un sistema de coordenadas ortogonales cartesianas, puede verse si
dichos puntos forman una figura alargada, con un eje recto o curvilíneo.
En el primer caso, esto es, cuando la figura alargada formada por los
puntos tiene un eje rectilíneo, las variaciones de “y" relacionadas a las
variaciones de "x" están expresadas por una ecuación de regresión de los
valores de "y” a "x” y esa ecuación tiene la forma general y = a + b x,
b„ = -V -4 = r = J ^
x -x s,
273
ESTADISTICA MEDICA
¡ta expresión
as de tempe-
274
ASOCIACION
y- y = f-g — (x - x)
y por lo tanto
Sv
y = y + r - jr - ( x - x ) = y + b ( x - x ) = y + b x - b x .
Ejemplo
En nuestras observaciones pareadas de temperatura y pulso, la ec
ción regresión se obtiene de la siguiente manera:
y = 80
x = 37,76
r = +1
S , = 15,8
S, = 0,9
y = 7 + r - |^ - ( x - S )
1S.8 x - 524.6
= 17,55 x - 582,9
0,9
Obtenida la ecuación, es muy fácil representarla gráficamente en un
stema de coordenadas ortogonales. Para ello basta determinar los puntos
ii les cuales la recta corta a los ejes de las coordenadas.
Para esto, en la ecuación y ~ a + bx, con los parámetros “a” y “b"
recisados previamente, se hacen sucesivamente “x” e “y" igual a 0.
275
ESTADISTICAMEDICA
276
ASOCIACION
277
ESTADISTICA MEDICA
278
lia correspondiente, en la siguiente forma:
_ T tr
y = y + b,* (x - x ) -
ESTADISTICAMEDICA
Z y, f = +5
y =v.a. + (d.c.)(y,)
= 71 + 10 X 0,06 = 71 +.0,6 = 71,6
281
ESTADISTICAMEDICA
En U misma foima podemos proceder para calcular el hacinamiento
Sy = 17,42.
S x ' f = 184
■= ÍW ~
,5929
S* = 3,99
284
ASOCIACION
— -0,77X0,06
+0,61
1,742 X 1,329
Vimos que cuando el error standard es superior a 14r, hay una proba
bilidad superior al 5% de que al mismo se lo haya obtenido por azar.
Nuestro error standard es alrededor de 1/8 del C. de C., es decir mucho
s%
. ’V90 P
(O -C )3
c
(2714 - 2473)’ = <241>* 58081
2473 2473 2473
(3129 - 3370)’ = <24l>’ 58081
3370 3370 3370
(115 -356)’ = <24l)a S8081
356 356 356
(726 —485)’ _ (24l)a 58081
485 48S 485
288
Ejemplo n° 2
Se trata de saber si hay correlación entre el color del cabello y el
sexo de las personas.
289
ESTADISTICAMEDICA
Con estos ¿os valores independientes podemos calcular los restantes. Nues
tro X3 seri, por lo tanto, Xa-
Obtenidos los valores calculados, podemos armar ya los quebrados,
cuya suma seri x! ■Son:
(O-C)»
c
(98 - 92.71a (S 3 £ 28,09
92,7 92,70
(260 - 263)3 (3)* 9
263 263 263
(127 - 129,3)* (2.3)1 5,29
127,3 127,3
(3.3)* 28,09
105,3 105,3 105,30
(302 - 299)1 (3? 9
299 299
0 3 )1 5,29
146,7 146,70
Xj = 0,69
Consultando una tabla de x3 vemos que para dos valores independien
tes, a una probabilidad del 5%, le corresponde un xi de 5,99 (Xa = 5,99).
Por lo tanto, a un Xa mucho menos le corresponderi una probabilidad
mucho mayor. En efecto, en una tabla completa vemos que a un xj de
0,69 le corresponde una probabilidad entre .el 70 y el 80%. Esto significa
que las diferencias encontradas por nosotros entre los valores observados y
los calculados sobre la base de la no correlación del color del cabello con
el sexo son diferencias que se dan con mucha frecuencia, lo cual equivale
a decir que no son diferencias significativas, es decir que se confirma la
hipótesis de que entre el color del cabello y el sexo no hay correlación.
290
ASOCIACION
Análisis de la covaríanza
Cuando se tienen dos o más muestras cuyos datos (x) podrían estar
influidos por un factor cuyo valor no podemos medir directamente,
pero que actuaría sobre los datos (y) de observaciones hechas de estos
mismos elementos, la comparación de estas muestras debe hacerse por el
= Zx,Zy,/N, +Zx,Zy,/N ,d
291
El numerador de la V.g. de x ajustada es el numerador de V.gjc me
nos el cuadrado del numerador de la V.gjcy dividida por el numerador de
la V.g.y. H denominador es el de V.gx menos uno; es decir:
Varianza global de x ajustada =
Sx» - (Sx)»/N - CSXy - SxSy/N )»/^» - ( S y f j N
N —2
El numerador de la V. “intra” del producto xy ajustado es el numerador
de la V. “intra** x menos el cuadrado del numerador de la V. “intra** xy
dividido por el numerador de la V. “intra” y. El denominador es el de la V.
“intra” x menos uno; es decir
Varianza "intra"de xy ajustada =
Sx» - “d**x - (Sxy - “d"xy)»/SyJ - “d*’y
N -H -l
La varianza “inter” de x ajustada es igual, numerador a numerador y
denominador a denominador, a la V.gjc ajustada menos la V. “intra" xy
ajustada; es decir:
Varianza "Ínter" de x ajustada —
= H -l
292
ASOCIACION
dbido. ** **
Los datos "x” e "y” de cada paciente se dan a continuación:
Grupo 2 Grupo 3
10 14 5 11 5 7
2 9 4 6
8 11 6 8 1 2
6 12 5 10 7 10
9 10 4 10 9 7
7 11 8 10 4 7
10 12 5 6
6 9 2 3
6 11 4 10 2 2
7 10 6 11 5 9
N = 30 H=3
293
ESTADISTICA M
v „ ,J
2642 - 2526,2
3 0 -3
688 - 1615,3
3 0 -3
V.g. x ajustada = —
“intra” xy ajustada = —
n - S. « ,
294
APENDICE
li* m u m u
Sil m u m u
55 5 5 5 5 5 5 5 5
l i m u m u is iiiiim m u m u m is
lis m u m u i m m m m u m i s m i s
l i m u m u u iim is i m u m u m u
li! m u t u u u i u u u i m u m u m u
353 5* 5 *5 5* 333 3 SS 35S9 3 5 3 3 3 3 3 5 3 3 33333
l i m u m u u iiih m i m u m u m u
lis m u m u m u u i u m u m u u u i
3 3 5 3 3 55SS3 33 3 3 3 3 5 3 3 3 3 3 5 3 5 3 3 3 3 3 33333
l i m u U H IU U U U U U U IU U IU U I
li! u u i m u u u u i i t i u u i m u m i l
R.S.B.n*.
APENDICE
Esta tabla da directamente los valores de las dos tablas a que hacemos
referencia en las páginas 90 y 92, e indirectamente a las de las tablas a las
que nos referimos en las páginas 94 y 95, procediendo en la siguiente
299
ESTADISTICAMEDICA
Explicaciones a la Tabla 2
El desvia l se utiliza en muestras con un efectivo menor de 60 obser
vaciones y es igual a * (como el desvio c). pero en estas muestras
pequeñas el desvio standard es igual a / —
En la tabla se dan áreas externas exactas a desvíos í aproximados.
Estas áreas extemas se denominan también probabilidad P.
300
U m ite dd intovsJo de confw ua dd 955 de una o edú tónomial cuaido el efectivo d ( h n u o tn e iti enlit 10 y 100
APENDICE
Ejemplo
¿Cuáles son los límites del í. de c. de la media p = OÍS correspon
diente al resultado 16 de una muestra con efectivo 64? Como el efectivo
no comprende decenas exactas, se tomarán en la tabla las medias límites
para el resultado 16 y los efectivos 60 y 70.
70 0,137 9,59
304
Explicaciones a la Tabla S
Esta .tabla da las medias (expresadas en forma decimal) limites infe
rior y superior para muestras con un efectivo de 4 a 10 observaciones y
resultados de 0 a 10.
Ejemplo
Si en una muestra de 7 observaciones (n = 7) el resultado es igual a 5
(r = 5). es decir, si la media (r/n) es igual a 0,714, las medias limites son:
0,290 y 0,963. (En valores absolutos: 2,03 y 6,74)
illilü
305
ESTADISTICAMEDICA
Explicaciones a la Tabla 6
En las muestras de Poisson la media depende exclusivamente de la fre
cuencia del resultado, de modo que conocidos estos (frecuencia del resul
tado) la media puede ser obtenida en la Tabla buscando en la horizontal
del resultado (r) un valor de frecuencia igual, o próximo, al obtenido en
la muestra. El encabezamiento de la columna en que se halla esta frecuen-
Ejemplo
En una muestra numerosa el resultado 2 se encontró en el 18,4%
( = 0,184) de las observaciones. Deseamos saber cual es la media coues-
pondiente a dichas obseivadones.
306
APENDICE
Explicaciones a la Tabla 7
Los limites del i. de c. estin dados por la Tabla en base al resultado y
al efectivo de la muestra.
En la primera columna se buscará el resultado (r), o sea el numerador
de la media (m =-£ ), y en la segunda columna se hallarán los numera
dores de los límites. Para obtener las medias límites habrá que dividirlos
por el efectivo (n) de nuestra muestra.
307
Si nuestra media es 1% ( = 0,01) por ser el resultado 1 y el efectivo
100, los límites son 0,025% y 5,572%; pero si la media es 1% por ser el
resultado 2 y el efectivo 200, los límites son y es decir:
0,12% y 3,61%.
Explicación a la Tabla 8
Se llama factorial de un número (n! ) al producto de dicho número
por el producto de los que le siguen en la serie natural descendente de los
mismos:
al = n X (n — 1) X (n - 2) X (n - 3) X . . . X 3 X 2 X 1
308
APENDICE
Coeficientes binomiales
Explicaciones a la Tabla 9
Se llaman coeficientes binomiales a los coeficientes de ios
resultantes del desarrollo de un binomio elevado (a +b)N. Cada i
estos monomios indica la frecuencia de un resultado (R) de un:
binomial, desde el resultado máximo igual al exponente (N) del bi
hasta el resultado Cero.
Estos coeficientes se simbolizan C* y también (¡j), y su valor e:
N-__
309
INDICE ALFABETICO
g=T i
i
J a s s 5 - - ;;;
EDITORIAL
UNIVERSITARIA
DE
manuales
BUENOS AIRES
de eudeba