Академический Документы
Профессиональный Документы
Культура Документы
Definicion
La estadística es una ciencia con base matemática referente a la recolección, análisis e
interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde
las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en áreas
de negocios e instituciones gubernamentales.
Fenómenos o sucesos
Llamamos fenómenos o sucesos aquellos cuyos resultados no pueden predecirse antes de la
realización. Son experimentos que no dan siempre el mismo resultado al repetirlos en las mismas
condiciones. Un suceso elemental en el resultado de cada una de las realizaciones del experimento
aleatorio.
Cualquier suceso al conjunto vacío se llama suceso imposible y por tanto, será un suceso que no se
produce nunca. Cualquier proceso que sea igual al espacio muestral se llama suceso seguro, es el
que ocurre siempre.
Escalas de medición
USOS Y ABUSOS
Uso:
Abuso:
X F
1 2
2 1
3 1
5 2
7 3
8 1
9 1
10 2
Gráfico de líneas
X(horas) Xm F
300-400 350 2
400-500 450 6
500-600 550 10
600-700 650 8
700-800 750 4
S 30
Barras múltiples: es muy recomendable para comprar una serie estadística con
otra, para ello emplea barras simples se distinto color o tramado en un mismo
plano cartesiano, una al lado de la otra
Barras compuestas: en este método de graficacion las barras de la segunda serie se
colocan encima de las barras de la primera serie en forma respectiva.
CIUDAD TEMPERATURA
A 12
B 18
C 24
Cuartiles y Percentiles
Cuartiles, Deciles y Percentiles:
Si un conjunto de datos está ordenado por magnitud, el valor central (o la media de los
dos centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo
esa idea, podemos pensar en aquellos valores que dividen al conjunto de datos en cuatro
partes iguales. Esos valores denotados Q1, Q2, y Q3, se llaman primer cuartíl, segundo
cuartíl y tercer cuartíl, respectivamente. EL Q2 coincide con la mediana.
Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles, y
se le denotan D1, D2,...,D9, mientras que los valores que lodividen en 100 partes iguales se
llaman percentiles, denotados por P1, P2,...,P99. El 5º decil y el 50º percentil coinciden con
la mediana. Los 25º y 75º percentiles coinciden con el primer y tercer cuartiles.
Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles.
Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre
cuando los valores de su media y mediana están próximos), se usan para describir esa
variable su media y desviación típica. En el caso de distribuciones asimétricas, la mediana y
la amplitud son medidas más adecuadas. En este caso, se suelen utilizar además los
cuartiles y percentiles.
Rango
Situación de un dato respecto de una distribución.
Desviación media
Diferencia entre un valor y otro valor medio o típico.
ESTADISTICA
Una vez que se han recogido los valores que toman las variables de nuestro estudio
(datos), procederemos al análisis descriptivo de los mismos. Para variables categóricas,
como el sexo o el estadiaje, se quiere conocer el número de casos en cada una de las
categorías, reflejando habitualmente el porcentaje que representan del total, y
expresándolo en una tabla de frecuencias.
Para variables numéricas, en las que puede haber un gran número de valores observados
distintos, se ha de optar por un método de análisis distinto, respondiendo a las siguientes
preguntas:
a. ¿Alrededor de qué valor se agrupan los datos?
b. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy
concentrados? ¿muy dispersos?
Más formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la
variable en cuestión, el valor medio vendrá dado por:
Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y
por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que
se mide la variable estudiada.
En el ejemplo anterior la varianza sería:
Sx2=
Son índices que describen la variabilidad o dispersión y por tanto cuando los datos
están muy alejados de la media, el numerador de sus fórmulas será grande y la
varianza y la desviación típica lo serán.
Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica.
Para reducir a la mitad la desviación típica, la muestra se tiene que multiplicar por
4.
Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier
cambio de valor será detectado.
Otra medida que se suele utilizar es el coeficiente de variación (CV). Es una medida de
dispersión relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y
multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersión o
variabilidad de dos o más grupos. Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56,
83 y 79 Kg) cuya media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los mismos (150,
170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación típica de 21,3. La
pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las
desviaciones típicas observamos que la desviación típica de la tensión arterial es mucho mayor; sin
embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo
que calculamos los coeficientes de variación:
CV de la variable peso =
CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.
Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre
cuando los valores de su media y mediana están próximos), se usan para describir esa
variable su media y desviación típica. En el caso de distribuciones asimétricas, la mediana y
la amplitud son medidas más adecuadas. En este caso, se suelen utilizar además los
cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición.
El percentil es el valor de la variable que indica el porcentaje de una distribución que es
igual o menor a esa cifra.
Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de
sí al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que
dejan por debajo de sí el 25%, 50% y el 75% del total de las puntuaciones y así tenemos
por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3).
EJEMPLOS
1. VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los
valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada
una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y
calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias
de cada valor respecto a la media y dividiendo este resultado por el número de
observaciones que se tengan. Si la varianza es calculada a una población (Total de
componentes de un conjunto), la ecuación sería:
Ecuación 5-6
Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa
la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el
caso que estemos trabajando con una muestra la ecuación que se debe emplear es:
Ecuación 5-7
Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa
la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos
fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se
hace con el objetivo de aplicar una pequeña medida de corrección a la varianza,
intentando hacerla más representativa para la población. Es necesario resaltar que la
varianza nos da como resultado el promedio de la desviación, pero este valor se encuentra
elevado al cuadrado.
Ecuación 5-8
Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con
una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta
información le permite al gerente determinar cuanto es el promedio de perdidas causado
por el exceso de peso en los empaques y le da las bases para tomar los correctivos
necesarios en el proceso de empacado.
Unidad 3 “Probabilidad”
Definición
La probabilidad mide la frecuencia con la que ocurre un resultado en un experimento bajo
condiciones suficientemente estables.
Definición 2: Dado un experimento aleatorio con un espacio de n sucesos elementales , la
probabilidad del suceso A, que designamos mediante P(A), es la razón entre la cantidad de casos
favorables para la ocurrencia de A y la de casos posibles. En otros términos
El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos
resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el
experimento en las mismas condiciones. Por lo tanto, a priori no se conoce cual de los
resultados se va a presentar:
Ejemplo: lanzamos una moneda al aire: el resultado puede ser cara o cruz, pero no
sabemos de antemano cual de ellos va a salir.
Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas
de la probabilidad.
Ejemplo: en lugar de tirar la moneda al aire, directamente selccionamos la cara. Aquí no
podemos hablar de probabilidades, sino que ha sido un resultado determinado por uno
mismo.
Reglas de la Adición
La Regla de la Adición expresa que: la probabilidad de ocurrencia de al menos dos sucesos
A y B es igual a:
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente
P(A o B) = P(A) + P(B) – P(A y B) si A y B son no excluyentes
Siendo: P(A) = probabilidad de ocurrencia del evento A
P(B) = probabilidad de ocurrencia del evento B
P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B
Eventos Independientes
Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento
no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso
típico de eventos independiente es el muestreo con reposición, es decir, una vez tomada la
muestra se regresa de nuevo a la población donde se obtuvo.
Ejemplo:
lanzar al aire dos veces una moneda son eventos independientes por que el resultado del
primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el
segundo lanzamiento.
Eventos dependientes
Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de uno de
ellos afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso,
empleamos entonces, el concepto de probabilidad condicional para denominar la
probabilidad del evento relacionado. La expresión P(A|B) indica la probabilidad de
ocurrencia del evento A sí el evento B ya ocurrió.
Se debe tener claro que A|B no es una fracción.
P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A)
Reglas de Multiplicación
Se relacionan con la determinación de la ocurrencia de conjunta de dos o más eventos. Es
decir la intersección entre los conjuntos de los posibles valores de A y los valores de B, esto
quiere decir que la probabilidad de que ocurran conjuntamente los eventos A y B es:
P(A y B) = P(A B) = P(A)P(B) si A y B son independientes
P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes
P(A y B) = P(A B) = P(B)P(A|B) si A y B son dependientes
Ejemplos
Regla de la Suma
Ejemplo
En una muestra de 500 estudiantes, 320 dijeron tener un estéreo,
175 dijeron tener una TV y 100 dijeron tener ambos:
Ejemplo
La directora de la escuela de administración en Miami recolectó la siguiente
información acerca de los estudiantes de licenciatura del colegio:
Variable aleatoria
Distribución de probabilidades
Una variable aleatoria discreta es una variable que puede tomar sólo ciertos valores
diferentes que son el resultado de la cuenta de alguna característica de interés.
EJEMPLO 2: sea X el número de caras obtenidas al lanzar 3 veces una moneda. Aquí los
valores de X son x = 0, 1, 2, 3
Variable que toma un valor infinito de valores no numerables. Una variable aleatoria es continua si
su conjunto de posibles valores es todo un intervalo de números; esto es, si para algún a < b,
cualquier número x entre a y b es posible.
Distribución binomial
En estadística, la distribución binomial es una distribución de probabilidad discreta, mide
el número de éxitos en una secuencia de n ensayos independientes de Bernoulli , con una
probabilidad fija θ de ocurrencia del éxito entre los ensayos.
La distribución binomial es una generalización de la distribución de Bernoulli, a la que
puede llegarse nuevamente haciendo n = 1.
Su función de masa de probabilidad está dada por:
Por ejemplo, la distribución binomial se puede usar para calcular la probabilidad de sacar 5
caras y 7 cruces en 12 lanzamientos de una moneda. En realidad solo se calcula la
probabilidad de sacar 5 caras, pero como es lógico si en 12 lanzamientos de una moneda
sacamos 5 caras el resto deben ser cruces, 7 en este caso.
Por lo tanto debemos definir la variable "X: Número de caras obtenidas en 12
lanzamientos de moneda". En este caso se tiene que y resulta:
Observese que para el caso concreto de la moneda al ser la probabilidad de éxito θ = 0,5 la
Experimento binomial
Los ensayos son independientes, por lo que el resultado de cualquier ensayos en particular
no influye sobre el resultado de cualquier otro intento.
Distribución de Poisson
Ocurrencia
Distribución normal