Вы находитесь на странице: 1из 15

ESTADISTICA

Se ocupa del conjunto de métodos a utilizar para la obtención de datos, su organización,


estudio e interpretación en términos matemáticos, que permita efectuar un análisis y llegar a
una conclusión.

La estadística estudia fenómenos de tipo cuantitativo y cualitativo. Tratando:

a) Describir cómo funciona ese fenómeno en un contexto determinado.


b) Sacar conclusiones generales a partir de casos particulares

Etapas de la estadística

1) Estadística descriptiva : es aquella que organiza en tablas y describe el


comportamiento de la variable bajo estudio
2) Estadística inferencial : es aquella que obtiene conclusiones basadas en el análisis
de una serie de datos que son recolectados por lo común a partir de una muestra de la
población
3) Cálculo de probabilidades: se trata de una parte de la estadística que se ocupa de
brindar herramientas tanto a la descriptiva como a la inferencial y que consiste en
efectuar predicciones basadas en evidencia disponible y siguiendo un método
científico.

Definición de términos

 Universo o población: se refiere al conjunto de todas las unidades estadísticas que se


requiere estudiar (son todas las observaciones posibles)
o Serie: es un subconjunto de la población (cualquiera). Los elementos que
integran esa serie no fueron elegidos siguiendo alguna técnica estadística.
o Muestra: subconjunto de la población pero que se caracteriza por ser
característico de la misma. Dado que los elementos fueron seleccionados por
alguna técnica estadística.
 Unidad estadística: es la mínima porción con características del todo. Es aquella
unidad sobre la cual se van a practicar las observaciones o producciones.
 Variable: se trata de elementos con los cuales se miden/clasifican las unidades
estadísticas. Se trata de la característica de la variable que se quiere investigar.

EJEMPLO:

- Población: alumnos de la Universidad de Morón


- Unidad estadística: el alumno
- Variable: altura, peso, raza, sexo

Clasificación de variables

 Cuantitativas: son aquellas que tienen valor numérico. Pueden subclasificarse en


o Discretas: Números enteros
o Continuas: Cuando entre dos valores enteros existen otros que poseen
validez estadísticas

Toda variable continua se puede discretizar. No obstante siguen siendo continuas. Téngase en
cuenta que ninguna variable discreta puede ser continua. Porque las discretas descartan
cualquier otra información que no corresponda.

 Cualitativos: son aquellas que no se pueden medir numéricamente


o Ordinal: encierran un orden especifico
o Geográfico: se identifican con unidad geográficas
o Cronológica: la denominación de la variables obedece a su lugar en el tiempo

Series de frecuencia

Su objeto es buscar medidas características que describan la distribución de una variable. A


través del método estadístico se recolectaría información y previo a su organización en tablas
se arribará a conclusiones.

Frecuencia: es el número de veces en que se repite un suceso

Cuando los valores son pocos puede optarse por trabajarse puntualmente.
Cuando aumenta el número de variables lo conveniente quizás sea obtener su frecuencia
absoluta.

Frecuencia Absoluta (fi): cantidad de veces que se repite cada variable.


La suma de frecuencia absoluta es el total de la población de estudio

Frecuencia relativa: es la participación de cada valor de variable en el total de observaciones.


Osea que el consciente entre la frecuencia absoluta y el tamaño de la población. Generalmente
se expresa en porcentaje.

Frecuencia absoluta acumulada: es la acumulación de las frecuencias absolutas. En la


primera fila se coloca la primera frecuencia absoluta simple, en la fila siguiente se anota el valor
de dicha frecuencia más la que le sigue y así sucesivamente.

Frecuencia relativa acumulada: es la acumulación de las frecuencias relativas.

La tabla de frecuencia tiene como objeto ordenar los datos para facilitar el cálculo de todas las
medidas

Intervalo de clases

Cuando los valores son muchos o la variable es continua se hace necesario agrupar los datos
en intervalos de clases
De acuerdo a la amplitud o rango de clases (máximo valor menos menor valor) de acuerdo al
máximo valor y el tipo de variable se determinara la cantidad de intervalos.

Amplitud del intervalo

Cantidad de intervalos está muy relacionada con la amplitud de cada intervalo. Lo primero que
se hace es tomar un valor ligeramente superior al valor máximo de variable y se le resta un
valor ligeramente inferior al valor mínimo.
Luego se busca un número natural que divida a dicha amplitud. Ese número indica la cantidad
de intervalos que se van a tomar.
Por último al realizar dicho cociente queda determinado la amplitud de cada intervalo.

Por convención los intervalos van a ser cerrados a la izquierda y abiertos a la derecha.
Generalmente tienen la misma amplitud. Puede ser que esto no se cumpla en el primero y en el
último. Que exista diferencia de amplitud en algún intervalo del medio. Tienen que darse
situaciones de distribución de variables muy particular.

MEDIDAS QUE CARACTERIZAN UNA DISTRIBUCIÓN DE VARIABLES


• Moda o Modo
Medidas de posición
• Mediana
• Media Aritmética representativas
Posicion • Media Armónica
• Media Geométrica
• Cuantiles

• Amplitud o Rango
• Desvio Medio
• Desvio Mediano
Medidas Dispersion • Desvio Modal
• Varianza
• Desvio Estandard
• Coeficiente de variación

• Asimetrica
Forma • Apuntamiento

MODO

Es el valor de variable que se repite mayor cantidad de veces. Osea al que le corresponde
mayor frecuencia absoluta
Una distribución puede ser unimodal (un solo modo), bimodal (dos modos), plurimodal (más de
dos modos)
Si los datos están agrupados en serie de frecuencia simple se busca la frecuencia más alta y el
valor que corresponda a esa frecuencia es el modo

Mo = li Mo + (d1/(d1+d2)) X Ci Mo

Mediana

Es el valor de variable que en una serie ordenada divide a la misma en 2 partes de igual
número de elementos
La mediana también es asociada a un cuantil
Cuando es par hay que hacer un promedio de los dos valores centrales

Me = li Me + ((N/2 – Fi (Me-1))/ fi Me) X Cme

Posición: N/2

Media Aritmética

Es el cociente entre la suma de los valores de una variables y la cantidad de valores u


observaciones disponibles. Cuando los valores de variables están asociados a una frecuencia
superior a 1, a los efectos de calcularla, tendremos que considerar las veces que la variable se
repite. Es decir su frecuencia absoluta.

Propiedades de la Media Aritmética


1) Es siempre un valor de variable comprendido entre el mayor valor observado y el
menor de la misma
2) Es sensible a los valores extremos que puedan intervenir en su cálculo. Es decir que
de existir valores extremos el promedio se dispara hacia el ese valor. En estos casos
se aconseja suprimir el valor extremo. En caso de no poder hacerlo en la practica la
media aritmética suele sustituirse por la mediana.
3) La unidad de medida de la variable es igual a la unidad de medida de la media
aritmética
4) La sumatoria de los desvíos a la media es siempre igual a 0. Se entiende por sumatoria
de desvíos a la sumatoria de las diferencia entre cada valor de variable y la media
aritmética.
5) La media aritmética de la suma de variables es siempre igual a la suma de las medias
aritméticas de cada una de las variables.
6) La media aritmética de la suma o diferencia de una variable y una constante es igual a
la media aritmética de la variable más o menos la constante
7) La media de un producto de variables es igual al producto de las medias aritméticas
respectivas en cuanto y cuando sean independientes.
8) La media aritmética del producto o cociente de una variable y una constante es igual a
la media aritmética de la variable multiplicada o dividida por la constante

Media Geométrica

Es un promedio que en su cálculo aplana las diferencias, esto es, se utiliza cuando hay valores
extremos de variable muy grandes. Pero no puede utilizarse cuando la variable registre valores
negativos o iguales a 0.

A cada valor de variable se lo eleva al valor de su frecuencia absoluta y se lo multiplica por un

l l
numero productor que resulta ser un operador que varía de 1 a , siendo el tamaño de la
serie.

Media armónica

Es la inversa de la media aritmética. Se utiliza cuando se posee relaciones inversas entre los
valores que toma la variable y su frecuencia. La medida más representativa en estas
situaciones suele ser la media armónica

MEDIDAS DE POSICIÓN

Cuartiles
FORMULA GENERAL

li + Nr – Fi -1 X Ci
fi
MEDIDAS DE DISPERSIÓN

Cuantifican la dispersión entre los valores de la variable y algún valor de tendencia central. En
general el promedio aritmético y otras como la mediana y el modo.

Las medidas de dispersión sirven para comparaciones entre grupos y para determinar si el
promedio aritmético es representativo del conjunto de datos. Si la dispersión es baja podemos
decir que el promedio aritmético representa muy bien al conjunto de datos, pero no en caso
contrario. Es decir, a mayor dispersión el promedio no representa bien al conjunto de datos

•Rando o Amplitud
•Rando intercuartilico
•Varianza
Absolutas •Desviacion Estandard
•Desvio Medio
•Desvio Mediano
•Desvio Modal

Medidas de
Dispersión

•Coeficiente de variación de
Pearson
•Coeficiente de variación Medio
Relativas •Coeficiente de variación
Mediano
RANGO: Valor Max (Xi) – Valor Min (Xi) •Coeficiente de variación Modal

RANGO INTERCUARTILICO: q3 – q1

VARIANZA
Es el promedio de la suma de los desvíos de cada valor de la variable y su media elevados al
cuadrado

Varianza muestral

DESVIACIÓN ESTÁNDAR

Sirve para comparar dos poblaciones. Se calcula como la raíz cuadrada de la varianza

DESVIO MEDIO

DESVIO MEDIANO

Me
e DESVIO MODAL

Mo
o
VARIANZA DESVIACION ESTANDAR
g2 >=0 g>=0
Si la variable es una constante la Si la variable es una constante la
varianza es igual a 0 desviación estándar es igual a 0
La unidad de medida de la varianza La unidad de medida de la desviación
es la unidad de medida de la variable estándar es igual a la unidad de
elevado al cuadrado medida de la variable
La varianza de una suma o diferencia La desviación estándar de la suma o
de una variable y una constante es diferencia de una variable y una
igual a la varianza de la variable constante es igual a la desviación
estándar de la variable
La varianza de la suma o diferencia La desviación estándar de la suma o
de variables independientes es igual a diferencia de variables independientes
la suma o diferencia de las varianzas es igual a la suma o diferencia de las
respectivas desviaciones estándar respectivas

Los desvíos sirven para calcular cual es la medida de tendencia central para el conjunto de
datos.

DISPERSION RELATIVAS

COEFICIENTE DE PEARSON

Da la dispersión por unidad de media y se lo denomina densidad de media. Generalmente se lo


expresa en porcentaje. Es una unidad de medida adimencionada.

CV % = g/u X 100 (población)

CV% = S/u X 100 (muestra)

MEDIDAS DE FORMA

Completan el análisis de la distribución, pues indican el grado de asimetría y apuntamiento de


la curva, pudiéndose realizar un grafico aproximado que muestre la distribución de los valores
de la variable

Sesgo de
Pearson
Asimetría o
sesgos *
Medidas de Sesgo
forma estandard
Apuntamiento
o Kurtnosis o heterogénea.
*Existen 2 tipos según sea la distribución, homogénea

Sesgo de pearson: Sirve para distribuciones medianamente dispersas y está basada en la


relación de pearson.

(u-Mo) = 3(u-Me)

SP = 3 (u-Me)/g
La diferencia entre la media aritmética y el modo es igual a 3 veces a la media aritmética
menos la mediana.

Sesgo estándar: Se aplica cuando la distribución es heterogénea. Los datos están muy
disperso3
3
∑( 𝑋𝑖−𝑢) 𝑓𝑖
α 3=
𝑛 𝑔3
Medidas de apuntamiento

El grado de apuntamiento es igual al sesgo estándar pero elevado a la cuarta


4
∑( 𝑋𝑖−𝑢) 𝑓𝑖
α 43= 4
𝑛 𝑔3
Indica el grado de apuntamiento de la curva. Si la curva es igual a 3 estamos en una forma de
meseta

Las medidas de dispersión absolutas se van a utilizar cuando tenga 2 series expresadas en la
misma magnitud y quiero saber cual en cuál de ellas la medida de posición bajo análisis resulta
ser más representativa. Siempre representan números, cantidades.

Series cronológicas o de tiempo

Es el registro ordenado de los valores de una variable de acuerdo a su presentación en el


tiempo

Objetivo:

1) Analizar la evolución que persiguen los datos de un fenómeno determinado en un


periodo de tiempo. Se hace mediante el cálculo de la función de tendencia, la cual
responde a una recta
2) A través de la función de pronóstico poder estimar el valor que puede adquirir la
variable en un periodo fututo de tiempo. Vale decir que con los datos de hoy podemos
estimar cuanto valdrá la variable en el fututo.

Para que tenga validez la función de pronóstico deberá presentar los datos en periodos y
subperiodos de tiempo. Así también se deberá tener en cuenta algunas cuestiones relativas a
la estacionalidad.

De no contar con series abiertas a nivel de subperiodos el pronóstico podrá llevarse igual a
cabo, pero debemos prestar atención a la validez estadística que arroje el mismo.

Elementos de una serie cronológica

 Tendencia: es el movimiento que tiene la serie a lo largo de un gran número de


periodos.
Puede estudiarse a corto o largo plazo. En el largo plazo interviene todos los periodos
de la serie. En el corto solo aquellos a partir del cual se produce un cambio brusco y
sostenido. En este estudio también se integra el estudio a largo plazo.
 Estacionalidad. Son los movimientos que presenta la variable medida en periodos de
tiempo menor, respecto de un periodo de tiempo mayor
Se trata de estudiar sus periodos de tiempo que cuadren un periodo mayor que es el
periodo.
Para el cálculo de la estacionalidad resulta necesario que la serie este dividida en
periodos y subperiodos de tiempo.
La validez del cálculo de la estacionalidad estará dada cuando al comparar
subperiodos iguales pertenecientes a periodos distintos, el movimiento que ellos
perciben sea similar.

Movimientos

 Cíclico: son movimientos que se estudian en periodos más largos de tiempo.


Responden por lo común a periodos más largos de los que registran la serie, y que en
el ámbito de las ciencias económicas y empresariales se identifican con el ciclo
económico.

 Aleatorios: Son movimientos que presenta la variable estudiada pero responde a


ninguna razón estudiada o medible, es decir, es un movimiento no esperado.

Calculo de estacionalidad

1) Para que pueda cuantificarse la influencia de la estacionalidad de los datos deben


darse en periodos y subperiodos.
2) A subperiodos equivalentes le corresponde un perfil aproximadamente similar
3) Para calcular el factor estacionalidad se aplica el método de promedios móviles. Se
denota con S=Nº de subperiodos que hay en cada periodo.

Promedios móviles

Se llama promedios móviles porque son promedios encadenados. Los valores que se pierden
dependen del numero de subperiodos. Cuando el s es par se pierden s/2 tanto al comenzar
como al terminar. Cuando s es impar se pierden (s-1)/2 tanto al comenzar como al terminar

Cuando el factor de estacionalidad es menor a 1 podemos decir qye la estacionalidad deprime


el fenómeno de estudio

Cuando el factor de estacionalidad es mayor a 1 podemos decir que la estacionalidad aumenta


el fenómeno en estudio

Cuando el factor de estacionalidad es igual a 1 podemos decir que no influye en el fenómeno


de estudio

Regresión y correlación

Existen 2 fenómenos cuantitativos y a partir de ellos cada uno genera sus variables y se desea
saber si existe relación entre las variaciones generadas en cada variable y si existe, encontrar
la función que explique esa relación. Así como también determinar el grado de relación entre
las mismas.

De existir una fuerte relación entre las variables nos permitirá estimar con validez estadística el
valor que adquiera una variable conociendo el comportamiento de la otra
Estudio de regresión

El mismo permite conocer la función que describen las variables de los fenómenos que se
intentan vincular

Tipos de funciones

Lineales: los datos describen a una función que es la recta

4 4 2.5
3 3 2
1.5
2 2
1
1 1 0.5
0 0 0
0 2 4 0 2 4 0 2 4

Exponencial

Valores Y
120
100
80
60
Valores Y
40
20
0
0 5 10 15

Parabólica

20

15

10

0
0 2 4 6 8

Correlación

A partir de este estudio se busca medir el grado de intensidad de la relación que se plantean
entre las variables. Es decir, se cuantificara la relación

Si la relación es lineal cada variable tendrá su recta de regresión

Coeficiente de correlación

r= +- √𝑎₁ . 𝑏₁
Cuando r da 0 no hay correlación

Cuando r da -1 la correlación es inversa perfecta

Cuando r da 1 existe correlación lineal directa perfecta

Coeficiente de determinación

r2

Varicentro

Es el centro de intersección de la recta X y la recta Y. Reflejados por la media de la recta X y la


media de la recta Y
PROBABILIDADES

El cálculo de probabilidades permite cuantificar la ocurrencia de un fenómeno determinado


basado en un análisis sistemático y mediante la aplicación de un método científico. Que facilite
la toma de decisiones.

1) Suceso aleatorio: es todo aquel en el que interviene el azar. Ose que tiene más de un
resultado posible
2) Espacio muestral: es el conjunto de todos los resultados posibles de un suceso aleatorio (
el número de casos posibles)

Casos favorables: se refiere al subconjunto del espacio muestral que está conformado por
todos los elementos de la propiedad buscada

Por lo tanto, los que no lo cumplen formaran el subconjunto de los casos desfavorables

Calculo de Laplace

El cálculo de Laplace tiene como desventaja que no se tiene en cuenta los comportamientos
pocos frecuentes que pueda tener la variable

𝑁º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏 𝑙𝑒𝑠


P(x)=
𝑁º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠

BERNOULLI

Se trata de un esquema de pruebas repetidas y va a calcular la frecuencia relativa que tiene el


proceso
Si no se hace una determinada cantidad de veces la prueba, el cálculo puede ser erróneo.
A medida que se aumenta el número de pruebas se acerca al cálculo de Laplace.

PROBABILIDAD SUBJETIVA

Aquí se basa en pasamientos, ideas o creencia. No está sujeta a ninguna ley matemática, sino
a una interpretación subjetiva del analista.
Por lo común sirve para otros enfoques probabilísticos.

PROPIEDADES

Dado que la probabilidad subjetiva no responde a ninguna ley matemática y que la teoría
frecuencialista cada vez que hago ensayos crece y se aproxima al resultado de la teoría
clásica, resulta conveniente considerar para el cálculo de probabilidades las propiedades de la
teoría clásica

1) Toda probabilidad de un suceso aleatorio es un número real comprendido entre 0 y 1.


2) La suma de de las probabilidades correspondientes a los casos favorables y los casos
desfavorables es siempre igual a 1. Que es lo mismo que decir que la suma de
probabilidades de un suceso aleatorio es igual a 1
3) Si todos los elementos del suceso aleatorio cumplen con la probabilidad establecida
nos encontramos frente a la certeza y la probabilidad de éxito será igual a 1
4) Si ninguno de los elementos del suceso analizado cumple con la probabilidad
establecida estamos frente a la imposibilidad y será igual a 0
TIPOS DE PROBABILIDAD

b1 b2
a1 a1 b1 a1 b2 (a1)
a2 a2 b1 a2 b2 (a2)
(b1) (b2) n

1) Marginal: Se denomina de esta manera porque el número de casos favorables se


encuentra en el margen de la tabla de contingencias
𝑇(a1)
P(a1)=
𝑛
2) Probabilidad conjunta o cruzada: se busca obtener la probabilidad de ocurrencia de 2
sucesos de forma simultánea. Cuando se trata de sucesos mutuamente excluyentes, la
probabilidad conjunta o cruzada es igual a 0
𝑇(a1∧b2)
P(a1∧b2)=
𝑛
3) Probabilidad alternativa: Es cuando buscamos en un suceso analizado que se
indistintamente uno u otro comportamiento. Desde la teoría de conjuntos seria la unión
P(a1 ∧ b2)=P(a1) + P(b2) – P(a1∧ b2)
𝑇(a1) 𝑇(b2) 𝑇(a1+b2)
= + –
𝑛 𝑛 𝑛

4) Probabilidad condicional: Un suceso ocurre siempre y cuando se haya dado tro suceso
que lo condiciona
𝑃(a1∧b2)
P(a1/b2)=
𝑃 (𝑏2)
𝑇(a1/b2)
P(a1/b2)=
𝑇 𝑏2

Independencia de sucesos

Dos sucesos son independientes cuando la ocurrencia de uno no afecta a la ocurrencia del
otro

No debe confundirse con mutuamente excluyentes. Donde la ocurrencia de uno de los


sucesos impide la ocurrencia del otro

Pruebas de independencia

Mediante la probabilidad condicional o conjunta.

Si lo buscamos a través de la condicional debemos proar P(a/B) = P(a)

Si lo buscamos a través de la conjunta

P(a^b) = P(a) . P(b)

TEOREMA DE BAYES

Se puede calcular la probabilidad de un suceso cuando se conoce todas las causas


posibles que pudieron generarlo.
Esta información surge de estudios realizados con anterioridad en situaciones similares y
se posee información sobre las causas y los valores de probabilidad del efecto
condicionado por las causas. A estas probabilidades se las denomina a priori, porque se
conocen con anterioridad al estudio.
Lo que permite el teorema es conocer la probabilidad a posteriori de una de las causas
condicionadas por el efecto.
La importancia de la aplicación del teorema es que radica en que evita el tiempo que
insume recopilar gran cantidad de información y permite que los resultados obtenidos
puedan aplicarse a toda una población

E = efecto

Causa = A B C

P(B/E) = (P ( E/B) . P(B)) / P(E/B) . P(B) + P(E/A) . P(A) + P(E/C) . P(C)

BAYES nos permite hacer un pronóstico con la información que ya se tiene

Modelos Probabilísticos

Un modelo es una representación simplificada de la realidad. Se suelen conocer como


distribuciones (en estadística distribuciones probabilísticas)
Son funciones que bajo ciertos parámetros nos permiten calcular probabilidades
Responden a dos casos: discreto o continuo

- Discreto: calcula la probabilidad puntualmente


- Continuo: calcula la probabilidad en un campo de variación o un rango de valores

Modelos para variables discretas

- Binomial
- Poisson
- Hipergeométrico

BINOMIAL POISSON HIPERGEOMETRICO NORMAL


V.A Discreta V.A Discreta V.A Discreta V.A Continua
Nº de pruebas conocidas Nº de ensayos no Nº de pruebas/ ensayos Nº de ensayos
necesariamente conocido conocido conocidos
(Probabilidad conocida en un
tiempo y lugar determinado
Sucesos dicotómicos Sucesos dicotómicos Sucesos dicotómicos Sucesos dicotómicos
Esquemas de pruebas Pruebas Repetidas Pruebas repetidas Pruebas repetidas
repetidas
Probabilidad constante Probabilidad Constante Probabilidad variable Probabilidad constante
Xi queda definida como el Xi número de éxitos que Xi número de éxitos que Xi numero de éxitos
numero de éxitos que se pueden obtenerse en un pueden obtenerse en los que se obtienen en los
obtienen en los N ensayos espacio de tiempo o espacio en ensayos ensayos
pedido
C n;r . pr . qn-r 𝑒 𝜆 −𝑟 𝑁𝑝 . 𝑁𝑞 u= n.p √𝑛. 𝑝. 𝑞
.𝜆 𝑟 𝑛−𝑟
𝑟! 𝑁
𝑛

DEFINICIONES

𝑛º 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
Laplace (Clásica) P(a) =
𝑛º 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

𝑓𝑖
Frecuencia relativa fri= → 𝑃(𝑎)
𝑛

Subjetiva
Dos sucesos son independientes cuando la ocurrencia de uno no afecta la probabilidad que
ocurra el otro
No se debe confundir si son mutuamente excluyentes con independencia. Si son mutuamente
excluyentes no ocurren simultáneamente. En cambio dos sucesos independientes pueden o no
ocurrir al mismo tiempo
Lo importante es que uno no influye sobre el otro

Prueba de independencia:
a) P(A/B) = P(a)
P(B/A) = P(b)
b) P(A y B) = P(a) . P(b)