Академический Документы
Профессиональный Документы
Культура Документы
Las características globales de un conjunto de datos estadísticos pueden resumirse mediante una
serie de cantidades numéricas representativas llamadas parámetros estadísticos. Entre ellas, las
medidas de tendencia central, como la media aritmética, la moda o la mediana, ayudan a conocer
de forma aproximada el comportamiento de una distribución estadística.
Medidas de centralización
Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado entre el
menor y el mayor de la serie y que su cálculo y utilización resulten sencillos en términos
matemáticos.
Las medidas de posición no centrales: entre las que destacan especialmente los cuantiles.
Probabilidad
Experimentos deterministas
Son los experimentos de los que podemos predecir el resultado antes de que se realicen.
Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que la piedra bajará. Si
la arrojamos hacia arriba, sabemos que subirá durante un determinado intervalo de tiempo; pero
después bajará.
La distribución de probabilidad
De una variable aleatoriaes una función que asigna a cada suceso definido sobre
la variable la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está
definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de
la variable aleatoria. También puede decirse que tiene una relación estrecha con las distribuciones
de frecuencia. De hecho, una distribución de probabilidades puede comprenderse como una
frecuencia teórica, ya que describe cómo se espera que varíen los resultados.
DISTRIBUCIONES
Una distribución o tabla de frecuencia es un formato que el estadígrafo usa para organizar
y resumir sus datos. Por lo que podemos construir una tabla de frecuencias con datos
cualitativos o cuantitativos, pero en ambos casos el conjunto de datos estará agrupado en
varias clases.
En una tabulación de los datos podemos clasificar la información en forma:
a) Cronológica
b) Cualitativa
c) Geográfica
d) Cuantitativa
Ingresos
Años tributarios
2001 678.3
2002 651.7
2003 626.7
2004 572.3
2005 497.9
2006 679.3
2007 1111.4
2008 1430.7
2009 1793.7
2010 1842.6
b) Clasificación cualitativa
En esta clasificación tomaremos como base la agrupación de algún atributo o cualidad de
elementos que se van a analizar. Ejemplo: mujeres que laboran en una maquiladora según
su estado civil.
c) Clasificación geográfica
d) Clasificación cuantitativa
En esta clasificación se tomará como base de agrupación, una variable numérica divida en
intervalos de amplitud constante o de amplitud variable
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo
el intervalo para el cálculo de algunos parámetros.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27,
47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por
el número de intervalos de queramos poner.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.275
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1
40 1
Representación de grafica
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo
discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la
variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo
ha dado el siguiente resultado:
Grupo sanguíneo fi
A 6
B 4
AB 1
0 9
20
Diagrama de sectores
En un diagrama de sectores cada dato viene representado mediante un sector circular
cuyo ángulo es proporcional a su frecuencia absoluta.
El ángulo del sector se calcula dividiendo 360 (los grados de un círculo completo) entre el
número de datos y multiplicando el resultado por la frecuencia de cada dato.
La fórmula para hallar estos cálculos es la siguiente:
Los ángulos de cada sector se han calculado aplicando la fórmula y se han obtenido los resultados
que se indican:
Los porcentajes de cada sector se han calculado aplicando la fórmula y se han obtenido los
resultados que se indican redondeando a las unidades:
Medidas De Tendencia Central
Las características globales de un conjunto de datos estadísticos pueden resumirse mediante una
serie de cantidades numéricas representativas llamadas parámetros estadísticos. Entre ellas, las
medidas de tendencia central, como la media aritmética, la moda o la mediana, ayudan a conocer
de forma aproximada el comportamiento de una distribución estadística.
Medidas de centralización
Se llama medidas de posición, tendencia central o centralización a unos valores numéricos en
torno a los cuales se agrupan, en mayor o menor medida, los valores de una variable estadística.
Estas medidas se conocen también como promedios.
Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado entre el
menor y el mayor de la serie y que su cálculo y utilización resulten sencillos en términos
matemáticos.
Se distinguen dos clases principales de valores promedio:
Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática,
ponderada), mediana y moda.
Las medidas de posición no centrales: entre las que destacan especialmente los cuantiles.
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos)
La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual
se repite más.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de
un Jardín Infantil.
5, 7, 3, 3 , 7, 8, 3 , 5, 9, 5, 3 , 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de
valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo
contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número
del caso que representa la mediana de la distribución.
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho
en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y
después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de
datos.
Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales
(los valores centrales se suman y se dividen por 2).
Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5 , 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.