Вы находитесь на странице: 1из 27

Análisis de Datos

Síntesis Descriptiva
Se refiere a la transformación de los datos
recién obtenidos en una forma muy resumida
que facilitará su comprensión e interpretación.

Medidas de
Medidas de dispersión
tendencia central

Distribuciones
de frecuencia

Distribución de
porcentajes
Medidas de tendencia central vs.
Medidas de dispersión.

Las medidas de tendencia central tienen como


objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen
hasta que punto estas medidas de tendencia central
son representativas como síntesis de la información.

Las medidas de dispersión cuantifican la separación,


la dispersión, la variabilidad de los valores de la
distribución respecto al valor central.
Medidas de Dispersión
Se utilizan para conocer la distancia de los
valores de la variable a un cierto valor central.
Permiten identificar la concentración de los datos
en un cierto sector del recorrido de la variable.

Varianza Desviación Estándar, y el Rango.


Desviación estándar y
Varianza

Se utilizan para hacer generalizaciones


estadísticas a partir de la muestra y aplicarlas
a la población de donde se extrajeron.

• La varianza: es la desviación cuadrada de la


media. Nunca puede ser negativa.
• La desviación estándar es la raíz cuadrada
de la varianza.
Desviación Estandar (S)
Es una medida de la cantidad típica en la que los valores del
conjunto de datos difieren de la media. Es la medida de
dispersión más utilizada, se le llama también desviación típica.

• La desviación estándar es siempre un valor no negativo S


será siempre > 0 por definición. Cuando S = 0 è X = xi (para
todo i).

• Es la medida de dispersión óptima por ser la más pequeña.

• La desviación estándar toma en cuenta las desviaciones de


todos los valores de la variable .
Varianza (S2)
La varianza es una medida de dispersión relativa a algún punto
de referencia. Ese punto de referencia es la media aritmética de
la distribución.

Más específicamente, la varianza es una medida de que tan


cerca, o que tan lejos están los diferentes valores de su propia
media aritmética.

• Cuando más lejos están las Xi de su propia media aritmética,


mayor es la varianza.

• Cuando más cerca estén las Xi a su media menos es la varianza.

• S siempre un valor no negativo, que puede ser igual o distinta


de 0. Será 0 solamente cuando Xi= X

• La varianza es la medida de dispersión cuadrática óptima por

ser la menor de todas.


Desviación Estándar S
(Muestra)

Mayor valor del coeficiente Mayor dispersión de los datos


del desvío estándar con respecto a su media

Menor valor del coeficiente Menor dispersión de los datos


del desvío estándar (Mayor Homogeneidad)
Desviación Estándar S
(Muestra)

Para Datos Aislados Para Datos Agrupados

_ _

S (X  X ) 2

S  f (X  X ) 2

n 1 n 1
Desviación Estándar (S)
_
Para Datos Aislados
S 
( X  X ) 2

n 1
Edades de 7 personas encuestadas
X X–X (X - X) 2
10 10 -15,7= - 5,7 32,49
14 14-15,7= -1,7 2,89
15 15 -15,7= -0,7 0,49
57,43
16 16 -15,7= 0,3 0,09
S  3,09
18 18 -15,7= 2,3 5,29 7 1
18 18 -15,7= 2,3 5,29
19 19 -15,7= 3,3 10,89
2
Total 57,43 S = 9,57
Desviación Estándar (S)
_

S 
Para Datos Agrupados f ( X  X ) 2

n 1
Calificaciones de 23 personas encuestadas
2 2
X F X–X (X - X) f (X - X)
17 2 17 -14= 3 9 18
16 3 16 -14= 2 4 12
15 4 15 -14= 1 1 4
14 5 14 -14= 0 0 0
13 4 13 -14= -1 1 4
12 3 12 -14= -2 4 12
11 2 11 -14= 3 9 18
Total 23 68

68 2

S  1,76 S = 3,1
23  1
Rango (R)
Rango: Es la más elemental de las
medidas, consiste simplemente en la
distancia entre los dos valores extremos.

Es la diferencia entre el dato mayor y el dato


menor.

R = X máx. - X mín.
Rango (R)
Por Ejemplo:

1. Un estudio sobre las marcas de afeitadoras


arrojó que en un individuo logró apenas 6
afeitadas con una marca, mientras que otro
logró afeitarse 14 veces con otra marca, así
el intervalo es de 14 - 6 con una diferencia de
8 afeitadas que representa el rango.

2. Numero de Comerciales de refrescos que


recuerdan los estudiantes de Mercadeo II
son:
R=7
1 2 3 4 5 6 7 8 R=?
Resumen de fórmulas

                                                                                                                  
Tabulación y Gráficas

Plan de tabulación:
tabulación Disposición
ordenada de datos en una tabla u
otro formato resumido.

Síntesis Gráfica:
Gráfica Resumir los
resultados de la investigación en
una forma gráfica.
Diseñando las tablas de reporte

• Enumérelas en secuencia

• No use numerales romanos

• El título debe indicar el contenido

• Etiquete las filas y las columnas claramente

• Use formatos estándares y convencionales


Diseñando las tablas de reporte

• Evite llenar demasiado las tablas

• Haga cada una auto explicativa

• Asegúrese que es limpia, simple y ordenada

• Prueba las tablas en algunas personas para


asegurarse de que sean claras

• Inclúyalas después del texto de referencia


Creando Gráficos

• Enumérelos en secuencia

• Cree y use un formato estándar para figura


similares

• Los títulos deben indicar que representan las


barras y líneas

• Añada etiquetas de valor si las cantidades no


se muestran localizadas
Creando Gráficos

• Haga cada figura lo mas explicativa posible

• Incluya profundidad, sombras y color solo si


esto no distrae

• Haga que alguien las revises para saber si son


claras

• Incluya las figuras después del texto de ser


posible
Síntesis Gráfica
Los tres tipos más comunes son:
Diagramas de sectores (Tortas), Diagrama de
barras o histogramas.
Diagrama de Sectores (Tortas)
Se evidencia la contribución de cada parte a un total.

Grafico 1. Sexo de la muestra analizada

28%
Femenino
Femenino
Masculino
72%

Masculino
Grafico 5. Nivel de Instrucción

Secundaria

23% 9%
9% TSU
Postgrado

59%
Universitaria
Diagrama de Barras (Histogramas)
Grafico 7. Lugar donde prefieren tomar whisky
25

20 23%

15 18% 18%

10 12% 11%
9%
% %
5
4% 4%
1%
0
C a fé s F ie s ta s La bo ra le s P la ya Cas a Dis c o C a s ino C o nc ie rto C lub
Grafico 9. Activos/ Servicios que posee
73% Internet
99% Celular
73% Telf. fijo
90% Computadora
16%
Sirve para comparar datos 92%
Lavaplatos
Microonda
entre diferentes segmentos. 85% Secadora
77% DVD
56% VHS
100% TV

0 20 40 60 80 100 120
Diagrama de Barras (Histogramas)
Se utilizan rectángulos separados, que tienen como base a cada uno de los
datos y como altura la frecuencia de ese dato.

Ejemplo: Vacunas aplicadas a una población de reses en el Edo. Apure.


Polígonos de Frecuencia

El polígono de frecuencias es una representación gráfica de la


distribución de frecuencias que resulta esencialmente
equivalente al histograma y se obtiene uniendo mediante
segmentos los centros de las bases superiores de los rectángulos
del histograma.
Polígonos de Frecuencia
Acumuladas u Ojiva

La misma idea de unir los centros de las bases superiores de los


rectángulos de la distribución del histograma de frecuencias
acumuladas, da lugar al polígono de frecuencias acumuladas u
ojiva.
Diagrama Línea

Por lo general se usan para mostrar un mismo tipo de


dato y su evolución (valor de la acción y el tiempo,
número de ventas y precio).
Ejercicio
MEDIDAS TENDENCIA CENTRAL (Media, Mediana, Moda).
DESCRIPTIVAS      DISPERSION (Rango, Desviacion Estandar, Varianza)

Hallar la Media, Mediana, Moda, Rango, Desviación


Estándar y la Varianza de la siguiente serie de datos,
que representan las edades de un subgrupo de 13
estudiantes de la clase de Mercadeo II de UNITEC
Guacara.
 

23, 19, 18, 23, 20, 22, 21, 20, 25, 23, 24, 22, 18

Desviación Estándar Varianza.


_

(X  X ) 2 2
Es el cuadrado de la desviación estándar =  S
S
n 1

Вам также может понравиться