Вы находитесь на странице: 1из 37

ANÁLISIS DE DATOS

Introducción a la Estadística:
Descripción de Datos

Tomás Minauro La Torre


Sesión 1
tminauro@esan.edu.pe

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
2

Estadística
Cuando se habla de ESTADISTICA, generalmente
nos referimos a números tales como, promedios,
medianas, porcentajes, máximos, mínimos, entre
otros, que nos ayudan a entender una gran
variedad de situaciones económicas y de negocios.

También se refiere al ARTE Y CIENCIA de


recolectar, analizar, presentar e interpretar datos.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
3

¿Qué es Estadística?
Es un conjunto de procedimientos destinados a servir
en el proceso de decisión en casos con presencia de
incertidumbre.
Esta definición puntualiza dos aspectos que el gerente
enfrenta continuamente: toma de decisiones e
incertidumbre. En lo que se refiere al tratamiento de la
incertidumbre, la teoría de probabilidades nos da la
oportunidad de una cuantificación del riesgo lo que
permite ganar en eficiencia en la toma de decisiones.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
4

Datos
Los datos son los hechos y los números que se
reúnen, analizan y resumen para su presentación e
interpretación.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
5

Elementos, Variables, Observaciones


Los elementos son las entidades de las cuales recogemos los
datos.

Una variable es una característica de interés de cada


elemento.

Al conjunto de medidas recogidas de un elemento en


particular se le llama observación.

El número total de datos es igual al número de elementos


multiplicado por el de variables.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
6

Datos, Elementos, Variables y


Observaciones
Elementos

Variables

Datos

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
7

Escalas de Medición
Las escalas de medición son:
Nominal De intervalo
Ordinal De razón

La escala determina la cantidad de información que


debe contener el dato.

La escala indica además qué tipos de resúmenes de


datos y de análisis estadísticos son los más apropiados.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
8

Escalas de Medición
Nominal
Los Datos son etiquetas o nombres usados para
Identificar un atributo de un elemento.

Se usan etiquetas no numéricas o códigos numéricos.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
9

Escalas de Medición
Ordinal
Los datos tienen las propiedades de una medición
nominal y adicionalmente el orden o la posición
relativa de cada categoría tiene significado.

Se pueden usar una etiqueta no numérica o un código


numérico.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
10

Escalas de Medición
De Intervalo
Los datos tienen las propiedades de los ordinales y las
distancias que hay entre las observaciones se miden
en términos de una unidad de medida fija.

Datos de Intervalo son siempre numéricos.

Esta escala tiene el cero relativo que indica que para


esta variable el punto cero depende de quien evalúa.
En el cero, no siempre no hay nada.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
11

Escalas de Medición
De Razón
Los datos tienen todas las propiedades de los de
intervalo y en este caso el cociente de dos valores
tiene un significado.

Variables como son distancia, altura, peso, y tiempo


usan la escala de razón.

Esta escala tiene el cero absoluto que indica que


para esta variable no existe nada en el punto cero.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
12

Cada escala provee diferente información

Nominal

Tercero Segundo Ganador

Ordinal

Tercero Segundo Ganador

Intervalo
20 segundos 1 segundo

Razón 1 minuto 59 2/5 segundos para 11/4 millas

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
13

Estadística Descriptiva

Datos resumidos y presentados


convenientemente. Dichos resúmenes
pueden ser:
tabulares
gráficos o
numéricos

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
14

Ejemplo: Hudson Autos


Al gerente de Hudson Autos le gustaría tener una mejor
comprensión de los costos de los repuestos utilizados en
las reparaciones realizadas en su taller.
Examina 50 facturas de clientes atendidos en los últimos meses.
Anota el costo de las piezas, redondeado al dólar más cercano.
Además por teléfono se comunica con ellos y se les pide que
califiquen la calidad del servicio técnico (1=excelente, 2=muy
bueno, 3=bueno, 4=regular y 5=malo), que nos indiquen el servicio
solicitado (1=mantenimiento, 2=diagnóstico, 3=otro) y una
evaluación general de su satisfacción con la atención recibida del
Taller en una escala de 7 puntos. Los datos se muestran en la hoja
de Excel adjunta

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
15

Distribución de frecuencias

Una distribución de frecuencias es una tabla que


resume los datos mostrando la frecuencia o número de
elementos que hay dentro de cada una de sus clases,
que deben ser mutuamente excluyentes y colectiva-
mente exhaustivas.

El objetivo es proveer información acerca del conjunto


de datos que no podría obtenerse rápidamente por
simple observación de los datos originales.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
16

Distribución de frecuencias relativas


La frecuencia relativa de una clase es la fracción o
proporción del total de datos que pertenecen a una
determinada clase.

Una distribución de frecuencias relativas es una tabla


que nos resume un conjunto de datos mostrando la
frecuencia relativa para cada clase.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
17

Gráfico de Barras
Un gráfico de barras es una herramienta gráfica para
trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamos las
etiquetas con los nombres de las categorías.
En el otro eje (normalmente el vertical), se puede usar la
frecuencia, la frecuencia relativa.
Usamos una barra de ancho fijo que dibujamos arriba
de cada etiqueta, con una altura de acuerdo con su
correspondiente frecuencia.
Las barras están separadas para enfatizar que cada
clase es una categoría diferente.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
18

Gráfico de Pie
El gráfico de pie es una herramienta gráfica usada
generalmente para presentar distribuciones de frecuencia
relativa de datos cualitativos.

Primero se traza un círculo; luego usando


las frecuencias relativas se subdivide
en sectores que corresponden a la
frecuencia relativa de cada clase.

Dado que hay 360° en un circulo, una clase con una


frecuencia relativa de .25 consumirá .25(360) = 90° de ese
círculo.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
19

Distribución de Frecuencias
Para Datos Numéricos
Guías para seleccionar el número de clases

Use entre 5 y 20 clases.

Conjuntos de datos con un número grande de


elementos, generalmente requieren un número
grande de clases.

Conjuntos de datos pequeños usualmente


requieren pocas clases

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
20

Distribución de Frecuencias
Para Datos Numéricos
Guía para seleccionar el Ancho de Clase

Use clases de igual ancho


Ancho aproximado de clase =

Dato más grande - Dato más pequeño


Número de Clases

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
21

Histograma
El histograma es una manera muy común de presentar
gráficamente datos cuantitativos.
La variable de interés se coloca en el eje horizontal.

Se dibuja un rectángulo arriba de cada intervalo de clase


con una altura correspondiente a su frecuencia,
frecuencia relativa, o frecuencia porcentual.

A diferencia del gráfico de barras, un histograma


no tiene separaciones entre rectángulos de clases
adyacentes
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
22

Distribución Acumulativa

Distribución Acumulada de Frecuencias muestra el


número de observaciones con valores iguales o
menores que el límite superior de cada clase.

Distribución Acumulada de Frecuencias Relativas


muestra la proporción de ítems con valores menores o
iguales al el límite superior de cada clase.

Distribución Acumulada de Frecuencias Porcentuales


muestra el porcentaje de ítems con valores menores o
iguales al el límite superior de cada clase.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
23

Análisis Exploratorio de Datos

El Análisis Exploratorio de Datos es un conjunto de


técnicas que usan aritmética simple y gráficos fáciles
de dibujar para resumir datos rápidamente.

Una de estas técnicas es el diagrama de hoja y tallo.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
24

Diagrama de Hoja y Tallo


Un Diagrama de Hoja y Tallo nos muestra ambos el
orden y la forma de la distribución de los datos.
Es muy parecido a un histograma, con la ventaja de que
este diagrama conserva los valores originales.
El primer dígito de cada dato se coloca a la izquierda de
una línea vertical.
A la derecha de la línea, registramos el último dígito de
cada dato en orden.
Cada línea en el diagrama se conoce como tallo.
Cada dígito en el tallo es una hoja.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
25

Ejemplo: Hudson Autos

Muestra de 50 datos:

91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
26

Ejemplo: Hudson Autos

5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9

tall hoja
o
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
27

Diagrama de Hoja y Tallo

Si se cree que un diagrama de hoja y tallo está


muy concentrado, podemos abrir el diagrama
usando dos tallos para cada dígito inicial.

Dado que tenemos el primer dígito repetido, el


primer valor corresponde a valores de la hoja de
0 - 4, y el segundo a valores de la hoja de 5 - 9.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
28

Ejemplo: Hudson Autos


5 2
5 7
6 2 2 2 2
6 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4
7 5 5 5 6 7 8 9 9 9
8 0 0 2 3
8 5 8 9
9 1 3
9 7 7 7 8 9
10 1 4
10 5 5 9
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
29

Diagrama de Hoja y Tallo

Unidades de la Hoja
Cada hoja se define por un sólo dígito.

En el ejemplo anterior, la unidad de la hoja fue 1.

Las unidades pueden ser 100, 10, 1, 0.1, y así.

Cuando no se muestran las unidades de la hoja, se


asume que es 1.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
30

Ejemplo: Unidad de hoja = 0.1


Si tenemos los siguientes datos
8.6 11.7 9.4 9.1 10.2 11.0 8.8

El diagrama de hoja y tallo para estos datos sería:

Unidad de hoja = 0.1


8 6 8
9 1 4
10 2
11 0 7
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
31

Ejemplo: Unidad de hoja = 10


Si tenemos los siguientes datos
1806 1717 1974 1791 1682 1910 1838

El diagrama de hoja y tallo sería:

Unidad de hoja = 10
16 8
El 82 de 1682
17 1 9 Se redondea a 80
18 0 3 y se representa
por un 8.
19 1 7
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
32

Tablas de Contingencia y
Diagramas de Dispersión
Hasta el momento hemos visto métodos que resumen
datos pero una variable a la vez.

Los gerentes necesitan métodos que les permitan


graficar y tabular datos de manera que se entiendan las
relaciones entre dos variables.

Tablas de Contingencia y Diagramas de Dispersión son


dos métodos que permiten resumir los datos para dos
(o más) variables simultáneamente.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
33

Tablas de Contingencia

Tabla de contingencia es una forma de resumir en una


tabla datos de dos variables simultáneamente.
Se puede usar si:
 ambas variables son cualitativas, o
 Si alguna es cuantitativa, para hacer la tabla debe
ser transformada en otra cualitativa.
Las filas y las columnas definen las clases para cada una
de las dos variables.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
34

Diagramas de Dispersión y
Líneas de Tendencia

Un diagrama de dispersión es una representación


gráfica de la relación entre dos variables cuantitativas.

Una de las variables se muestra en el eje vertical y la


otra en el horizontal.

El patrón general que muestran los puntos sugieren la


relación entre las variables.

Una línea de tendencia es una aproximación de la


relación.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
35

Diagrama de Dispersión
Una relación positiva

X
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
36

Diagrama de Dispersión
Una relación negativa

X
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.
Análisis de Datos
37

Diagrama de Dispersión
satisfacción
general
Ninguna relación

costo

X
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2019.

Вам также может понравиться