Вы находитесь на странице: 1из 32

Informática

Análisis de datos
Excel

Dr. Claudio Villota A.


Estadística

• Métodos y procedimientos para:


• Recoger, clasificar, resumir, analizar e interpretar el comportamiento de los
datos respecto a una característica en estudio (Estadística Descriptiva).

• Métodos empleados para inferir (concluir) algo acerca de una población


basándose en los datos obtenidos a partir de una muestra. (Estadística
Inferencial).
Objetivo de la Estadística

Ayudar a la toma de decisiones y


formular predicciones
Conceptos

ž Individuos o elementos: personas u objetos que contienen cierta


información que se desea estudiar.

ž Población: conjunto de todos los individuos que aporten


información sobre el fenómeno que se estudia.

ž Muestra: Subconjunto representativo de una población (n)

ž Una muestra representativa será un subconjunto de elementos de


una población obtenidos de forma aleatoria de ella.
Conceptos

ž Variable: Propiedad que se desea medir en cada observación


individual.

ž Parámetro: es un medida de resumen que describe una


característica de toda la población.

ž Estadístico: Función definida sobre los valores numéricos que


describe una característica de toda la muestra.
Población vs Muestra
Ejemplo

ž Interesa: Estimar el IMC medio de las personas adultas mayores (AM) de


60 años en el Gran Santiago.

ž Población: Las personas AM de 60 años en el Gran Santiago (Población


finita).

ž Muestra: Un subconjunto aleatorio de las personas AM de 60 años en el


Gran Santiago.

ž Variable: IMC medido en la muestra

ž Parámetro (μ): IMC medio de las personas AM de 60 años en el Gran


Santiago.

ž Estadístico (x) : promedio de IMC de las personas AM de 60 años del Gran


Santiago que participan en la muestra.
Tipos de Variables

Discreta
Cuantitativa
Continua
Variables
Nominal
Cualitativa
Ordinal
Estadística descriptiva

• Nos permite representar, ordenar y resumir un conjunto de datos, de tal


manera de obtener información relevante que describa el
comportamiento de la variable en el grupo de estudio.
Importante para describir los datos

Medidas de tendencia central

Medidas de dispersión

Gráficos: histograma, BoxPlot


Resumen de medidas descriptivas

• Posición: dividen un conjunto ordenado de datos en grupos


con la misma cantidad de datos.
–Percentiles, cuartiles
• Centralización: indican valores respecto a los cuales los datos
parecen agruparse.
–Media, mediana y moda
• Dispersión: indican la mayor o menor concentración de los
datos con respecto a las medidas de centralización.
–Varianza, desviación estándar, rango o recorrido
• Forma: Simetría
Elección de medidas de tendencia central y de dispersión

Variable Nominal Moda

• Moda
Variable Ordinal • Mediana

• Percentiles

Variable Continua
• Mediana
• Con distribución desconocida o asimétrica
• Percentiles

• Con distribución simétrica y unimodal (Ej: Normal)


• Media
• Desviación estándard
Medidas de Posición de Tendencia Central

• Son aquellos valores hacia los cuales tienden a


aglomerarse los datos de una muestra.

• Los más utilizados son:


– Moda: observación que más se repite en una muestra.
– Mediana: observación central de los datos ordenados en una muestra.
– Promedio: suma de los datos dividido por el total de datos en una muestra.
Moda

• Puede ser calculada para todo tipo de variables.

• Puede existir más de una moda en un conjunto de datos.

• Puede que en un conjunto de datos no exista la moda.


Mediana

• La mediana de un conjunto de datos ordenados es el dato que se ubica en


la posición central.

• Si hay un número par de datos, la mediana se obtiene promediando los dos


datos centrales.

• Interpretación: La mediana acumula hasta ella un 50% de los datos y desde


ella acumula el otro 50% de los datos.

• Si en un conjunto de datos la mediana toma el valor 25 , esto quiere decir


que un 50% de los datos toma un valor inferior o igual a 25.
Promedio o Media

• El promedio sólo se puede calcular a datos proveniente de mediciones


de variables de tipo cuantitativa.

• El promedio se calcula como la suma de todos los datos dividido por el


número total de datos.
Medidas de Posición de Tendencia no central

• Las medidas de posición de tendencia no central son


aquellas que dan información a cerca del orden en la
estructura de una muestra.
• Los más utilizados son:
• Mínimo
• Máximo
• Percentiles
• Cuartiles
• Deciles
Medidas de Posición de Tendencia no central

• Percentil k: valor del conjunto de datos ordenados que


por primera vez acumula hasta él o sobrepasa un k%
de los datos.

• Cuartiles: son tres y corresponden a los percentiles 25,


50 y 75.

• Deciles: son nueve y corresponden a los percentiles


10, 20,30,40,50,60,70,80 y 90.
Algunas Medidas de Dispersión

• Las medidas de dispersión indican que tan dispersos están los valores
con relación a los demás.
• Rango: Diferencia entre el máximo y mínimo de los datos.

• Desviación Estándar: Distancia promedio de todos los datos al promedio.

• Varianza: Desviación estándar al cuadrado.


Formas de resumir los datos

žTablas
– Tablas de frecuencias (distribución de frecuencias)
– Frecuencias relativas (porcentaje del total)

žGráficos
– Diagrama de barras
– Diagrama de sectores o tortas
– Histograma
– Polígono de frecuencias
Presentación de los Datos

• Las tablas de frecuencias y las representaciones gráficas son dos


maneras equivalentes de presentar la información. Las dos
exponen ordenadamente la información recogida en una muestra.
En EXCEL

• Variables: en columnas

• Sujetos: en filas

• Fórmulas:
• Seleccionar fx

• Escribir fx

• Icono autosuma
Llenar la base de datos

Los nombres de las variables deben ser de la siguiente forma:


• Sin acentos
• Máximo 8 caracteres
• Nombres abreviados que indiquen el significado de la variable
Base de datos
Excel

G2: G11

Mínimo para la variable peso: Promedio para la variable peso:


= min (G2 : G11) = promedio (G2 : G11)

Máximo para la variable peso: Mediana para la variable peso:


= max (G2 : G11) = mediana (G2 : G11)
Alternativa 2 para realizar los cálculos

• En la celda donde aparecerá el resultado:


1. =
2. Selección de fx deseada
3. Selección de celdas a analizar
Gráficos

• Un gráfico es la representación gráfica de los datos de una hoja de


cálculo para facilitar su interpretación.
• 2 formas:
• Como gráfico incrustado: Insertar el gráfico en una hoja normal como
cualquier otro objeto.
• Como hoja de gráfico: Crear el gráfico en una hoja exclusiva para el gráfico,
en las hojas de gráfico no existen celdas ni ningún otro tipo de objeto.
Gráficos

• Comando “insertar”
• Gráficos

Вам также может понравиться