Вы находитесь на странице: 1из 16

Visualización de datos

Variables categóricas
Tópicos

• Describir la distribución de una variable categórica

• Evaluar la relación entre dos variables categóricas

• Evaluar la relación entre una variable categórica y


una variable numéricas
Tabla de frecuencia y gráfico de barras
Situación económica N Frecuencia
del país
Muy mala 83 5,8%
Mala 522 36,5%
Ni buena ni mala 661 46,2%
Buena 163 11,4%
Muy buena 3 0,2%
Total 1432 100%

Fuente datos: encuesta CEP www.cepchile.cl


Gráfico de barras vs histogramas
• Gráficos de barras se usan con variables categóricas
mientras que los histogramas con variables numéricas.
• El eje x en el histograma es una línea con números, y el
orden de las barras no es intercambiable.
Tabla de contingencia
Aprobación Gobierno

Aprueba No aprueba ni Desaprueba Total


desaprueba
Situación Muy mala 11 10 58 79
económica Mala 91 60 352 503
del país
Ni buena ni mala 188 123 336 647
Buena 53 25 85 163
Muy buena 1 0 1 2
Total 344 218 832 1394
Frecuencias relativas
Aprobación Gobierno

Aprueba No aprueba ni Desaprueba Total


desaprueba
Situación Muy mala 11 10 58 79
económica Mala 91 60 352 503
del país
Ni buena ni mala 188 123 336 647
Buena 53 25 85 163
Muy buena 1 0 1 2
Total 344 218 832 1394
Gráfico de barras segmentadas
Gráfico de barras segmentadas
de frecuencias relativas
Box plot lado a lado
Muestreo
Del análisis exploratorio a la inferencia
● Muestreo es natural.
● Piensa en muestrear algo de lo que estás cocinando – pruebas
(examinas) una parte pequeña de lo que estás cocinando para darte
una idea de cómo te está saliendo la comida.
● Cuando pruebas una cuchara de tu sopa y decides que en base a eso
que a tu sopa le falta sal, eso se llama análisis exploratorio.
● Si tu generalizas y concluyes que toda tu sopa necesita sal, entonces a
eso se le llama inferencia.
● Para que esa inferencia sea válida, el contenido de la cuchara que
probaste (la muestra) necesita ser representativa de toda la comida
(población.
● Si el contenido de la cuchara que sacaste es sólo de la superficie y la sal
puede que se haya quedado en el fondo de la olla, lo que probaste
puede no ser representativo del sabor de la sopa.
● Sin embargo si agitas la sopa antes de probarla, lo que saques con la
cuchara es más probable que sea representativo de toda la sopa.
Buenas muestras….

 Casi todos los métodos estadísticos se basan en la noción de


aleatoriedad.
 Si los datos observacionales no se recolectan de la población en
un marco, estos métodos estadísticos, sus estimaciones y sus
errores asociados con estas estimaciones no son confiables.
 Las técnicas de muestreo aleatorio más usadas son: muestreo
simple, estratificado y por cluster o conglomerado.
Muestreo aleatorio vs
asignación aleatoria
Muestreo
aleatorio

muestra
población
generalizable
Asignación tratamiento

aleatoria

muestra

control

causalidad
Asignación Sin asignación
aleatoria aleatoria

Muestreo aleatorio

Sin muestreo
aleatorio

Вам также может понравиться