Вы находитесь на странице: 1из 51

XS-104 ESTADSTICA I

Yadira Mara Alvarado Salas

III Cuatrimestre 2013 - UNED

CAPTULO 1

Naturaleza de la
estadstica

1 INTRODUCCIN
Es posible que todo lector del libro de texto, crea
conocer lo que es estadstica.
Es casi seguro que esa definicin no coincidir con la
de otro lector.
Esto es as porque:

La

palabra estadstica es utilizada en varios sentidos.


Los propios estadsticos ponen de relieve unos aspectos o
aplicaciones ms que otros.

2 DATOS ESTADSTICOS O
ESTADSTICAS

Se asocia la palabra estadstica con:

Publicaciones censales.
Noticias sobre produccin.
Nacimientos, admitidos a la U, accidentes de trnsito.
Cuadros o grficos en revistas o peridicos.
Cifras o porcentajes utilizados en discursos polticos.

Este sentido corresponde al plural estadsticas, el cual se


utiliza para indicar:

Un conjunto de datos numricos organizados, resumidos y


presentados para perfilar un fenmeno de inters, como:

Estadsticas de poblacin, de produccin industrial o un


campeonato de ftbol.

Un trmino ms apropiado es datos estadsticos.

2 DATOS ESTADSTICOS O
ESTADSTICAS

No todo tipo de informacin es un dato estadstico:


Nmero

aislado:

Si no se puede comparar o no muestra una relacin significativa con


otros nmeros, no es un dato estadstico.
Ejemplos:
Los datos de un paciente en un hospital (temperatura de un
paciente).
Monto, plazo y tasa de un solo prstamo.

Datos

estadsticos:

Nmeros referidos a una misma CARACTERSTICA.


Le interesa los patrones o regularidades que presenta un conjunto de
datos, los cuales se puedan comparar, analizar o interpretar.
Ejemplos:
Los datos de un grupo de pacientes con la misma dolencia
(temperatura promedio de un grupo de pacientes).
Monto, plazo y tasa de varios crditos.

3 LA ESTADSTICA COMO
DISCIPLINA CIENTFICA
La estadstica es un campo del conocimiento.
Es una disciplina cientfica que se dedica a:

Desarrollo

de la teora y aplicacin de tcnicas.


Tcnicas apropiadas para recolectar, clasificar,
presentar, analizar e interpretar informacin
cuantitativa.
Obtenidas por observacin o experimentacin.

Como ciencia, la estadstica se concibe como:


Una

rama de las matemticas aplicadas.


Pero tambin incluye elementos tericos y tcnicas
propias.

Es una herramienta esencial de la investigacin en


casi todos los campos de la actividad humana.

4. UNIDAD ESTADSTICA,
CARACTERSTICA Y
OBSERVACIN

Unidad estadstica
Es

Caracterstica
Es

la unidad sobre la cual se hacen las mediciones.

la variable de inters.

Observacin
Es

el valor observado en una determinada unidad


estadstica.

Observaciones
Conjunto

de observaciones o datos recolectados.

4. UNIDAD ESTADSTICA,
CARACTERSTICA Y
OBSERVACIN

4. UNIDAD ESTADSTICA,
CARACTERSTICA Y
OBSERVACIN

5. EL CONCEPTO DE POBLACIN

La poblacin es el total o el agregado de las unidades de estudio.


Ejemplos:
Una

investigacin dirigida a conocer el ingreso mensual de las familias


del rea Metropolitana de San Jos:

Unidad de estudio: la familia residente en esa zona geogrfica.


Poblacin: el conjunto de familias que viven en esa zona, en el momento del estudio.

Un

profesor de matemtica est interesado en analizar el rendimiento de


sus alumnos de primer ao de secundaria y tiene 2 grupos, uno de 26 y
otro de 28 alumnos:

La poblacin objeto de estudio es de 54 alumnos.

Un

agrnomo zootecnista aplica una nueva dieta a una muestra de 20


vacas Holstein para determinar su efecto sobre la produccin de leche:

La poblacin est dada por todas las reses de esa raza a las que se les podra aplicar
la dieta.

5. EL CONCEPTO DE POBLACIN

Una poblacin puede ser finita o infinita:


Ej

finita: conjunto de familias en el rea Metropolitana.


Ej infinita: procesos que se repiten indefinidamente.

El anlisis se hace con los valores observados y no con


las unidades estadsticas.
Unidad

de estudio: familia residente en el AM.


Poblacin: todas las familias residentes en el AM.
Poblacin: conjunto de valores de esas familias.

La poblacin la constituyen el conjunto de nmeros.


Un mismo conjunto de unidades puede dar origen a
diferentes poblaciones.

EL CONCEPTO DE POBLACIN

USO DEL MUESTREO


Se toma una parte de la poblacin (muestra) y se
generalizan los resultados
Es un procedimiento inductivo, de una inferencia
que se hace de la parte hacia el todo
El riesgo es que la parte seleccionada no sea
representativa del todo
Dos factores bsicos para lograr que la muestra
sea representativa:

El

tamao de la muestra: cuanto mayor sea, mayor


representatividad
Forma de seleccin

USO DEL MUESTREO

El tamao de la muestra depende de:


La

homogeneidad de los elementos de la poblacin


El nivel de precisin deseado para las estimaciones
El grado de confianza que se quiere en la inferencia

Cuanto ms homognea sea menor el tamao de la


muestra
Cundo usar muestras:

Cuando

la poblacin es infinita o muy grande


Cuando es muy costoso y requiere mucho tiempo
Cuando la unidad de estudio se destruye o se
transforma
Cuando los resultados de la muestra son
suficientemente precisos

SELECCIN DE LA MUESTRA

Se distinguen tres formas de seleccin:


Aleatoria

o al azar: cada elemento tiene una probabilidad


conocida y no nula de ser seleccionado.

Caso particular: todos los elementos tienen la misma probabilidad

Intencional:

se utiliza el juicio de una persona con


experiencia y conocimiento
Conveniencia: se escogen las unidades o elementos que
estn disponibles o son ms fciles de conseguir . Se corre el
riesgo de que no sea representativa

Ejemplo: estimacin de hogares con internet en AM


Si

se extrae en Los Pinares, no es representativa.


Si se usa el juicio de un experto, sera ms representativa,
pero sesgada
Con un procedimiento aleatorio, podra no ser
representativa, pero produce errores aleatorios

SELECCIN DE LA MUESTRA
La representatividad de la muestra no est
plenamente garantizada en las selecciones
Existen discrepancias entre el resultado de la
muestra y el valor de la poblacin
Los estadsticos utilizan muestras al azar
porque:

Aunque

esas discrepancias tienen magnitudes y sentido


que no pueden predecirse,
la seleccin al azar las produce como errores aleatorios o
de muestreo
Tienen su origen exclusivamente en el hecho de ser una
muestra al azar
La seleccin intencional o por juicio, en cambio, produce
sesgos de seleccin.

SELECCIN DE LA MUESTRA

Los sesgos son errores sistemticos, es decir, en


un solo sentido y pueden ser:
Sesgos de seleccin: se presentan cuando se
utilizan muestras
Sesgos de medicin: son comunes a censos y a
muestras (ej. Ingresos).

En general los sesgos se desconocen, por lo que no


se pueden evaluar ni corregir
Los errores de muestreo no son predecibles
individualmente, pero s en muestras sucesivas

Pueden

ser descritos con un modelo de probabilidades


Pueden utilizarse para evaluar la confianza que
merece el resultado de una sola muestra.

SELECCIN DE LA MUESTRA
Los sesgos de seleccin no pueden ser evaluados
o medidos con un modelo
Los errores de muestreo, por su naturaleza
aleatoria, s pueden ser evaluados y medidos
El muestreo aleatorio o probabilstico se
prefiere porque:

Elimina

los sesgos de seleccin


Produce errores aleatorios que son medibles utilizando
modelos probabilsticos
El error de muestreo puede hacerse pequeo,
aumentando el tamao de la muestra.

En muestras pequeas, es ms apropiado la


seleccin intencional que la aleatoria.

LA TABLA DE NMEROS AL AZAR


Gran nmero de dgitos obtenidos por un proceso
que garantiza aleatoriedad
En Excel se tienen las funciones:

ALEATORIO()

ALEATORIO.ENTRE(1;60)

Tambin existen los mtodos computarizados que


generan muestras de nmeros aleatorios

ATRIBUTOS Y VARIABLES

El anlisis estadstico se realiza con datos que


provienen de la operacin de medir o contar
Ejemplos:

peso (medir), cantidad de hijos (contar)

Los atributos o cualidades se definen bajo


categoras
Ejemplos:

estado conyugal (soltero, casado, viudo,


divorciado, separado, unin libre
Para su manejo electrnico se les asigna nmeros
nicamente con fines de clasificacin (cdigos)
No es lcito ejecutar operaciones aritmticas con esos
cdigos

Cuando se mide una caracterstica que difiere de


unidad a unidad, se le llama variable.

ATRIBUTOS Y VARIABLES

Cuantitativas: peso, nmero de hijos


Cualitativas o atributos: estado civil.
Cuantitativas continuas: variables con cualquier valor en
un intervalo de nmeros reales

Una

variable es continua si tericamente puede tomar cualquier


valor en el intervalo. Ej: peso, estatura, velocidad, edad

Cuantitativas discretas o discontinuas: variables cuyos


valores son numerables
No

puede asumir todos los valores dentro de un intervalo, sino un


nmero finito. Ej: cantidad de goles, octavos de kg de mantequilla

ESTADSTICA DESCRIPTIVA Y
ESTADSTICA INFERENCIAL

Estadstica descriptiva: descripcin del conjunto


de datos observados
Tcnicas:

cuadros, grficos, promedios, porcentajes y


medidas de variabilidad

Estadstica inferencial: obtencin de conclusiones


o inferencias que se generalizan a la poblacin de la
cual fueron extradas las unidades
Proceso

inductivo: se toma una parte (muestra), se


examina y los resultados se generalizan al conjunto o
universo (poblacin)
2 problemas para la toma de la muestra: el tamao de la
muestra y el mtodo de seleccin
2 problemas para la generalizacin: mtodo de
generalizacin y medicin del error asociado.

CAPTULO 2

Fuentes de datos y
Tcnicas de recoleccin

INTRODUCCIN

Para llevar a cabo un estudio (de investigacin


cientfica o de obtencin de informacin estadstica
para la toma de decisiones) se plantea el problemas:
Qu

tipo de datos se requieren


Cmo van a obtenerse esos datos
Cules procedimientos y cuidados se siguen para lograr
que sean pertinentes y de buena calidad

Se deben recoger buenos datos ya que una tcnica


estadstica esmerada y compleja no puede
compensar la mala calidad de los datos
El investigador debe hacer lo posible por lograr
informacin precisa y confiable

LA OBTENCIN DE LA INFORMACIN
ESTADSTICA:
DATOS EXISTENTES Y NO EXISTENTES

FUENTES PRIMARIAS Y
FUENTES SECUNDARIAS
Fuente: origen de la informacin utilizada en el
estudio o anlisis.
Fuente primaria: se refiere a la institucin
(pblica o privada o sin fines de lucro), o si es del
caso la persona, que recogi primero los datos y
produjo la estadstica. Ejemplos:

INEC

(Censos de poblacin y vivienda, estadsticas


vitales, Encuesta de Hogares, ndice de precios,
permisos de construccin)
Banco Central (PIB, IMAE, tipo de cambio)
CCSS (estadsticas de seguridad social y atencin)
Tribunal Supremo de Elecciones (electorales)

Una fuente primaria no es necesariamente una


publicacin.

FUENTES PRIMARIAS Y
FUENTES SECUNDARIAS
Fuente secundaria: quien utiliza la informacin, en
un estudio o anlisis, no recolect los datos
estadsticos, sino que provienen de una fuente
primaria ajena.
Ejemplos:

MIDEPLAN
Proyecto

Estado de la Nacin
Organizacin de las Naciones Unidas
Organizacin Internacional del Trabajo

Trminos anlogos a fuente primaria y secundaria


Datos

primarios: recogidos por la misma persona o


institucin que los va a utilizar
Datos secundarios: recogidos por otra persona o institucin.

LA NECESIDAD DE EVALUAR LAS


FUENTES
El usuario debe asegurarse del grado de confianza que
merecen los datos
Toda fuente debe evaluarse:

Cobertura

e integridad del estudio


Calidad, confiabilidad, comparabilidad y pertinencia de los datos

Los datos de fuentes primarias, son en general, ms


confiables:
La

fuente secundaria puede contener errores de transcripcin


La fuente primaria incluye a menudo, definiciones
La fuente primaria incluye a menudo el cuestionario y
procedimientos
La fuente primaria suele proporcionar ms detalle
Una fuente secundaria con frecuencia omite parte de la
informacin, o combina categoras

TCNICAS PARA LA RECOLECCIN


DE DATOS NO EXISTENTES

Experimento: procedimiento que somete a prueba una


o varias hiptesis, mediante el manejo controlado de
variables
Desventaja:

debe realizarse en un ambiente artificial

Observacin: el investigador observa lo que le interesa


y registra sus observaciones (hoja de trabajo, contador,
grabadora). Ejemplos
Ciencias

fsicas y naturales
Observacin mecnica (rating)
Ciencias sociales (observacin participante y no participante)

Entrevista cara a cara: visita del enumerador al


informante (censos, encuestas)
Ventaja:

el entrevistador est en control de la entrevista


Desventaja: costo elevado

TCNICAS PARA LA RECOLECCIN


DE DATOS NO EXISTENTES

Entrevista telefnica: especialmente en


opinin pblica, poltica y mercado
Ventajas:

reduce costos y acorta el tiempo


Desventajas: se debe tener telfono, no se puede usar
material visual, y los cuestionarios no deben ser
largos.

Correo: envo de cuestionario para que se llene y


devuelva
Ventajas:

es ms cmodo y barato
Desventajas:

Las instrucciones deben ser claras y preguntas ordenadas


Se requiere alto nivel educativo de parte de la poblacin
No se tiene control sobre quin responde
Alto porcentaje de "no respuesta" (datos no representativos)

TCNICAS PARA LA RECOLECCIN


DE DATOS NO EXISTENTES

Encuesta por Internet: primero se adjunt el


cuestionario, actualmente se coloca en un sitio web y
se invita a las personas a responderlo
Ventajas:

costo bajo y menor tiempo, posibilita la


presentacin de medios audiovisuales, cuestionario
interactivo, informacin en tiempo real, rapidez en los
resultados
Desventajas: no hay listados actualizados, la no respuesta
puede ser baja, no hay control

Registro: se hace obligatorio el registro de ciertos


hechos (oficinas pblicas): matrimonios, nacimientos,
defunciones, accidentes de trnsito
Ventaja:

es muy barato
Desventaja: las personas no cumplen con las disposiciones
legales (subregistro).

TCNICAS PARA LA RECOLECCIN


DE DATOS NO EXISTENTES

Encuestas autoadministradas a personas o


grupos: el cuestionario es llenado por el
informante (luego de una explicacin), en
presencia del entrevistador
Ventaja:

tcnica barata y cmoda, permite que se


planteen dudas o se pidan explicaciones
Desventaja: requiere de poblaciones cautivas que no
siempre corresponden al universo

Estos mtodos se pueden combinar

FASES DE UNA INVESTIGACIN


ESTADSTICA

Tres etapas principales:


Planeamiento

y preparacin
Ejecucin del trabajo de campo
Procesamiento y anlisis de los resultados

Etapas ms detalladas
Definicin

del problema
Establecimiento de los propsitos especficos del estudio
Preparacin de un plan de trabajo
Construccin del cuestionario
Diseo y seleccin de la muestra
Preparacin y ejecucin del trabajo y campo
Procesamiento de la informacin
Anlisis e interpretacin de los datos
Preparacin del informe

CAPTULO 3

El cuestionario

EL CUESTIONARIO:
CARACTERSTICAS Y FUNCIONES

La interrogacin contempla dos pasos


Preparacin

de un cuestionario con preguntas de

inters
Aplicacin de ese cuestionario a los informantes

Factores que condicionan la entrevista


Grado

de dificultad de la pregunta y medida de


intimidad de las preguntas
Nivel de informacin, valores y sentido de autoestima
del informante
Apariencia y actitud del entrevistador, vocabulario
empleado
Presencia de otras personas

EL CUESTIONARIO:
CARACTERSTICAS Y FUNCIONES

Las funciones del cuestionario: son tres


1.

Traducir necesidades de investigacin a preguntas,


que permitan obtener respuestas vlidas y
confiables

2.

Guiar la entrevista y motivar al entrevistador para


que comunique informacin veraz.

3.

Facilitar el correcto registro de las respuestas y


etapas siguientes (codificacin y procesamiento)

EL CUESTIONARIO:
CARACTERSTICAS Y FUNCIONES

Primera funcin: traducir necesidades a preguntas


Investigar

el problema, examinar exhaustivamente los


datos existentes.
Pertinencia: no excluir preguntas claves, no incluir
preguntas innecesarias, con excepcin de las preguntas de
calentamiento y las de transicin.
DOS CUALIDADES FUNDAMENTALES que debe reunir
el cuestionario:
Confiabilidad: una pregunta es confiable, si aplicada bajo las
mismas condiciones, se obtienen respuestas similares.
Validez: una pregunta es vlida si las respuestas reflejan lo que
se quiere medir .

Considerar

costo de entrevista y cansancio del


informante.

EL CUESTIONARIO:
CARACTERSTICAS Y FUNCIONES

Segunda funcin: guiar la entrevista y ayudar al


entrevistador
El

cuestionario gobierna la entrevista


Son esenciales: el vocabulario, la redaccin y orden de las
preguntas, forma de discurrir el cuestionario

Tercera funcin: facilitar el correcto registro de las


respuestas
La

informacin debe expresarse en cdigos


Presentarse en un archivo electrnico de datos
Dos pasos bsicos: codificacin de las respuestas y
digitacin de cdigos. El cuestionario lo facilita porque:
Las preguntas cerradas son precodificadas
En las preguntas abiertas se les coloca el cdigo al margen
La informacin se centraliza en un mismo documento

EL CUESTIONARIO:
CARACTERSTICAS Y FUNCIONES

Preguntas de la investigacin y del


cuestionario
La

interrogante de investigacin es de tipo abstracto


Existen problemas de lenguaje que provocan dificultades
Los entrevistados no son capaces de percibir y
estructurar el tema
En el entrevistado hay desconfianza, temor, afn de
prestigio que pueden falsear las respuestas
La investigacin puede tener un gran componente
inconsciente

LA FORMA DE LAS PREGUNTAS:


ABIERTAS Y CERRADAS
Preguntas estructuradas o no
Grado de libertad que se le permite al entrevistado

LA FORMA DE LAS PREGUNTAS:


ABIERTAS Y CERRADAS

Preguntas cerradas
Las

opciones de respuestas se hallan limitadas o fijadas


de antemano
Pueden ser:
Dicotmicas: slo dos opciones (Ej sexo: femenino, masculino)
De opciones mltiples (Ej: estado conyugal)
Diferenciar entre opciones mltiples (slo una respuesta es
vlida) y respuesta mltiples (se permiten varias respuestas)

Posee

usted automvil?
/___/ S
/___/ No

Ejemplos

en pg 73-74

LA FORMA DE LAS PREGUNTAS:


ABIERTAS Y CERRADAS

Batera de preguntas
Bloque

de preguntas que indaga varias dimensiones de un


cierto tpico (opiniones, actitudes, conceptos, objetos,
productos)

Cunta confianza le tiene a


Asamblea Legislativa
Gobierno
Tribunal Elecciones
ICE
Sala Cuarta
Ejemplos:

pg 75-76

Mucha
/__/
/__/
/__/
/__/
/__/

Alguna Poca Ninguna


/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/
/__/

LA FORMA DE LAS PREGUNTAS:


ABIERTAS Y CERRADAS

Preguntas abiertas
Permiten

una respuesta libre, no limitada a


alternativas preestablecidas. Ej pg 76
Es comn una pregunta abierta despus de una
cerrada.
Para

usted qu es tener xito en la vida?


_____________________________________________
_____________________________________________

Ej pg 77

LA FORMA DE LAS PREGUNTAS:


ABIERTAS Y CERRADAS
Pregunta

abierta con registro cerrado

La pregunta es abierta con opciones preestablecidas


Las opciones no se le leen al informante. Ej pg 77

Usted

ha sido vctima de algn delito durante el ao


pasado?
1 /__/ Violacin del domicilio o robo
2 /__/ Robo en bolsillos o de cartera
3 /__/ Daos o destruccin de su propiedad
4 /__/ Ataques o golpes
5 /__/ Robo de automvil
8 /__/ Otros (especifique) ___________________
0 /__/ Nada

LA FORMA DE LAS PREGUNTAS:


ABIERTAS Y CERRADAS

Pregunta semiabierta
Pregunta

cerrada pero con posibilidad de que el


entrevistado exprese una respuesta diferente

Cuando

compra un pantaln de mezclilla, a qu le da


ms importancia?
1 /__/ Marca
2 /__/ Talla
3 /__/ Tipo de tela
4 /__/ Precio
5 /__/ Otra (especifique) _________________________
9 /__/ NS / NR

VENTAJAS Y DESVENTAJAS COMPARATIVAS


ENTRE LAS PREGUNTAS ABIERTAS Y
CERRADAS

Preguntas abiertas
Ventajas:

El interrogado contesta espontneamente


El interrogado explica siguiendo su propia lgica

Desventajas:

Plantean problemas de procesamiento y de anlisis


Pueden ser laboriosas en su manejo y requerir mucho tiempo

Preguntas cerradas
Ventajas:

Pueden ser formuladas rpidamente, fciles de anotar


Quedan clasificadas en el mismo momento
Procesamiento y anlisis relativamente sencillos.

Desventajas:

Pueden llegar a forzar al entrevistado a dar una respuesta


Puede no incorporar la opcin adecuada a su opinin
La respuesta puede ser interpretada errneamente.

TIPOS DE PREGUNTAS
SEGN INFORMACIN QUE
INDAGAN

Preguntas de hechos:
Relativos

a su persona, familia, organizacin, etc.


Podran fciles y precisas, otras no (ingreso)
Edad, lugar de residencial, nivel de educacin.

Preguntas de acciones o conductas pasadas:


Realizacin

de un acto. Ej: voto, marcas de caf

Preguntas de intencin:
Cmo

actuara si se presentara la ocasin, ej compras


Preguntas difciles (recordar o imaginar)

Preguntas de opinin:
Se

pide al individuo que diga lo que piensa, ej leyes nuevas

Preguntas de actitud:
Se

asemejan a las de opinin, ej el aborto


Cada respuesta constituye un indicador de hecho o actitud

DETALLES ACERCA DE LA
CONSTRUCCIN DE
CUESTIONARIOS

El orden de las preguntas


Evitar

contaminacin, preguntas de calentamiento,


efecto embudo, preguntas amenazantes

Preguntas filtro
Preguntas

canalizadoras a ciertos informantes

El nmero de preguntas y la duracin del


cuestionario
Restringir

las preguntas difciles, realizar un nmero


razonable de preguntas.

La modulacin de los cuestionarios


Mdulo

grupos

bsico y mdulo especfico, aplicados en dos

DETALLES ACERCA DE LA
CONSTRUCCIN DE
CUESTIONARIOS

Algunos problemas frecuentes en la redaccin de las


preguntas
Tipo

de lenguaje utilizado
Pregunta bidimensional o doble
La doble negacin
Preguntas cargadas (sesgadas) (se sugiere respuesta)
Preguntas que suponen demasiado conocimiento

Instrucciones para el entrevistador


Las

instrucciones deben aparecer en el cuestionario

La prueba del cuestionario


Identificar

y eliminar problemas de mala redaccin, mal


ordenamiento, temes innecesarios, palabras con sesgos
Permite conocer la duracin del cuestionario

PROCESAMIENTO DE LOS DATOS

Revisin de los cuestionarios


Preguntas

aplicadas
Respuestas ilegibles
Respuestas confusas
Eliminar inconsistencias
Respuestas extraas o poco comunes

Codificacin
Manual

de cdigos

Digitacin o captura de los datos


Digitacin

directa en el disco duro del computador


Captura directa por los entrevistadores
Captura utilizando lectura ptica

Tabulacin de los datos

MUCHAS GRACIAS

Вам также может понравиться