Вы находитесь на странице: 1из 47

Definicin

La Estadstica es la Ciencia de la
Sistematizacin, recogida, ordenacin y
presentacin de los datos referentes a un fenmeno
que presenta variabilidad o incertidumbre para su
estudio metdico, con objeto de
deducir las leyes que rigen esos fenmenos,
y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones
generales.
D
e
s
c
r
i
p
t
i
v
a
P
r
o
b
a
b
i
l
i
d
a
d
I
n
f
e
r
e
n
c
i
a
La Estadstica se utiliza como tecnologa al servicio de las
ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza.
Transforma datos en informacin.
Contribuye a la generacin de conocimiento.
Para qu sirve la estadstica?
Rol de la estadstica
Proporcionar mtodos para evaluar y juzgar la teora y la realidad.
Ejemplos de aplicacin
1) En Administracin de Empresas: la estadstica se utiliza para evaluar
un producto antes de comercializarlo.
2) En Economa: para medir la evolucin de los precios mediante
nmeros ndice o para estudiar los hbitos de los consumidores a travs
de encuestas de presupuestos familiares.
3) En Ciencias Polticas: para conocer las preferencias de los electores
antes de una votacin mediante sondeos y as orientar las estrategias de
los candidatos.
4) En Sociologa: para estudiar las opiniones de los colectivos sociales
sobre temas de actualidad.
5) En Psicologa: para elaborar las escalas de los test y cuantificar aspectos
del comportamiento humano (por ejemplo los test que se aplican a los
candidatos para un cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadstica, es para determinar
el estado de salud de la poblacin.
7) En la industria: para disminuir y controlar la fraccin defectuosa.
Plantear
hiptesis
Obtener
conclusiones
Recoger datos
y analizarlos
Disear
experimento
Mtodo cientfico y estadstica
Etapas de una investigacin estadstica
Un anlisis estadstico se lleva a cabo siguiendo las etapas habituales
en el llamado mtodo cientfico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la
investigacin y precisar el universo o poblacin.
2) Recogida de la informacin: consiste en recolectar los datos
necesarios relacionados al problema de investigacin.
3) Anlisis descriptivo: consiste en resumir los datos disponibles
para extraer la informacin relevante en el estudio.
4) Inferencia estadstica: consiste en suponer un modelo para la
poblacin e interpretacin de los datos a la luz del modelo para
obtener conclusiones generales.
5) Diagnstico: consiste en verificar la validez de los supuestos del
modelo que nos han permitido interpretar los datos y llegar a
conclusiones sobre la poblacin
Esquema de las etapas de un estudio estadstico
AREA DE INTERES
DATOS DATOS
Tema de Investigaci Tema de Investigaci n n
- -Antecedentes Previos Antecedentes Previos
- -Objetivos Objetivos
- -Preguntas de Investigaci Preguntas de Investigaci n n
- -Posibles Hip Posibles Hip tesis tesis
- -Unidad de An Unidad de An lisis lisis
- -Poblaci Poblaci n n
- -Variables Variables
ORGANIZAR Y RESUMIR ORGANIZAR Y RESUMIR
ESTAD ESTAD STICA DESCRIPTIVA STICA DESCRIPTIVA
(Tablas, Grficos, Medidas
Descriptivas, etc.)
INTERPRETACIN
INFERENCIA ESTAD INFERENCIA ESTAD STICA STICA
Poblaci Poblaci n o Muestra? n o Muestra?
CONCLUSIONES
Poblaci Poblaci n n
Muestra Muestra
Probabilidad Probabilidad
INFORMACIN
Otros ejemplos de problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminacin salarial debida
al sexo de la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en trminos de condiciones
econmicas y sociales en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en
cuanto a vestuario, alimentacin, ocio y vivienda.
4) Se quiere determinar el tiempo de vida de un activo.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los
trabajadores de distintas empresas del pas.
6) Se quiere determinar el perfil sociodemogrfico de los estudiantes de una
Universidad.
7) Se quiere estudiar el gasto en telfono mvil mensual de los estudiantes de
una Universidad, y si ste tiene alguna relacin con su edad u otras
caractersticas.
Poblacin y muestra
Poblacin: es el conjunto sobre el que estamos interesados en
obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.
Muestra: es un subconjunto suyo al que tenemos acceso y
sobre el que realmente hacemos las observaciones
(mediciones)
Debera ser representativo
Esta formado por miembros seleccionadosde la poblacin
(individuos, unidades experimentales).
Ejemplo
Si se desea conocer el monto pagado por cada industria del distrito de Brea
por concepto de impuestos locales durante el ao 2006, entonces la unidad
estadstica es cada industria situada en el distrito de Brea en el ao 2006.
En este caso la poblacin es el conjunto de industrias situadas en dicho
distrito en ese ao; es una poblacin finita.
Para estudiar las horas de sol que reciben las hojas de plantas de banano en
la zona 8 de Ucayali durante el ao de 1997, entonces la unidad estadstica
es una hoja de banano de las plantaciones en la zona 8 de Ucayali en 1997.
La poblacin es el conjunto de hojas de banano de las plantaciones de la
zona 8 de Ucayali en 1997; por razones prcticas, se considera que la
poblacin es infinita.
Variables
Una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos
de cada individuo es resumida en variables.
En los individuos de la poblacin espaola, de uno
a otro es variable:
El grupo sanguneo
{A, B, AB, O}Var. Cualitativa
Su nivel de felicidad declarado
{Deprimido, Ni fu ni fa, Muy Feliz}Var. Ordinal
El nmero de hijos
{0,1,2,3,...}Var. Numrica discreta
La altura
{162 ; 174; ...}Var. Numrica continua
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no
se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)
Ordinales: Si sus valores se pueden ordenar
Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor
Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con
ellos)
Discretas: Si se obtiene del conteo (en cualquier intervalo existe un nmero finito o infinito
numerable de valores posibles)
Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos
Continuas: Si se obtiene de medicin (en un intervalo arbitrariamente pequeo existen infinitos
valores posibles)
Altura, peso, ventas, dosis de medicamento administrado, edad
Tipos de variables
Es buena idea codificar las variables
como nmeros para poder procesarlas
con facilidad en un ordenador.
Es conveniente asignar etiquetasa
los valores de las variables para
recordar qu significan los cdigos
numricos.
Sexo (Cualit: Cdigos arbitrarios)
1 =Hombre
2 =Mujer
Raza (Cualit: Cdigos arbitrarios)
1 =Blanca
2 =Negra,...
Felicidad Ordinal: Respetar un orden al
codificar.
1 =Muy feliz
2 =Bastante feliz
3 =No demasiado feliz
Se pueden asignar cdigos a
respuestas especiales como
0 =No sabe
99 =No contesta...
Estas situaciones debern ser tenidas
en cuentas en el anlisis. Datos
perdidos (missing data)
Aunque se codifiquen como nmeros, debemos recordar siempre el
verdadero tipo de las variables y su significado cuando vayamos a
usar programas de clculo estadstico.
No todo est permitido con cualquier tipo de variable.
Los posibles valores de una variable suelen denominarse modalidades.
Las modalidades pueden agruparse en clases (intervalos)
Edades:
Menos de 20 aos, de 20 a 50 aos, ms de 50 aos
Hijos:
Menos de 3 hijos, De 3 a 5, 6 o ms hijos
Las modalidades/clases deben forman un sistema exhaustivo y
excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?
Excluyente: Nadie puede presentar dos valores
simultneos de la variable
Estudio sobre el ocio
Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)
Escala nominal: Son nominativos, slo designan. La finalidad es
clasificar datos cualitativos. A este nivel, los nmeros atribuidos a las
distintas modalidades de la caracterstica son puros nombres que
representan diferencias de clase pero no de grado, y, por tanto, slo se
da la posibilidad de que exista la relacin de igualdad/desigualdad entre
las distintas modalidades que puede presentar una variable.
Escala ordinal: Adems de la igualdad/desigualdad, una ordenacin
considerando que una de las modalidades es mayor que otra, de manera
que sea posible indicar en una secuencia qu modalidad implica mayor
cantidad de la variable y, por ende, qu modalidad implica menor
cantidad. Pero no se puede representar distancias entre objetos porque
esta escala no tiene unidades de medicin.
Escala de intervalo: (tiene cero relativo, creada por el hombre). Nos
permite describir cunto ms o menos un objeto posee que otro, de las
escalas anteriores no slo se dan las dos relaciones anteriores sino que,
adems, se puede establecer una unidad emprica de medida que
especifique el nmero de veces que la diferencia entre dos modalidades
la incluye.
De este modo, si establecemos tres modalidades en una variable (a, b,
c) podemos comprobar empricamente cuntas veces la diferencia entre
a y b es mayor/menor que la diferencia entre b y c. En la escala
Fahrenheit se puede manifestar que la distancia entre 90 y 70 estn dos
veces a la distancia entre 70 y 60.
Con los valores de esta escala son vlidas las relaciones de igualdad,
de no igualdad y de orden. Tambin son vlidas las operaciones de
adicin y sustraccin entre los valores de la escala, y la multiplicacin y
divisin entre Ias diferencias de dos vaIores mismos de la escala.
Escala de razn y proporciones: (Tiene cero fijo o absoluto). En esta
escala se da la relacin biunvoca entre los valores que adquiere la
variable y la secuencia de nmeros reales. Adems, el origen de la
escala s representa la ausencia absoluta de la caracterstica que se
est midiendo.
Observacin 1
Ejemplo
Romero (2001)
Observacin 2
Dato: Puede ser un nmero, una palabra o un smbolo. Por
ejemplo, la edad de un miembro especfico de una poblacin
(18 aos).
Ejemplo
Parmetros y estadsticos
Parmetro: Es una cantidad numrica
calculada sobre una poblacin.
La altura media de los individuos de un
pas.
La idea es resumir toda la informacin
que hay en la poblacin en unos pocos
nmeros (parmetros).
Estadstico: dem (cambiar poblacin por muestra).
La altura media de los que estamos en este aula.
Somos una muestra (representativa?) de la poblacin.
Si un estadstico se usa para aproximar un parmetro tambin se le suele
llamar estimador.
Ejercicio
Identificar cada una de las siguientes variables como cualitativa
o cuantitativa
1. La escuela secundaria de donde termincada estudiante de la clase.
2. La cantidad de gasolina que le ponen a sus carros los prximos 10 clientes
de Petrleo X80
3. La cantidad de agua que consume una familia mensualmente.
4. El partido poltico por el cual votarn los estudiantes en las prximas
elecciones para Alcalde.
5. La cantidad de tiempo a la semana que dedican los estudiantesde la clase
a estudiar estadstica y probabilidades
6. El color del automvil preferido por los estudiantes de la clase.
Se desea saber la renta promedio anual de Cuarta Categora de las
personas naturales de Lima.
Ejemplo
La poblacin son todos las personas naturales de Lima.
Una muestra es un subconjunto representativo de personas
naturales de Lima (preferible con personas naturales de diversas
profesiones)
La variable es la renta anual de cuarta categora de las personas
naturales de Lima.
Un dato es la renta anual de cuarta categora de una persona natural
especfica de Lima (S/. 35252.00).
Los datos es el conjunto de todas las rentas anuales de cuarta
categora de la muestra (24000,14250,35260,18316,68250)
El parmetro de inters es la renta anual promedio de cuarta
categora de todas las personas naturales de Lima
El estadstico o estimador : es la renta anual promedio de las
personas naturales que conforman la muestra seleccionada.
Solucin
Ejercicio
Clasificar las siguientes variables:
1. Preferencias polticas (izquierda, derecha o centro).
2. Marcas de cerveza.
3. Velocidad en Km/h.
4. El peso en Kg.
5. Signo del zodiaco.
6. Nivel educativo (primario secundario, superior).
7. Aos de estudios completados.
8. Tipo de enseanza (privada o pblica).
9. Nmero de empleados de una empresa.
10.La temperatura de un enfermo en grados Celsius.
11. Estrato social (bajo, medio o alto).
12. La presin de un neumtico
C C mo dise mo dise ar un equipo de ar un equipo de
mantenimiento mantenimiento
C C mo aumentar el mo aumentar el
rendimiento de un proceso rendimiento de un proceso
MODELO Variables Variables: :
- - N N mero de aver mero de aver as ( as (x x
1 1
) )
- - Tiempo reparaci Tiempo reparaci n ( n (x x
2 2
) )
Hip Hip tesis tesis: : las aver las aver as as
Se producen Se producen
independientemente independientemente
La probabilidad de no La probabilidad de no
aver aver a disminuye a disminuye
exponencialmente con el exponencialmente con el
tiempo tiempo
Hip Hip tesis: tesis: tiempo reparaci tiempo reparaci n n
Depende de muchos Depende de muchos
peque peque os factores os factores
Dos ejemplos de investigaciones estad
Dos ejemplos de investigaciones estad

sticas
sticas
PREGUNTA
Variables Variables: :
- - Rendimiento en % (y) Rendimiento en % (y)
- - Temperatura Temperatura x x
1 1
- - Concentraci Concentraci n n x x
2 2
Hip Hip tesis tesis: :
El rendimiento aumenta en El rendimiento aumenta en
promedio linealmente con la promedio linealmente con la
temperatura y la temperatura y la
concentraci concentraci n n
Para valores fijos de Para valores fijos de x x
1 1
y y x x
2 2
el rendimiento var el rendimiento var a a
aleatoriamente aleatoriamentealrededor de alrededor de
su valor medio su valor medio
RECOLECCIN
DE
INFORMACIN
Muestreo de mquinas para
estudiar sus averas y tiempo
de reparacin
Diseo de un experimento
que se varen x
1
y x
2
y se
mida y
ESTIMACIN
PARMETROS
Estimar:
, tasa media de averas
, tiempo medio de
reparacin
, variabilidad en el
tiempo de reparacin
Estimar:
El efecto de la temperatura
(b) y el de la concentracin
(c) sobre el rendimiento
Variabilidad experimental
CONTRASTES
DE SIMPLIFI-
CACIN
Tienen todos los tipos de
mquinas el mismo ?
Los tipos de averas, el
mismo y ?
Es el efecto de la
temperatura y concentracin
idntico (b=c ) ?
CRTICA DEL
MODELO
Es cierta la independencia
entre las averas?
Son la variabilidad de x
1
y
x
2
en la muestra consistentes
con las hiptesis ?
Es la relacin entre y
(x
1
, x
2
) lineal?
Es la variabilidad de y para
x
1
, x
2
fijos, independ. de los
valores concretos de x
1
, x
2
?
Fuentes de Datos
Fuente de datos internos: Es la informacin recopilada por la empresa de
los resultados de su propia gestin. Ejemplos: reportes financieros, reportes
de operaciones de produccin, de ventas, de compras, estado de prdidas y
ganancias, etc.
Fuente de datos externos: Son informaciones estadsticas elaboradas por
instituciones de investigacin, ya sean pblicas o privadas, o dependencias
especializadas, generalmente requeridos a nivel sectorial o nacional.
Ejemplos: El ministerio de Economa y Finanzas, a travs de sus organismos
especializados lleva y elabora estadsticas de comercio al por mayor y al por
menor, comercio exterior (importacin y exportacin), etc.
Fuente primarias: Cuando la informacin estadstica es obtenida
directamente de la unidad de observacin. Ejemplos: los resultados de los
censos de poblacin y vivienda, ndices de precios al consumidor, etc.
Fuente de datos externos: Cuando se obtiene informacin estadstica
elaborada a base de datos de fuentes primarias. Ejemplos: una agencia de
viajes cuenta con informacin relacionada como nmero de turistas y viajes
por departamento, estos datos interesan a empresas e individuos de la
industria turstica, las dependencias de los gobiernos son otra fuente
importante de datos, la importancia de internet como fuente de datos sigue
creciendo, etc.
Mtodos para obtener datos
Experimento: El investigador controla o modifica el ambiente y
observa el efecto en la variable de estudio.
Encuesta: Los datos se obtienen de una muestra de la poblacin.
No hay modificacin de variables. Pueden ser:
Encuesta retrospectiva: Cuando parte de datos que se conoce y
el estudio consiste en descubrir caractersticas de su historia.
Encuesta prospectiva: cuando de una muestra de la poblacin
estudia una o ms caractersticas a travs del tiempo.
Censo: Los datos se obtienen de toda la poblacin. Es poco
usado por lo costoso y el tiempo que consume.
El Cuestionario
El cuestionario es un conjunto de preguntas sobre los hechos o
aspectos que interesan en una investigacin y que son contestadas por
los encuestados. Se trata de un instrumento de recoleccin de datos.
Para hacer un buen cuestionario la experiencia juega un papel
importante ya que se considera un arte la confeccin de un buen
cuestionario.
Haciendo entrevistas personales. Puede ser el mtodo ms efectivo en
muchas ocasiones pero es costoso y requiere bastante tiempo para ser
ejecutado.
Vamos a trabajar en los siguientes problemas de investigacin: 6) Se quiere
determinar el perfil sociodemogrfico de los estudiantes de una Universidad; y 7) Se
quiere estudiar el gasto en telfono mvil mensual de los estudiantes de una
Universidad, y si ste tiene alguna relacin con su edad u otras caractersticas.
Definir: Poblacin bajo estudio, unidad de anlisis, variables de inters.
Formulario para el registro de datos de los alumnos de LADE-2007

1) Registro N 2) Hombre Mujer 3) Edad

4) Nmero de hermanos(as): 5) Vive con sus padres?: Si No

6) En que comunidad autnoma naci?:

7) Paga alquiler?: Si No 8) Cunto paga de alquiler al mes?:

9) En que Sector vive actualmente?:

10) Que medio de transporte utiliza generalmente para venir a la Universidad?

11) Desayuna de lunes a viernes?: Siempre Casi Siempre A veces Nunca

12) Fuma?: Si No 13) Cuntos cigarrillos fuma al da?:

14) Tiene telfono mvil?: Si No 15) Cuanto gasta en telfono mvil mensualmente?:

Observacin: por favor responda a cada una de las preguntas
Otras Maneras de Recolectar Datos
a) Haciendo entrevistas por telfono. Tiene la desventaja de que el entrevistado
puede no ser sincero en sus contestaciones.
b) Mediante cuestionarios emitidos por correo. Es costoso y por lo general no ms
del 30% de los entrevistados retornan el cuestionario.
c) Por observacin directa.
d) A travs de la Internet.
e) Usando simulacin por computadoras.
Muestreo
El proceso de seleccionar la muestra se llama muestreo.
Para que la muestra sea representativa y la informacin se pueda
generalizar a toda la poblacin la muestra debe ser seleccionada
probabilsticamente.
El marco muestral es la lista de todos los miembros de la poblacin
Tipos de muestreo
Muestreo por conveniencia. Los elementos de la
muestra se seleccionar por que le conviene al
investigador. Los resultados no se pueden generalizar a
toda la poblacin.
Muestreo aleatorio o probabilstico. Los elementos de la
muestra tienen una determinada probabilidad de ser
seleccionados
Motivos que aconsejan tomar muestras
Cuando la Poblacin es muy grande.
Por motivos econmicos.
Por falta de personal adecuado.
Por motivo de calidad de los resultados.
Por mayor rapidez en recoger los datos y presentar los
resultados.
Situaciones de riesgo.
Tipos de Muestreo Probabilstico
Simple
Estratificado
Por conglomerado
Sistemtico
Muestreo aleatorio simple
Cada elemento de la poblacin tiene la misma probabilidad de ser
seleccionado en la muestra.
Ejemplo
El gerente de un Banco est interesado en saber cunto tiempo le toma a los
empleados en ir de su casa al trabajo. La empresa tiene 124 empleados.
Desea obtener una muestra de 35 empleados.
Primero debe hacer una lista de todos los empleados.
Selecciona 35 nmeros aleatoriamente (puede utilizar la tecla randomde la
calculadora o la tabla de nmeros aleatorios).
Ejemplo
En un estudio de la Asociacin Nacional de Bancos cuyo objetivo
fue de medir la satisfaccin de los empleados con respecto de los
administradores de agencia, se obtuvo una muestra de 100
empleados. Determinar la poblacin objetivo, la unidad de
muestreo, la unidad de observacin y el marco muestral.
Solucin
Poblacin Objetivo:
Son todos los empleados que trabajan en las agencias que agrupa
la Asociacin Nacional de Bancos.
Unidad de Muestreo:
Lo constituye cada agencia bancaria y las unidades de
observacin los empleados.
Marco de Muestreo:
Es la lista de todos los bancos que pertenecen a la Asociacin
Nacional de Bancos.
Ejercicios de aplicacin

Вам также может понравиться