Вы находитесь на странице: 1из 222

ESTADISTICA PARA LA TOMA DE DECISIONES.

40

30

Porcentaje

20

10

0 Bajo Intermedio Alto

Hbito de estudio

Dr. CLETO DE LA TORRE DUEAS


cletounsaac@gmail.com 2011

1RA EDICION

Hecho el Depsito Legal en la Biblioteca Nacional del Per REGISTRO N : 2009-09684

Todos los derechos reservados. Prohibida la reproduccin total o parcial de este libro en forma idntica o modificada por cualquier medio mecnico o electrnico, incluyendo fotocopia, grabacin o cualquier sistema de almacenamiento y recuperacin de informacin no autorizada por el autor.

Impreso en Per, 2009.

CAPITULO I INVESTIGACION CIENTIFICA.

1.1 INVESTIGACIN CIENTFICA La investigacin cientfica, se puede entender como un conjunto de actividades que realizamos para obtener conocimientos nuevos, sobre problemas nuevos que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir, respecto al conjunto de conocimientos ya provisionalmente establecidos y sistematizados por la humanidad, conocimientos nuevos que, como aportes, se sumarn a la Ciencia. Qu es investigar? Investigar viene del latn investigare. Es la forma ms adecuada de aproximarse al conocimiento de la verdad mediante verdades parciales. Desarrollar actividades con el objetivo de registrar, indagar o descubrir la verdad. En trminos generales, es agregar algo nuevo a los conocimientos humanos. Es un proceso que, mediante la aplicacin del mtodo cientfico, procura obtener informacin relevante y fidedigna. corregir o aplicar el conocimiento De entender, verificar,

EL PROCESO DE INVESTIGACIN

INTERROGANTES PARA EL PROCESO: DISEO Qu estudiar? Cul es la situacin actual? Seleccin del tema. Planteamiento del problema

Cules son las preguntas de Formulacin del problema investigacin respondidas? Qu propsitos tiene la Objetivos. que deben ser

investigacin que se plantea? Cules son los motivos para Justificacin. hacer el estudio propuesto? Quines anteriormente planteado? Qu hay escrito al respecto? Qu se pretender probar? Cmo se va a realizar la Marco Terico. Hiptesis. Metodologa. han sobre investigado Marco Histrico el tema

investigacin? Cunto tiempo se requiere para el estudio propuesto? Qu recursos se necesitan? A que fuentes escritas se va a referir el investigador? Presupuesto. Bibliografa. Programacin

INTERROGANTES PARA EL PROCESO: DESARROLLO Qu tipo de informacin se Identificacin de informacin.

necesita para cumplir los objetivos, responder la pregunta (s) de

investigacin hiptesis?

verificar

las

Dnde encuentro la informacin?

Definicin informacin.

de

fuentes

de

Si utilizo fuentes primarias, a Determinacin de la muestra cuntas personas debo requerir para obtener informacin? De qu forma puedo obtener la Tcnicas informacin? de recoleccin:

Observacin, encuesta, etc. procesamiento de y la

Cmo organizar la informacin Tabulacin, obtenida? ordenamiento informacin. Cmo se utiliza la informacin Elaboracin procesada y ordenada? informacin.

anlisis

de

la

Cmo se puede presentar el Presentacin de los resultados de informe de los resultados del la investigacin. anlisis?

1.2 PROBLEMA DE INVESTIGACIN Es un hecho, fenmeno o situacin que incita a la reflexin o al estudio y es importante puesto que permite conocer la situacin que se va a mostrando sus principales rasgos. estudiar

CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS. De manera general se considera que hay un problema cuando lo que DEBERA SER, difiere de lo que ES. El DEBERA SER, es el marco referencial, el patrn comparativo, el ideal, el modelo, el paradigma. Lo que ES, representa la realidad, es la prctica. DEBERA SER diferente a ES, entonces existe Problema

Determinacin de Necesidades Educativas


COMPORTAMIENTO REAL COMPORTAMIENTO DESEADO

DISCREPANCIA
LO QUE ES LO QUE DEBE SER

NECESIDAD EDUCATIVA

SITUACIN PROBLEMTICA

PROBLEMA DE INVESTIGACION. Para la presentacin del POI, es necesario considerar cuatro momentos: el diagnstico, el pronstico, el control del pronstico y la formulacin de la pregunta o preguntas o la redaccin de un texto a manera de pregunta. El diagnstico es la descripcin de los sntomas o problemas. El pronstico es la serie consecuencias de los problemas. El control del pronstico es la serie de acciones para superar las consecuencias de los problemas. Formulacin del problema

Aspectos a integrar en la conceptualizacin y en la definicin de un problema de investigacin. Pensar en: Qu se investigar? Quines participarn Elementos del enunciado: Variable/s Sujetos a estudiar 7

Qu estrategia se seguir? Dnde se realizar? Cundo se realizar?

Diseo mbito de estudio Perodo de Tiempo.

ELEMENTOS DE DEL TITULO DE UN PROBLEMA Especificidad Situacin problemtica Unidad de estudio Espacio Tiempo

Situacin problemtica Responde a la pregunta Qu investigar? Por ejemplo: Rendimiento acadmico, gestin educativa, desempeo profesional,.. La especificidad Es el aspecto o los aspectos concretos que se quiere investigar acerca del hecho o situacin problemtica. Por ejemplo: causas, consecuencias, caractersticas, importancia, influencia, tendencia, modalidades, incidencia, prevalencia, implicancias, estructura, funcin, nivel, relacin, evolucin, etc. Unidades de estudio. Son aquella en las se ponen de manifiesto los hechos o situaciones problemticas y constituyen, desde el punto de vista estadstico, la poblacin o muestra a la que se refiere la investigacin. Son: Personas, grupos Espacio Esta referido al lugar en el que ocurre el hecho o situacin problemtica. Puede ser geogrfico o administrativo. Dnde?; Per, Ciudad del Cusco, Zona Franca, Aceros Arequipa, etc. Tiempo Est referido al momento en que ocurre el hecho o situacin problemtica. Cundo? sociales, seres, acontecimientos, instituciones, objetos,

procesos.

1.3 FORMULACION DE OBJETIVOS Son los propsitos o fines que se pretenden lograr al realizar la investigacin. Los objetivos son de dos tipos: El objetivo general (singular). Es un enunciado proposicional integral y un Logro terminal a alcanzar en la investigacin. Los objetivos especficos (plural). Los Objetivos Especficos, Son enunciados desagregados del objetivo general orientados al logro de propsitos concretos y estn en relacin a lo que aspira alcanzar con el estudio. Los objetivos deben ser verificables Al definir los objetivos, debemos pensar inmediatamente en la manera de verificar si stos se han cumplido o no (pensar en mtodos o herramientas para ello) Lo anterior nos permitir ir dibujando el perfil metodolgico de nuestra investigacin Los objetivos se convierten as en la carta de navegacin de la investigacin a realizar Los objetivos deben ser precisos y no muy ambiciosos: deben ser acordes con los recursos disponibles (tiempo) y ello delimitar el nivel de detalle esperable. Estar expresados en verbos en infinitivo (determinar, analizar, identificar, evaluar, diagnosticar, comprobar, etc.) conocer, explicar, refutar,

Elementos a tomar en cuenta para redactar un objetivo Sujeto Contenido Accin Elemento de estudio. Expresa el cambio requerido Conjunto de actividades que se desarrollan.

Ejemplo 1: Reforzar la capacidad de gestin en los centros de educacin inicial del pas para la atencin de los dominios del aprendizaje de los nios de 4 y 5 aos de edad. 9

Accin

: Reforzar la capacidad de gestin en los centros de

educacin inicial del pas. Contenido: La atencin de los dominios del aprendizaje. Sujeto : Nios de 4 a 5 aos de edad

1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIN Criterios de justificacin. Originalidad Relevancia Inters Factibilidad Criterios para delimitar Espacial - Geogrfica Cronolgica VIABILIDAD: Es necesario plantearse las siguientes preguntas: Se dispone de Recursos? Es factible realizar en el tiempo previsto? Es factible lograr la participacin de los sujetos u objetos necesarios? Es factible conducir el estudio con la metodologa necesaria? La metodologa a seguir, conduce a dar respuesta al problema? Se conoce y se domina la metodologa seleccionada? Hay problemas tico morales en el desarrollo? 1.5 MARCO TEORICO En el marco terico se integra con las teoras, enfoque tericos, estudios y antecedentes en general que se refieran al problema de investigacin. Para elaborar el marco terico es necesario detectar, obtener y consultar la literatura y otros documentos pertinentes para el problema de investigacin, as como extraer y recopilar de ellos la informacin de inters.

10

La revisin de la literatura puede iniciarse manualmente o acudiendo a un banco de datos al que se tenga acceso por computadora. La construccin del marco terico depende de lo que

encontremos en la revisin de la literatura: Marco Terico: Fundamentacin terica dentro de la cual se enmarca la investigacin Marco Conceptual: Definicin de conceptos relevantes utilizados en el estudio Marco Normativo: Normas, leyes referentes al estudio

Qu funciones cumple el marco terico? Sirve de gua al Investigador Provee un marco para la interpretacin de resultados Prevenir errores. Orientar el estudio, Ampliar el horizonte del estudio y guiar al investigador, Delimitar el rea de investigacin, Establecer los antecedentes del problema, Fundamentar el contenido del problema, Facilitar la formulacin de las hiptesis, Implicar nuevas lneas y reas de investigacin, Proveer un marco de referencia para interpretar los resultados de estudio.

1.6 HIPOTESIS DE INVESTIGACION

Afirmaciones o suposiciones que hace el investigador respecto al problema de investigacin. Es una suposicin que permite establecer relaciones entre hechos. El valor de una hiptesis reside en su capacidad de establecer esas relaciones entre los hechos y de esa manera, explicarnos por qu se produce el fenmeno de estudio. 11

Qu Funciones cumple? Direccionar el problema objeto de investigacin Identificar variables objeto de anlisis Orientar el uso de mtodos y tcnicas de obtencin de informacin Elementos estructurales de la hiptesis 1. Las unidades de anlisis, que puedan ser los individuos, grupos, viviendas, instituciones, etc. 2. Variables, las caractersticas o propiedades cualitativas o

cuantitativas que presentan las unidades de anlisis. 3. Los elementos lgicos, son los que relacionan las unidades de anlisis con las variables y estas entre s. Requisitos para estructurar las hiptesis Las hiptesis deben referirse slo a un mbito determinado de la realidad social. Las hiptesis en las ciencias sociales slo pueden someterse a prueba en un universo y contexto bien definidos. Los conceptos de las hiptesis deben ser claros y precisos. En las hiptesis, los conceptos son las variables y las unidades de anlisis. Los conceptos de las hiptesis deben contar con realidades o referencias empricas observables (verificables). El planteamiento de las hiptesis deben prever las tcnicas para probarlas. Se deben formular hiptesis que estn relacionadas con tcnicas disponibles para su verificacin.

REQUISITOS PARA FORMULAR LA HIPTESIS Debe referirse a hechos reales. Debe ser formulada en trminos de relacin o causalidad. Las variables y su relacin, tienen que ser comprensibles, precisos y concretos. Tener fundamentacin terica. Deben ser de poder predictivo y explicativo. 12

CARACTERSTICAS Ser especficas (E): Debe indicar un asunto concreto por investigar.

Ser lgica (L): La relacin de las variables debe ser racionalmente pertinentes Debe tener poder explicativo, debe ser respuesta a su problema. Debe ser compatible con los conocimientos actuales (Teora)

Ser Contrastable (C) : Es decir, ser comprobable Necesita tener referencia emprica, capacidad de ser probada y

verificada en los hechos. Debe ser operacional. Fundamentarse en un cuerpo terico.

Estar de acuerdo con las tcnicas y recursos disponibles para probarlas.

ELEMENTOS ESTRUCTURALES DE LA HIPTESIS

Las unidades de anlisis:, que pueden grupos, instituciones y otros.

ser individuos, familias,

Las Variables: Independiente y Los elementos lgicos, que con las

dependiente. relacionan las unidades de anlisis

variables y a estas entre s.

1.7 NIVELES DE INVESTIGACIN.

El nivel de una investigacin viene dado por el grado de profundidad y alcance que se pretende con la misma

13

INVESTIGACIN DESCRIPTIVA Orientada al descubrimiento de las propiedades particulares del hecho o situacin problemtica y tambin a la determinacin de la frecuencia con que ocurre el hecho o situacin problemtica. Responde a las preguntas Cmo son? Cuntos son? Dnde estn? Se refiere a las caractersticas cualidades internas y externas, propiedades y rasgos de la poblacin de estudio

Problema
Pregunta Cul es grado de .....? Qu nivel?

Ejemplo 2: Nivel de conocimiento de las estrategias cognitivas por los profesores, de la poblacin de la ciudad de Cusco, 2011. INVESTIGACIN EXPLICATIVA Orientada al descubrimiento de las causas o consecuencias o condicionantes de la situacin problemtica Est dirigida a responder a las causas de los eventos fsicos o sociales y su inters se centra en explicar por qu y en qu condiciones ocurre un fenmeno, o por qu dos o ms variables se relacionan. Por qu? La finalidad es determinar por qu un hecho o fenmeno de la realidad tiene tales y cuales caractersticas. Problema Pregunta En que medida .....? Cmo influye..? Ejemplo 3: Principales causas de la desercin escolar en la regin andina del Per, 2010.

INVESTIGACIN COMPARATIVA Orientada al estudio de las semejanzas o diferencias de un hecho o situacin problemtica en dos circunstancias diferentes. Ejemplo 4: Nivel de aplicacin de metodologas de enseanza por los profesores de las instituciones educativas A y B de Cusco, 2010.

14

INVESTIGACIN RELACIONAL Orientada al descubrimiento de la influencia de un hecho o situacin problemtica en otro hecho o situacin problemtica.

Ejemplo 5: Influencia de la internet en la lectura de los estudiantes de secundaria de la Ciudad del Cusco, 2011.

INVESTIGACIN CORRELACIONAL Orientada a descubrir la covariacin o correspondencia entre los valores de dos hechos o situaciones problemticas.

Ejemplo 6: Correlacin entre hbitos de estudio y aprendizaje en los estudiantes de la Universidad de Nacional San Antonio Abad del Cusco, 2011. INVESTIGACIN EXPERIMENTAL Orientada a descubrir la validez de un hecho para la modificacin de una situacin problemtica. Qu cambios y modificaciones se han producido? Qu mejoras se han logrado?. Problema Pregunta Es ms eficaz ...que....?

Ejemplo 7: Evaluacin del efecto del uso de tres tipos de materiales didcticos en el rendimiento acadmico, en las I.E de la ciudad de Cusco, 2011.

1.8 TIPOS DE INVESTIGACION Los Tipos de investigacin se determinan mediante la aplicacin de distintos criterios, a continuacin se refieren algunos de ellos.

INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento cientfico existente acerca de la realidad.

15

INVESTIGACION APLICADA.

Se investiga

para transformar, modificar o

producir cambios en un determinado sector de la realidad.

INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su propsito es dar respuesta objetiva a interrogantes que se plantea en un determinado fragmento de la realidad y del conocimiento con el objeto de

contribuir en la estructuracin de las teoras cientficas.

INVESTIGACION

TECNOLOGICA.

Se

relaciona

esencial,

objetiva

metodolgicamente con el nivel experimental, se busca cambios mediante la aplicacin de nuevos sistemas.

1.9 DISEOS DE INVESTIGACION. Conjunto de estrategias procedimentales y metodolgicas definidas y elaboradas para el desarrollo del proceso de investigacin. El diseo de investigacin puede ser pensado como la estructura de la Investigacin. El investigador debe seleccionar un diseo de investigacin. Esto se refiere a la manera prctica y precisa que el investigador adopta para cumplir con los objetivos de su estudio, ya que el diseo de investigacin indica los pasos a seguir para alcanzar dichos objetivos. Es necesario por tanto que previo a la seleccin del diseo de investigacin se tengan claros los objetivos de la investigacin. Las maneras de cmo conseguir respuesta a las interrogantes o hiptesis planteadas dependen de la investigacin. Por esto,

existen diferentes tipos de diseos de investigacin, de los cuales debe elegirse uno o varios para llevar a cabo una investigacin particular (Hernndez, Fernndez y Baptista, 2000; Castillo, 2005). La precisin, la profundidad as como tambin el xito de los resultados de la investigacin dependen de la eleccin adecuada del diseo de investigacin. He aqu un esquema donde se resumen los diferentes tipos de investigacin segn Hernndez, Fernndez y Baptista (2000). 16

Diseos experimentales Son aquellos en los que se cumple que: Los grupos a ser investigados han sido asignados al azar, por procedimientos aleatorios y los grupos resultantes son equivalentes, de tal manera que se tiene un grupo control equivalente a los grupos experimentales. Diseos cuasi-experimentales. Entendemos por diseos cuasi-experimentales cuando se cumplen las siguientes condiciones: Los grupos sobre los que se lleva a cabo la investigacin no han podido establecerse como equivalentes en las caractersticas fundamentales. Los grupos no han sido asignados al azar, sino que han sido establecidos por algn otro procedimiento de muestreo. Como dice Hernndez et al.En los diseos cuasi-experimentales los sujetos no son asignados al azar a los grupos no emparejados; sino que dichos grupos ya estaban formados antes 17

del experimento, son grupos intacto (la razn por la que surgen y la manera como se formaron fueron independientes o aparte del experimento. Tambin algunos autores denominan CUASI-EXPERIMENTAL, cuando el investigador aplica un tratamiento a un solo grupo de sujetos, sin grupo de control, observndolo antes y despus de aplicar el tratamiento. Diseos no-experimentales. Se establece que un diseo no-experimental es: la que se realiza sin manipular deliberadamente variables. Es decir, se trata de investigacin donde no hacemos variar intencionadamente las variables independientes. Lo que hacemos en la investigacin no experimental es observar fenmenos tal y como se dan en su contexto natural, para despus analizarlos. (Hernndez, 184) La diferencia con los diseos experimentales y cuasi- experimentales se ve con claridad, porque en estos dos siempre hay algn tipo de intervencin del investigador, que manipula las variables independientes para averiguar su influencia en las variables dependientes.

Mtodo transversal: Es el diseo de investigacin que recolecta datos de un solo momento y en un tiempo nico. El propsito de este mtodo es describir variables y analizar su incidencia e interrelacin en un momento dado.

Diseos transversales descriptivos: son aquellos que tienen como objetivo indagar la incidencia y los valores en que se manifiesta una o ms variables.

Diseos transversales correlacionales: Se encargan de describir relaciones entre dos o ms variables en un momento determinado.

Diseos transversales

explicativos: Son aquellos en los cuales las

causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados) y el investigador los observa y explica.

18

Diseos longitudinales: Son aquellos que analizan cambios a travs del tiempo (en variables o sus relaciones), dentro de alguna poblacin en general.

1.10 VARIABLES A las caractersticas objeto de estudio en la poblacin se les llama variables, ya que pueden variar de un individuo a otro y se representara por letras maysculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que hay, lo cual nos va a permitir utilizar las herramientas estadsticas apropiadas.

TIPOS DE VARIABLES. Las variables estadsticas pueden ser de dos tipos: Variables cualitativas o atributos: describen cualidades y no toman valores numricos, estas a su vez pueden ser: Nominales.- Las cualidades no presentan ningn orden. Ejemplo Sexo del estudiante (Femenino, Masculino), Procedencia, I.E. Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de estudios (Analfabeto, primaria, secundaria, superior), Nivel de

conocimiento de Docentes.

Variables cuantitativas: toman valores numricos. A su vez pueden ser: Discretas.- Solo toman un nmero finito o infinito numerable de valores distintos (generalmente nmeros naturales o enteros). Ejemplos: nmero de estudiantes por secciones, nmero de profesores, nmero de aulas, etc. Continuas.Toman valores en un intervalo. Generalmente

corresponden a medir magnitudes continuas. Ejemplo, Rendimiento acadmico, altura, ingreso del docente, etc.

Una caracterstica esencial de este tipo de variables es que sus valores nunca son observables con exactitud, sino que dependen (las observaciones) de la precisin del instrumento de medida.

19

Ejemplo 7

Un especialista estudia, el nivel de introversin en nios menores de 4 aos en las instituciones educativas de la ciudad de Cusco. previos para este estudio. Solucin: Poblacin: Nios menores de 4 aos de las I.E de la ciudad de Cusco. Muestra: Nios de 3 aos de las I.E de la ciudad de Cusco. Variable: Nivel de Introversin. Tipo de variable: Cuantitativa Unidad de estudio: Nio menor de 4 aos. Defina los conceptos

1.11 ESCALAS DE MEDICION Se llama medicin Tenemos las al proceso de atribuir nmeros a las caractersticas.

siguientes escalas de medicin: nominales, ordinales,

cuantitativas de intervalo y cuantitativas de razn.

Escala nominal. La clave de estas escalas de medida es que slo informan de la igualdad o desigualdad de los individuos en una caracterstica, pero no de posibles ordenaciones, puesto que la caracterstica a la que se refieren no se tiene en mayor o menor medida, sino que simplemente adopta formas cualitativamente distintas. Los

nmeros solo sirven para distinguir valores o categoras diferentes de la variable. Esta escala se emplea para variables cualitativas nominales.

Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un proceso de codificacin pero no significa que la mujer sea mayor que el hombre, ni el doble, ni que existe sexo intermedio.

Escala Ordinal. Los nmeros adems de servir para distinguir reflejan un orden existente sobre los valores de la variable.

20

Se obtiene clasificando objetos o arreglndolos en un orden con respecto a alguna variable comn. La pregunta es simplemente, si el objeto tiene ms o menos de esta variable que algn otro objeto. Esta escala se emplea para variables cualitativas ordinales.

Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de los docentes. Excelente=5, bueno =4, regular =3 y malo = 2. es cierto la relacin de orden 2<3<4<5.

Escala de Intervalo: La ubicacin del punto origen no es fija, puesto que 0 no denota la ausencia del atributo. Aqu los nmeros para clasificar los objetos representan tambin incrementos iguales del atributo que se esta midiendo. Esto significa que los nmeros pueden ser comparados. La diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de la diferencia entre 2 y 4. Las temperaturas Fahrenheit y Centgrados son medidas que tiene diferentes escalas de intervalo y diferentes puntos de 0. Escala de Razn: Medida numricas en las cuales cero es un valor fijo en cualquier escala y la diferencia entre valores es diferente Adems de la distancia de orden e intervalo, se aade un origen absoluto de forma que no solo cabe hallar distancias (ya en la escala de intervalo), si no tambin mltiplos exactos. En este caso, el valor representado por 4 tiene doble cantidad medida que l representado por un 2. Ejemplo 10: Edad del profesor expresada en aos. 40 aos y 20 aos son edades distintas y 40 aos es superior a 20 aos Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30. El 0 tiene sentido. Una persona con 0 aos, realmente no tiene edad todava no ha nacido. En el siguiente cuadro se muestra un resumen de las caractersticas de las escalas de medicin.

21

Resumen de escalas de medicin


Tipo Informacin deducible Relaciones Nominal igual que o distinto que Transform. admisibles Significa Significa orden No Aplicaciones inyectivas Significa distancia Origen No No Ejemplos Procedencia del Profesor, tipo de metodologia Si Relaciones Ordinal mayor que o igual que No No Grado de planificacin, Funciones crecientes Nivel de utilizacin de materiales educativos. Igualdad o Intervalo desigualdad de diferencias Igualdad o Razn desigualdad de razones Si B .x (b 0) Si Si Rendimiento acadmico, Nmero de estudiantes. A + b.x (b 0) Si Si No Temperatura, inteligencia

ESCALAS PARA LA MEDICION DE ACTITUDES La escala de clasificacin por categoras es la que usan ampliamente los investigadores de ciencias de la salud y sociales. Escala de clasificacin por categoras: Existen cuatro categoras a partir de las cuales los entrevistados pueden elegir para sealar su nivel general de satisfaccin. - Muy satisfecho (+2) - Satisfecho (+1 ) - Algo satisfecho (0) - No del todo satisfecho (-1) Escala De Comparacin: Es una versin de la escala de categoras, califica a estas categoras como: excelente, muy bueno, bueno, regular 22 y deficiente,

eliminando de esta forma la comparacin implcita. El problema con tal escala es que el punto de referencia es poco claro y diferentes entrevistados pueden usar diferentes puntos de referencia o estndares. Escala de Likert: La escala de Likert requiere que un entrevistado indique un grado de acuerdo o desacuerdo con respecto a una variedad de afirmaciones (reactivos) relacionadas con el objeto de las actitudes. Es un tipo de instrumento de medicin o de recoleccin de datos que disponemos en la investigacin social. Es una escala para medir las actitudes. Consiste en un conjunto de tems bajo la forma de afirmaciones o juicios ante los cuales se solicita la reaccin (favorable o desfavorable, positiva o negativa) de los individuos. Alternativas o puntos en la escala de Likert Asignacin Asignacin Numrica I 2 Numrica II 5 Muy de acuerdo Totalmente de acuerdo Definitivamen Completame te s nte verdadero 1 4 De acuerdo De acuerdo Probablemen te s 0 3 Ni de acuerdo, ni en desacuerdo -1 2 En desacuerdo -2 1 Muy en desacuerdo En desacuerdo Totalmente en desacuerdo Probablemen te no Definitivamen Completame te no nte falso Falso Neutral o indiferente Indeciso Ni falso, ni verdadero Verdadero Alternativa A Alternativa B Alternativa C Alternativa D

23

Para obtener las puntuaciones de la escala de Likert, se suman los valores obtenidos respecto de cada items. El puntaje mnimo resulta de la multiplicacin del nmero de tems por 1. Una puntuacin alta est dada por el nmero de tems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I-----------------PA Donde: PM: Puntaje mnimo y PA: Puntaje Mximo.

Ejemplo 11: Ha encontrado en la institucin educativa el apoyo y las facilidades necesarias para que usted desarrolle de modo ptimo su trabajo. ( ) Definitivamente s ( ) Probablemente s ( ) Indeciso ( ) Probablemente no ( ) Definitivamente no

Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso humano. Categoras de Respuesta Frecuencia Porcentaje Asignacin de puntajes Totalmente de acuerdo De acuerdo Indeciso En desacuerdo (5) (4) (3) (2) 2 4 7 9 23 n=45 4.4% 9% 15.6% 20% 51% 100% 2(5) 4(4) 7(3) 9(2) 23(1) Total=88

Totalmente en desacuerdo (1)

Para interpretar el puntaje se ubica en los tramos de la escala de likert.

24

Totalmente En (1) 45*1=45

En

Indeciso (3)

De acuerdo (4)

Totalmente de Acuerdo (5)

desacuerdo desacuerdo (2) 45*2=90

45*3=135 45*4=180

45*5=225

La puntuacin 88 se aproxima a 90, por lo tanto se ubica en la parte que indica en desacuerdo.

1.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION CIENTIFICA. Toda caracterstica de estudio se conoce como variable. Variable independiente Es aquella que juega un rol determinante, causal o de influencia en otra u otras variables, supone cierta autonoma con relacin a las dems variables, pero es necesario, sealar que las variables independientes en determinados problemas, pueden cambiar, segn sea la posicin que ocupen en el enunciado, debido a que la realidad est en movimiento y que todos los hechos estn concatenados. Este tipo de variable se encuentra en las siguientes investigaciones: 1. Explicativa, 2. Relacional 3. Experimental ( en la experimental se le conoce como estmulo) 4. Correlacional

Variable dependiente Es aquella que juega un rol de consecuencia, al ser determinada, originada o influida por la variable independiente. Esto significa que no pueden existir variables dependientes sin las independientes. Considerando el tiempo, las independientes son ms antiguas que las dependientes. Se encuentran en las siguientes investigaciones: 1. Explicativa 25

2. Relacional 3. Correlacinal 4. Experimental (La variable dependiente en una investigacin experimental se le conoce como respuesta) Ejemplo 13: En el problema influencia del uso de mapas mentales en el rendimiento acadmico de los estudiantes de las I.E de la regin de Cusco, 2011. Variable independiente: Rendimiento Acadmico Variable dependiente: Uso de mapas mentales

Variable Intermedia Es aquella que juega un rol de factor condicionante, pues su presencia entre la variable independiente y variable dependiente hace que sin tener el carcter de factor causal o determinante, modifique le resultado ms complejas y de mayor profundidad.

Ejemplo 14: En el estudio de formacin acadmica y rol de la experiencia en el desempeo profesional, Quillabamba. 2011. Variable independiente: formacin acadmica. Variable Dependiente: Desempeo profesional Variable Intermedia : Experiencia

Variable interviniente Es aquella que en ciertas medida juega un rol pasivo en el problema, pues permite medir las caractersticas, atributos, estructuras, incidencia, elementos o aspectos que se son inherentes. La variable interviniente, la encontramos en investigaciones: 1. Descriptiva 2. Comparativa.

26

Ejemplo 15: En el problema: Niveles de desnutricin de los estudiantes de las instituciones educativas de la ciudad de Sicuani, 2011. Variable interviniente : Nivel de desnutricin. Variables Asociadas Son aquellas que no guardan mayor nivel de dependencia, no hay relacin causal entre ellas y considerando el criterio tiempo vienen a ser ms o menos contemporneas, pues para que aparezca el problema surgen de manera simultnea. Este tipo de variables, se encuentra en la investigacin descriptiva multivariable, se trata de dos o ms variables intervinientes, por lo que nunca van acompaadas de algn otro tipo de variables.

Ejemplo 16: En el problema: Rasgos sociales y culturales de los profesores de la ciudad de Cusco , 2011. Las variables asociadas son rasgos sociales y rasgos

culturales

Variables Interdependientes Son aquellas que indistintamente pueden ser consideradas como causa o como consecuencia una de otra. Corresponden a la investigacin correlacional.

Ejemplo 17: En el problema: Correlacin entre tipo de alimentacin y obesidad de los estudiantes de la ciudad de Cusco, 2010. Las variables interdependientes, son tipo de alimentacin y obesidad

27

Resumen del tipo de variables segn tipo de investigacin.

Descriptiva Interviniente Asociada

Comparativa Interviniente

Explicativa Independiente(s) Dependiente(s)

Relacional Independiente Dependiente

Correlacional Interdependiente Interdependiente

Experimental Estimulo (Factor) Respuesta

Observaciones: 1. Las variables segn su naturaleza se clasifican en cuantitativas y cualitativas. 2. Las variables segn su relacin casual se clasifican en:

independiente, dependiente, interviniente. En el rea de las ciencias de la salud, se tiene los siguientes tipos de investigacin biomdica.

1.13

RECOPILACIN DE DATOS.

Dentro de un proceso de investigacin una de las actividades que se realizan es la recopilacin de datos, la cual es el acopio de informacin y se incluye desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios con el empleo de tcnicas de muestreo. Para Hernndez et.al. (2006) un instrumento de medicin es un recurso que utiliza el investigador para registrar informacin o datos sobre las variables que tiene en mente. La construccin de instrumento consiste en generar un nmero suficiente de tems para medir todas las variables con todas sus dimensiones.

La recopilacin de datos, se puede realizar mediante: Investigacin documental Investigacin de campo

28

La investigacin documental. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos fsicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en: 1.- Documental bibliogrfica 2.- Documental hemerogrfica 3.- Documental escrita 4.- Documental audiogrfica 5.- Documental videogrfica 6.- Documental iconogrfica

La investigacin de campo. Consiste en obtener informacin directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar as como las personas relacionadas y se puede realizar: a) Por observacin directa b) Por interrogacin

La observacin. Es el procedimiento emprico bsico, el cual consiste en realizar la percepcin intencionada de una actividad determinada

mediante la experimentacin la cual consiste en la obtencin de datos cuantitativos por medio de la medicin del fenmeno que se este observando. Para realizar la observacin se utilizan diversos

instrumentos auxiliares los cuales son: 1.- La ficha de campo 3.- La entrevista

2.- Estudio de Actividades 4.- La encuesta

La Entrevista. Es una de las tcnicas ms comunes y es considerada como la relacin directa entre el investigador y el objeto de estudio a travs de individuos o grupos con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales

La Encuesta. Consiste en recopilar informacin sobre una parte de la poblacin. 29

La informacin recopilada puede emplearse para un anlisis cuantitativo con el fin de identificar las magnitudes del problema.

El Cuestionario. Es un eficaz auxiliar en la observacin cientfica que contiene aspectos del fenmeno esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador. - Cuestionarios por correo - Cuestionario administrado por el entrevistado - Cuestionario administrado por el entrevistador

La Cedula. Tiene carcter de annimo, donde el encuestador es quien llena la cedula de entrevista, adems de que es posible aclara la informacin sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.

1.14 VALIDACIN DEL INSTRUMENTO

La validacin de los instrumentos se realiza con el fin de conseguir una mayor objetividad al seleccionar los tems en los respectivos cuestionarios.

VALIDEZ DE CONTENIDO El proceso de validacin de contenido es eminentemente lgico, si bien pueden utilizarse jueces expertos en el tema para valorar la congruencia entre los diversos items y los diversos objetivos. Existen procedimientos cuantitativos diversos para que cada experto valore el grado en que un tem sirve para evaluar el objetivo al que corresponde. El procedimiento cuantitativo ms sencillo sera el siguiente: Especificar los diversos objetivos (v.gr. reas diferentes de contenidos) que se Pretenden evaluar. Elaborar varios tems para cada objetivo. Seleccionar una muestra de expertos en el contenido del test. Pedirles que, segn su opinin, asignen cada tem al objetivo que pretende medir.

30

Seleccionar los tems en los que los expertos manifiestan mayor acuerdo en sus clasificaciones. CRITERIO DE EXPERTOS Mtodo 1:HOJA DE PREGUNTAS PARA LA VALIDACIN PREGUNTAS
1. Considera usted que los tems del instrumento miden lo que se pretende medir? 2. Considera usted que la cantidad de tems registrados en esta versin son suficientes para tener una comprensin de la materia de estudio? 3, Considera usted que los tems contenidos
1 2 3 4 5 1 2 3 4 5

ESCALA DE VALORACION
1 2 3 4 5

en este instrumento, son una muestra representativa del universo materia del estudio? 4. Considera usted que si aplicamos en reiteradas oportunidades este instrumento a muestras similares, obtendramos tambin datos similares? 5. Considera usted que los conceptos utilizados en este instrumento, son todos y cada uno de ellos, propios de las variables del estudio? 6. Considera usted que todos y cada uno de los tems contenidos en este instrumento tienen los mismos objetivos? 7. Considera usted que el lenguaje utilizado en el presente instrumento es claro, sencillo y no da lugar a diversas interpretaciones? 8. Considera usted que la estructura del presente instrumento es adecuada al tipo de usuario a quien se dirige el instrumento? 9. Estima usted que las escalas de medicin utilizadas son pertinentes a los objetos materia de
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

estudio? 10. Que aspectos habra que modificar, que aspectos tendran que incrementarse o que aspectos habra que suprimirse?

31

PROCEDIMIENTO El mtodo DPP mide la adecuacin de los instrumentos, para medir la variable de inters, en funcin a la valoracin de los expertos. Ejemplo 18. En el presente estudio la valoracin de los expertos es:

EXPERTOS Item 1 2 3 4 5 6 7 8 9 1 5 5 5 5 5 5 4 4 4 2 4 5 4 5 5 5 5 4 4 3 5 5 5 4 5 5 3 5 5 4 5 5 4 4 5 5 4 4 5 Promedio 4.75 5 4.5 4.5 5 5 4 4.25 4.5

2. Con los promedios hallados, se determina la distancia de punto mltiple (DPP), mediante la siguiente ecuacin:
DPP = (X 1 Y1 )2 +(X 2 Y2 )2 + ................(X 9 Y9 )2

Donde: Xi = Valor mximo en la escala para el tem i. Yi = El promedio del tem i.


DPP = ( 5 4.75 )2 +( 5 5 )2 + ................( 5 4.5 )2 1.541

Determinar la distancia mxima (Dmax) del valor obtenido respecto al punto de referencia Cero (0), con la ecuacin:
2 2 D )x .... ) (1... n 2 ) ... x ...(1 ... ... M x a (1 x 1 2

Donde: Xi = Valor mximo en la escala concedido para el tem i. 1 = Valor mnimo de la escala para cada tem.

32

DMax

(5 1) 2

(5 1) 2

...................(5 1) 2

12

La Dmax hallada fue de 12 La Dmax se divide entre el valor mximo de la escala, lo que nos da un valor de 12/5=2.4 5. Con el valor hallado anteriormente (apartado 4) se construye una nueva escala valorativa a partir de cero, hasta llegar a Dmax. Dividindose en intervalos Iguales entre si, llamndose con las letras A, B, C, D, y E. Siendo: Escala Valoracin Valoracin de Expertos 0-2.4 2.4-4.8 4.8-7.2 7.2-9.6 9.6-12 A = Adecuacin Total B = Adecuacin en gran medida C = Adecuacin Promedio D = Escasa Adecuacin E = inadecuacin DPP=1.541

6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta requiere reestructuracin y/o modificacin, luego de las cuales se somete nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541

cayendo en la zona A, lo que indica la Adecuacin del instrumento y que puede ser aplicado.

33

Mtodo 2 Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de validacin.

TEM Claridad En la

Criterios a evaluar Coherencia interna Induccin a la Lenguaje Adecuado Con el nivel (sesgo) Del informante Si No Si No Si No Si No Si No Mide lo que pretend e medir redacci n respuesta

observaciones ( si debe o

eliminarse

modificarse un favor indique)

1 .. n Aspectos generales El instrumento contiene instrucciones claras y precisas para responder el cuestionario Los tems permiten el logro del objetivo de la investigacin Los tems estn distribuidos en forma lgica y secuencial El nmero de tems es suficiente para recoger la informacin. En caso de ser negativa su respuesta, sugiera los tems a aadir Validez Aplicable ( ) Validado por: Firma: No aplicable ( ) Si No *************

34

1.5.10 CONFIABILIDAD del INSTRUMENTO Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario sobre un pequeo grupo de poblacin. Esta prueba piloto ha de garantizar las mismas condiciones de realizacin que el trabajo de campo real. Se recomienda un pequeo grupo de sujetos que no pertenezcan a la muestra seleccionada pero s a la poblacin o un grupo con caractersticas similares a la de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta manera se estimar la confiabilidad del cuestionario. La confiabilidad responde a la pregunta con cunta exactitud los tems, reactivos o tareas representan al universo de donde fueron seleccionados?. El trmino confiabilidad designa la exactitud con que un conjunto de puntajes de pruebas miden lo que tendran que medir (Ebel, 1977, citado por Fuentes, op. cit., p. 103).

Entre los mtodos para estimar la confiabilidad, se tienen:

Mtodo Test-Retest: una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos veces al mismo grupo y correlacionar las puntuaciones obtenidas. El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque denota la coherencia de las puntuaciones en el tiempo Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95 (Popham, 1980, citado por Fuentes, op. cit.). Se usa la correlacin por el mtodo de los puntajes directos (Correlacin r de Pearson):

rxy n
Donde:

n xi2

xi yi
2

xi

yi yi2 yi
2

xi * n

rxy : es el coeficiente de correlacin


n: nmero de sujetos X: valores de X (1 aplicacin) 35

Y: valores de Y (2 aplicacin) Mtodo comn de divisin por mitades o Hemitest: este mtodo computa el coeficiente de correlacin entre los puntajes de las dos mitades del test o cuestionario aplicado. Esto supone que las dos test mitades son paralelos, tienen igual longitud y varianza entre s. Se estima a travs del coeficiente de confiabilidad de Spearman-Brown: Se establece la correlacin entre los dos puntajes de las dos mitades del test a travs del mtodo de los puntajes directos, Correlacin r de Pearson:

r12 n
2r12 1 r12

n x12

x1 x2
2

x1

x2
2 x2

x1 * n

x2

Estimacin del test completo (Spearman-Brown) con la frmula:

rtt

Se interpreta la prueba de hemitest como coeficiente de consistencia interna, ya que una sola prueba contiene las dos formas equivalentes y su nfasis lo pone en las puntuaciones de los sujetos, no en los temes.

El mtodo de divisin por mitades de Rulon: utiliza la divisin del test en mitades, pero su mtodo no supone necesariamente varianzas iguales en los sub-tests. coeficiente de consistencia interna.

rtt
Donde:

2 sd 1 2 st

rtt : coeficiente de confiabilidad


2 sd : varianza de la diferencia entre las puntuaciones de las mitades

st2 : varianza de las puntuaciones del test total

El mtodo de divisin por mitades de Guttman: tambin se denomina coeficiente de consistencia interna. Su frmula es:

36

rtt
Donde:

2 sa sb2 2 1 st2

rtt : coeficiente de confiabilidad


2 sa : varianza de las puntuaciones de los temes pares
2 sb : varianza de las puntuaciones de los temes impares

st2 :varianza de las puntuaciones del test total

ALFA DE CRONBACH

Para evaluar la confiabilidad o la homogeneidad de las preguntas o tems es comn emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas policotmicas, como las escalas tipo Likert; la cual puede tomar valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa confiabilidad total. El coeficiente de Cronbach puede ser calculado por medio de la varianza de los tems y la varianza del puntaje total (Hernndez Sampieri et al, 2003). Para calcular el coeficiente de confiabilidad se us el COEFICIENTE ALFA DE CROMBACH ( ) Crdova (2009), cuya ecuacin es:

donde: : coeficiente de confiabilidad de la prueba o cuestionario nmero de tems del instrumento : Varianza total del instrumento. : Sumatoria de las varianzas de los tems.

Mtodo de Kuder-Richarson 21: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicacin del test. La suposicin bsica es considerar que todos los temes presentan igual varianza. Coeficiente de consistencia interna. 37

KR21
Donde:

n n 1

M n M nst2

n: nmero total de tems M: media aritmtica de las puntuaciones obtenidas por los individuos

st2 : varianza de las puntuaciones totales


Para la interpretacin de la confiabilidad se utiliza el siguiente cuadro:

TABLA DE CATEGORAS ESCALA r>0.89 CONFIABILIDAD Muy alta Alta Aceptable Moderada Baja Muy baja Despreciable

38

Ejemplo 19. Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente informacin

Encuestados 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 3 2 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 5 3 3 0 1 0 0 1 0 0 0 0 0 1 0 0 0 4 1 1 2 1 1 1 2 0 1 2 1 1 1 2 0 17

Preguntas (tems) 5 1 2 1 1 1 1 1 0 1 2 1 2 2 2 0 18 6 1 1 1 0 1 1 2 1 0 2 1 2 2 0 0 15 7 0 1 0 0 2 0 2 0 0 0 0 0 0 0 0 5 8 0 1 0 1 1 1 1 0 0 2 1 2 0 1 1 12 9 0 2 0 0 0 0 0 0 0 2 2 0 0 0 0 6 10 0 2 0 0 0 0 2 0 0 2 2 1 0 0 0 9

Puntos

3 12 5 3 7 4 10 1 3 13 9 9 5 6 3 93

0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83

varianza del instrumento

39

Varianza de cada pregunta

El ndice de confiabilidad es alto de conformidad con la tabla de categoras.

BAREMACIN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.

Para medir la variable de estudio se aplico una encuesta utilizando la escala de likert, la misma que presenta en cada tems cinco alternativas, a partir de las cuales los entrevistados pueden elegir, con la finalidad de sealar su nivel de acuerdo.
Alternativa Asignacin numrica a b c d e 5 4 3 2 1

Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems (x) por 1. Una puntuacin alta (PA) est dada por el nmero de tems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------PA
El promedio del puntaje del instrumento se obtiene mediante:

40

Pr omedio

Puntaje n

Para facilitar la interpretar las puntuaciones de la variable de estudio se transforman a una escala cualitativa, segn el siguiente criterio.

Puntaje Obtenido

Categora Deficiente

Pr omedio 1.49 1.5 Pr omedio 1.5 Pr omedio 1.5 Pr omedio Pr omedio 4.5 2.5 2.5 2.5

Malo Regular Bueno Muy bueno

BAREMACIN DEL INSTRUMENTO, UTILIZANDO ESCALA DE INTENSIDAD. Para medir las variables de estudio se aplica encuestas, las mismas que presentan en cada tem cuatro alternativas, a partir de las cuales los entrevistados pueden elegir, con la finalidad de sealar su nivel de acuerdo.

El tipo de escala que se utiliza es ordinal (Escala de intensidad), asignacin un valor a cada alternativa como se muestra en el siguiente cuadro: Alternativa Asignacin numrica a b c d 4 3 2 1

Con la finalidad de realizar un anlisis estadstico de las variables con sus respectivas dimensiones previamente se realizo la baremacin del instrumento (Medicin de la variable)

41

Para medir la variable de estudio (Puntuacin), se suman los valores obtenidos respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems (x) por 1. El puntaje mximo (PA) est dada por el nmero de tems multiplicado por 4.

PM--------------------I----------------------I----------------------I------------------PA En el cuadro siguiente se muestra el resumen de la puntuacin:

Caractersticas

Puntuacin original

Nro. de preguntas (tems) Mnimo Mximo Puntaje Obtenido

m
m

Puntuacin transformada A escala vigesimal m 1 20 x

4m T

La puntuacin original se transformacin a una escala vigesimal utilizando la siguiente relacin

T 1 4m-1
x 19 T 1 4m 1 1
Puntaje Obtenido 0-8 9-10 11-13 14-17 18-20

x 1 19

Despejando el valor de x, se obtiene la puntuacin del individuo en escala vigesimal.

Finalmente la escala vigesimal es transformada a una escala cualitativa:

Categora

Deficiente Malo Regular Bueno Muy bueno

42

5.11 MATRIZ DE CONSISTENCIA. Esta referido a la estructura del proyecto de Investigacin y que para fines didcticos se presenta en el siguiente esquema: TITULO: PROBLEMA General .? Formulacin de problemas especficos. 1. .? 2. Objetivo especfico .. . Formulacin de hiptesis operativas. Variable Dependiente OBJETIVO General HIPOTESIS General VARIABLES Variable independiente

TIPO DE ESTUDIO Nivel de investigacin. Tipo de investigacin. Diseo de investigacin VARIABLES . DIMENSIONES ..

POBLACIN Y MUESTRA Poblacin. Muestra INDICADORES ..

RECOLECCIN DE DATOS

PRUEBAS ESTADISTICAS .

Gua de observacin Cuestionario encuestas Entrevistas

Ubicacin de tems

43

MODELO DE TESIS TTULO DE LA TESIS:

CAPITULO I: PROBLEMA DE INVESTIGACIN

PLANTEAMIENTO DEL PROBLEMA FORMULACIN DEL PROBLEMA DE INVESTIGACIN OBJETIVOS JUSTIFICACIN ORIGINALIDAD: PERTINENCIA: RELEVANCIA: OPORTUNIDAD: FACTIBILIDAD: IMPORTANCIA LIMITACIN REA DE ESTUDIO DELIMITACIN DELIMITACIN ESPACIAL DELIMITACIN TEMPORAL

CAPITULO II: MARCO TERICO

ANTECEDENTES DE ESTUDIO MARCO CONCEPTUAL MARCO NORMATIVO MARCO TERICO CONCEPTUALIZACIN EN TRMINOS HIPTESIS DE INVESTIGACION.

CAPITULO III: DISEO METODOLGICO

44

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

NIVEL DE INVESTIGACIN TIPO DE NVESTIGACION. DISEO DE INVESTIGACIN POBLACIN Y MUESTRA VARIABLES OPERACIONALIZACIN DE VARIABLES TCNICAS E INSTRUMENTOS DE RECOLECCIN DE DATOS TCNICAS DE ANLISIS DE DATOS.

CAPITULO IV: PRESENTACION DE RESULTADOS

CONCLUSIONES RECOMENDACIONES BIBLIOGRAFIA ANEXOS

45

EJERCICIOS PROPUESTOS.

1.

Influencia del uso de materiales didcticos en el rendimiento acadmico de los estudiantes de la ciudad de Cusco. Especifique. a. La(s) variable(s) de estudio y el tipo de variable. b. La escala de medicin a emplear. c. Nivel de investigacin. d. Tipo de investigacin e. Diseo de investigacin

2.

Se realizo el estudio de la calidad de vida y servicio educativo de los profesores de las I.E de la UGEL Cusco. Especifique a. Proponer un titulo para esta investigacin. b. La(s) variable(s) de estudio y el tipo de variable. c. La escala de medicin a emplear. d. Nivel, tipo y diseo de investigacin.

3.

Se hizo una encuesta a una muestra representativa de profesores de la UGEL La Convencin sobre el nivel de acuerdo con la carrera pblica magisterial propuesta por el gobierno. Carrera publica magisterial. Totalmente de acuerdo De acuerdo Indeciso En desacuerdo Totalmente en desacuerdo Frecuencia 15 40 25 10 6

En base a la informacin, realice el anlisis correspondiente. 4. Clasificar cada una de las siguientes variables : a. b. c. Rendimiento Acadmico (Bajo, Medio, Alto). Sexo. Edad. 46

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

d. e. f. g. h. i. j. k.

Nivel educativo (primario secundario, superior). Aos de estudios completados. Tipo de enseanza (privada o pblica). Estrato social (bajo, medio o alto). Numero Telefnico Numero de DNI de un profesor. Mtodo de enseanza. Nivel de congruencia entre la sumilla y el silabo.

5.

En los siguientes temas de investigacin Causas de la desercin escolar en la Regin Cusco, 2011. Influencia del Uso de TIC en el rendimiento acadmico de los

estudiantes de la carrera Profesional de Educacin, Universidad A, 2011. Calidad de vida y desempeo pedaggico de los profesores de la UGEL Cusco, 2011. Elabore la matriz de consistencia para cada uno de los casos. 6. Se aplico un test para medir la competitividad del magisterio a una muestra piloto de 5 profesores, obteniendo los siguientes resultados. Profesor 1 1 2 3 4 5 1 0 1 1 0 2 0 0 0 0 0 3 1 1 0 1 1 tems 4 0 1 1 1 0 5 0 0 1 0 1 6 0 1 1 0 1

Determine la confiabilidad y validez del instrumento.

47

CAPITULO II ORGANIZACIN Y PRESENTACIN


La presentacin de datos a travs de tablas estadsticas es una actividad importante dentro de los sistemas de informacin, estas se fortalecen significativamente cuando se la acompaan con grficos descriptivos ilustrativos. En el contexto de los sistemas de informacin, en ms de una oportunidad se encontrara que un buen grafico resume y expresa mucho ms que prrafos completos de comentarios e interpretaciones literales. Resumir los datos es un procedimiento til para conseguirlo y puede hacerse mediante tablas, grficos o valores numricos. A lo largo de este tema veremos las principales tcnicas numricas y grficas que nos permiten describir una caracterstica de inters observada en una poblacin, poniendo en relieve sus rasgos ms importantes. 2.1 TABLA DE FRECUENCIAS. Un primer resumen de la informacin contenida en un conjunto de datos observado se obtiene al organizarlos en lo que se llama una tabla de frecuencias. En sta se recogen los distintos valores (nmeros o categoras) que toma la variable junto con sus correspondientes frecuencias de aparicin.

48

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

2.1.1 TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Si en una muestra de n elementos, se observa k categoras diferentes C1, C2,, Ck de una variable cualitativa X. Para resumir la informacin, previamente definimos algunos conceptos:

La frecuencia absoluta de un valor Ci es el nmero de veces que dicho valor aparece en la muestra. Se representa por fi y cumple
k

fi
i 1

f1

f 2 ......

fk

La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi) entre el tamao de la muestra (n), se representa por hi
hi fi , se cumple n
k

hi 1
i 1

La frecuencia absoluta acumulada del valor i-simo es la suma de las frecuencias absolutas hasta dicho valor, se denota por Fi

Fi

f1

f 2 ...... fi

La frecuencia relativa acumulada del valor i-simo es la suma de las frecuencias relativas hasta dicho valor, se denota por Fi

Hi

h1 h2 ...... hi ,

Hi

Fi n

Una tabla de frecuencias tiene la siguiente estructura:

49

Categora de la variable X C1 C2 . Ck Total

Frecuencias absolutas fi f1 f2 fk n

Frecuencias relativas hi h1 h2 hk 1.00

Frecuencias Porcentuales pi p1 pi pk 100.00

frecuencias absolutas acumuladas Fi F1 F2 Fk=n

frecuencias relativas acumuladas Hi H1 H2 Hk=1

GRAFICAS. Las representaciones grficas prcticamente estn orientadas de acuerdo con las necesidades del investigador o estadstico, de todas formas se tienen algunas normas de trabajo y representacin, que tienen por objeto facilitar la lectura de los datos e informacin que se maneja estadsticamente. La calidad de un grfico estadstico consiste en comunicar ideas complejas con precisin, claridad y eficiencia, de tal manera que: Induzca a pensar en el contenido ms que en la apariencia No distorsione la informacin proporcionada por los datos Presente mucha informacin (nmeros) en poco espacio Favorezca la comparacin de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal)

La finalidad de los grficos estadsticos es: Organizar los datos. Observar patrones. Observar agrupamientos. Observar relaciones. Comparar distribuciones. Visualizar rpidamente la distribucin de los datos.

50

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Visualizar, obtener y comparar medidas estadsticas.

El cuadro anterior se puede representar utilizando los siguientes grficos. Diagrama de barras o rectangulos Es la representacin grfica usual para variables cuantitativas sin agrupar o para variables cualitativas. Para el caso de variables cualitativas se construye dibujando sobre la categora correspondiente un rectngulo con altura igual a la frecuencia (absoluta o relativa). Tambin es vlido para variables cuantitativas discretas, considerando en el eje de abscisas los valores de la variable en orden creciente en lugar de las categoras, sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). Diagrama de Pareto. Se ordenan las categoras de mayor a menor importancia y se dibujan los rectngulos correspondientes. Diagrama de sectores. Es el ms usual en variables cualitativas. Se representan mediante

crculos.

A cada valor de la variable se le asocia el sector circular

proporcional a su frecuencia. Para hallar el ngulo usamos la siguiente proporcin: al tener una circunferencia 360, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia absoluta (o relativa) que queramos representar ser igual al cociente entre los 360 de la circunferencia y el ngulo a determinar, as :
n fi 360 1 hi 360

Donde

es el ngulo a determinar.

Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. La escala de los dibujos debe ser tal que el rea

51

de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa.

2.1.2 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS Una vez obtenida una muestra de cualquier poblacin y observados los valores que toma la variable en los individuos de la muestra, estos valores se suelen ordenar. Si la variable es cuantitativa la ordenacin ser de menor a mayor. Dada una variable X, consideramos una muestra de tamao n que toma k valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk). La organizacin es en forma similar al caso cualitativo.

Categora Frecuencias Frecuencias Frecuencias de la absolutas fi relativas hi

frecuencias

frecuencias relativas

Porcentuales absolutas pi

variable X x1 x2 . xk Total f1 f2 fk n h1 h2 hk 1.00

acumuladas acumuladas Fi Hi H1 H2 Hk=1

p1 pi pk 100.00

F1 F2 Fk=n

La grafica para representar esta informacin es Bastones. 52

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Observaciones Los datos iniciales se pueden representar utilizando los grficos. Diagrama de cajas(box-plot) Presentacin visual que describe al mismo tiempo varias caractersticas importantes de un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los valores mnimos y mximos) alineados sobre una caja vertical u horizontalmente. El procedimiento Para el diagrama de cajas y bigotes es: 1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen en la muestra paralelo a uno de los ejes . 2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en ella la mediana. 3. Se hallan los lmites interiores (Q1 1.5 IQR y Q3 + 1.5 IQR) y los lmites exteriores (Q1 3 IQR y Q3 + 3 IQR). Donde Qi : Cuarteles que seran desarrollados ms adelante. 4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de la muestra. 5. Por ltimo se indican los valores atpicos Tallos y Hojas (stem & leaf) Procedimiento semigrfico para el que se preparan los datos resumindolos en dos o tres cifras (expresndolos en las unidades adecuadas). A continuacin se disponen en una tabla de dos columnas del siguiente modo: 1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra de las decenas, a la derecha separada por una lnea aparecen las hojas y se escriben ordenadas y todas seguidas. 2. Si hay tres dgitos el tallo est formado por los dos primeros. Las hojas son las unidades. 53

2.1.3 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS. A veces se hace necesario trabajar con datos agrupados. Definimos entonces como clase a cada uno de los intervalos en que se agrupan los datos. Las frecuencias harn ahora referencia al nmero de datos que hay en cada intervalo. Para construir distribucin de frecuencias por intervalos, se tiene los siguientes pasos:

Elegir un numero de intervalos de clase (K) Puede utilizar la regla de Sturges, k 1 3.3log(n) Donde k: Numero de intervalos. n: Numero de datos.

Determinar el rango , R

xmax

xmin
R/k

Determinar la amplitud de las clases A Determinacin de los intervalos:

I1

xmin , xmin

LI1, LS1

I2

xmin

A, xmin 2 A

LI2 , LS2

..

Ik

xmin (k 1) A, xmin kA

LI k , LSk
LI i 2 LSi

Determinacin de las marcas de clase, mi Donde LI : Limite inferior


LS : Limite superior.

Realizar la clasificacin y el conteo de datos en cada clase construida.

54

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Intervalos Ii

Marcas de clase mi

Frecuencia s absolutas fi f1 f2 fk n

Frecuencia s relativas hi h1 h2 hk 1.00

Frecuencias relativas hi h1 h2 hk 1.00

Frecuencias Porcentuales pi p1 pi pk 100.00

frecuencias absolutas acumuladas Fi

frecuencias relativas acumuladas Hi H1 H2 Hk=1

I1 I2 . Ik Total

m1 m2 mk

F1 F2 Fk=n

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polgonos de frecuencias. Este cuadro se representa mediante los siguientes grficos: Histograma de frecuencias Un histograma es la representacin ms frecuente con datos agrupados, se construye a partir de la tabla estadstica, representando sobre cada intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el rea de los mismos. Polgono de frecuencias El polgono se construye fcilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que corresponden a sus marcas de clase. Curva de frecuencias. Resulta de suavizar el polgono de frecuencias, en sus puntos angulosos. Ojivas

55

EJERCICIOS RESUELTOS 1) En un estudio realizado sobre el impacto que presenta aplicar una estrategia comercial en las ventas , se obtuvo siguiente informacin en el incremento

mensual de utilidades en miles de soles de 90 sucursales de la empresa. 12.2 16.4 17.8 18.4 13.1 16.8 17.8 18.4 14.3 16.9 17.8 18.4 15.5 17.1 17.8 18.4 15.5 17.2 18 18.5 19 19.1 19.1 19.2 19.2 19.3 19.3 19.4 19.4 19.5 19.5 19.5 19.7 19.7 19.7 19.7 19.7 19.8 19.9 19.9 20 20 20.2 20.3 20.3 20.5 20.6 20.6 20.8 20.8 20.9 20.9 21 21.1 21.4 21.6 21.7 22 22.4 22.7 23 23 23.2 23.3 23.5 23.5 24.1 24.2 24.8 26.2

15.6 17.3 18.1 18.5 15.9 17.4 18.2 18.5 16.1 17.6 18.3 18.5 16.2 17.8 18.3 18.8 16.2 17.8 18.3 19

a) Construya la tabla de distribucin de frecuencias b) Represente la informacin obtenida, mediante un grafico. Solucin. a) Para construir una tabla de frecuencia se tiene los siguientes pasos. Elegir el nmero de clases. Usando la relacin de sturges se tiene:
k 1 3.3log(n) 1 3.3log(90) 7.44 7

Determinar la amplitud de los intervalos

xmax

xmin

26.2 12.2 14

Determinar el tamao del intervalo de clases (c),


A R k 14 7 2

Establecimiento de los lmites y construccin de la tabla: 56

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

LI - LS [12.2 14.2) [14.2 16.2) [16.2 18.2) [18.2 20.2) [20.2 22.2) [22. 2 24.2) [24.2 26.2) TOTAL

mi 13.2 15.2 17.2 19.2 21.2 23.2 25.2

fi 2 6 18 36 16 9 3 n=90

Fi 2 8 26 62 78 87 90

hi= fi/n 0.02 0.07 0.2 0.4 0.18 0.1 0.03 1

pi 2.22 6.67 20 40 17.8 10 3.33 100

Hi 0.02 0.09 0.29 0.69 0.87 0.97 1

b) Histograma de frecuencias relativas.

His tograma 40

30

fr ec uenc ia

20

10

0 12 15 18 21 24 27

2.-

SUNAT pone a disposicin de sus clientes cuatro nuevos planes de tributacin. La gerencia desea saber si se nota alguna preferencia por uno u otro tipo de tributacin. A continuacin se presenta los resultados de la

encuesta aplicada a 37 usuarios. D, A, D, B, C, D, D, A, D, D, A, D, B, D, D, C, A, B, A, D, D, D A, C, B, A, A, B, D, C, B, A, B, B, D, A, D. Represente la informacin mediante un grfico apropiado.

57

Solucin. Tipo de capital. A C B D Total fi 10 4 8 15 n=37 hi 0.2703 0.1081 0.2162 0.4054 1 Pi 27.03 10.81 21.62 40.54 100

15 12

fr ec uenc ia

9 6 3 0 A B C D

27.03% T ributacin 40.54% A B C D

{[} {\} {]} {^}

21.62% 10.81%

{_} {`}

3.- Se realizo un estudio sobre el tipo de error en la facturacin en la ciudad de Cusco, registrndose los siguientes resultados.

58

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Tipo de Error en la facturacin Frecuencia 45 70 86 201 Porcentaje 22.4 34.8 42.8 100.0

Calculo Concepto Otros Total

Represente grficamente la informacin.

50

40

Porcentaje

30

20

10

0 Calculo Concepto Otros

Tipo de error en la facturacin

4.- En una ciudad, se realizo un estudio sobre el conocimiento que presentan los 41 administradores de empresa, respecto a planes de marketing. Los resultados se muestran a continuacin.
Conocimiento Frecuencia 26 8 7 41 Porcentaje 63.4 19.5 17.1 100.0

Deficiente Regular Bueno Total

59

Represente la informacin mediante un grafico.

60,0%

Porcentaje

40,0%

20,0%

0,0% Deficiente Regular Bueno

Conocimiento

EJERCICIOS PROPUESTOS 1. Los datos del Cuadro siguiente corresponden a saldos en cuenta corriente de 48 empresas en miles de soles. 87 93 101 104 105 105 106 107 107 109 110 114 114 116 117 118 118 119 120 122 122 125 125 128 129 133 133 134 135 138 140 141 146 146 148 152 155 155 162 167 173 176 183 194 197 204 212 230

a) Construya la tabla de frecuencias. b) Grafique el histograma. 60

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

c) Establezca si los datos siguen una distribucin simtrica.

2. En una muestra aleatoria de 35

pequeos empresarios, se determino la

inversin que estos realizan en la bolsa de valores , obtenindose los siguientes resultados en miles de soles : 34,35,36,36,38,38,38,39,39,39,39,40,40,40,40,40,41,41,41,41,42,42,42, 42,44,44,44,44,44,45,45,47,47,48,50. a) Identifique los siguientes conceptos: i) Poblacin analizada. ii) Elementos de la poblacin. iii) Variable en estudio. iv) Tipo de dato analizado.

b) Construya una tabla de frecuencias completa e interprete: n3 , f 4 , N5 , F4 c) Construya un grfico estadstico adecuado para la tabla construida en la parte a) e interprtelo. d) Se desea determinar el porcentaje de empresarios cuya inversin, pertenece al intervalo X
2S X , X 2S X .

e) Determine el porcentaje exacto de empresarios con una inversin que fluctue entre 39.5 y 42.5 miles de soles. 3.- Se llev a cabo un estudio de mercado con el fin de describir el nivel de consumo mensual en unidades, de los compradores de cierto producto de venta masiva. Para ello se realiz una encuesta a un grupo de individuos elegidos al azar y los datos reunidos se muestran a continuacin: 4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5. a).- Construir una distribucin de frecuencias de estos pesos. b).- Encontrar las frecuencias relativas. c).- Encontrar las frecuencias acumuladas. d).- Encontrar las frecuencias relativas acumuladas. f).- Dibujar un histograma con los datos de la parte a). g).- Por qu se ha utilizado un histograma para representar estos datos, en lugar de una grfica de barras 61

5.- SUNAT esta realizando un estudio sobre la evasin de impuestos por parte de una empresa, con tal fin se realiza una auditoria respecto al volumen mensual de las ventas de los ltimos 50 meses. 110 113 124 117 108 118 110 98 118 111 120 106 126 122 132 112 99 128 112 105 108 101 102 94 117 103 115 112 129 114 113 119 120 111 115 135 100 107 119 121 107 117 123 103 130 122 113 109 100 134

a).- Cul es la amplitud total de la distribucin de los datos? b).- Obtenga la distribucin de frecuencias absolutas y relativas. c).- Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas, con los intervalos anteriores. d).- Calcular la media y la varianza con los intervalos del apartado b y despus calclense las mismas magnitudes sin ordenar los datos en una tabla estadstica. Con qu mtodo se obtiene mayor precisin? e).- Dibuje el polgono de frecuencias relativas. f).- Dibuje el polgono de frecuencias relativas acumuladas.

9.- El gerente de ventas de una empresa a registrado los siguientes montos de sus ventas diarias en cientos de soles: 24.1 21.0 26.6 26.0 25.7 21.8 20.9 20.4 20.0 28.8 20.2 25.9 21.2 26.2 22.0 24.2 24.7 20.7 25.9 26.7 30.0 24.0 21.3 26.6 21.0 22.1 21.8 21.8 22.9 21.6 25.3 24.9 25.9 26.5 25.4 22.4 a) Construya una distribucin de frecuencia con 5 clases. Incluya los limites dados, la frecuencia absoluta y la frecuencia relativa acumulada "a menos de". b) Dibuje el polgono de frecuencias.

62

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

10.- Suponga que usted es el estadstico oficial de lneas areas KLM y que el presidente del consejo de administracin le ha pedido que recoja y organice datos relativos a las operaciones de vuelo. Su inters principal a partir de los valores diarios se centra en la variable de nmero de pasajeros. Ha obtenido estos datos de los diarios de vuelo de los ltimos 50 das y ha reflejado esta informacin: 68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91 102 83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69 a. Construir la tabla de distribucin de frecuencias. b. Construir un histograma y un polgono de frecuencias. c. Construir una ojiva. 11.- U asesor de una pequea empresa de corretaje, intenta disear programas de inversin que fuesen atractivos para jubilados. El asesor sabe que si un inversionista potencial pudiera obtener un cierto nivel de intereses, estara dispuesto a invertir su capital, pero debajo de un cierto nivel de intereses, no estara dispuesto a hacerlo. De un grupo de 50 sujetos, el asesor obtuvo los datos siguientes con respecto a los diferentes niveles de rditos requeridos por cada individuo para que pueda invertir 1000 dlares: Punto de diferencia ($) fi 70 75) 75 80) 80 85) 85 90) 90 95) 95 100) 100 105) 105 110) 2 5 10 14 11 3 3 2

a. Construya la distribucin de frecuencia acumulativa. b. Grafique la distribucin de la parte (a) convirtindola frecuencia relativa. 63 en ojiva de

c.

CAPITULO III MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIN DE DATOS


Las tcnicas estudiadas anteriormente permiten una descripcin visual de la distribucin de una variable. En muchos casos, el resumen puede hacerse eficazmente de una forma ms sencilla y precisa: utilizando valores numricos que den idea de la ubicacin o del centro de los datos -medidas de posicin- usando cantidades que informen de la concentracin de las observaciones alrededor de dicho centro -medidas de dispersin- y mediante nmeros que reflejen la forma (asimetra y apuntamiento) de la distribucin -medidas de forma. La conjuncin de tcnicas numricas y grficas permite una buena descripcin de la variable. Los estadsticos resmenes tratan de reflejar numricamente distintos aspectos de la variable en estudio. Podemos distinguir 4 aspectos o caractersticas principales que pueden resumirse en una distribucin. (Ver cuadro siguiente)

64

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Media Centralizacin Mediana Moda Percentiles Cuartiles Posicin Deciles Varianza Medidas descriptivas Dispersin Desviacin tpica Coeficiente de variacin Rango

Nos dan un centro de la distribucin de frecuencias Son valores de la distribucin que dividen en partes iguales Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al

Recorrido Intercuartilico Coeficiente de Asimetra Forma

valor central Comparan la forma

Coeficiente de Apuntamiento que tiene la o Curtosis representacin grfica

3.1 Medidas de tendencia central Los promedios o medidas de tendencia central son valores representativos de un conjunto de datos. Pretenden resumir todos los datos en un nico valor. Las medidas de tendencia central son fundamentales ya que permiten localizar cuantitativamente la zona central o de mayor acumulacin de informacin de un conjunto de datos correspondientes a una variable, obtenidos de una muestra seleccionada de una poblacin especfica o de un conjunto de resultados del espacio muestral de un experimento aleatorio.

Definimos tres medidas de tendencia central: media, mediana y moda.

65

Media, ( x ) Media para datos sin agrupar: Dado un conjunto de observaciones mediante x , se obtiene mediante:
n

x1, . . . , xn, la media se representa

x
Media para datos agrupados

x1 x 2 ..... xn n

xi
i 1

Consideremos el caso en que tenemos una distribucin de frecuencia para variables cuantitativas discretas, en este caso la media es:

f 1x1

f 2 x 2 ..... n

fkxk

xi hi
i 1

Si los datos estn agrupados por intervalos, para hallar la media tomamos la marca de las clases,
x f 1m1 f 2m2 ..... n fkmk
k

hi mi
i 1

La media se mide en las mismas unidades que la variable, y tiene el inconveniente de verse muy afectada por la presencia de datos que sean extremadamente grandes o pequeos (datos atpicos).

Mediana, (Me) Se calcula para variables cuantitativas; es el valor de la serie de datos que se sita justamente en el centro de la muestra una vez se ha ordenado sta, corresponde a un 50% de valores son inferiores y otro 50% son superiores. Mediana para datos sin agrupar La mediana es el valor del dato central y depende del tamao de la muestra.

Me

xn
2

, para n impar

66

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

x Me

n 2

x 2

n 1 2

, Si n es par.

Mediana para datos agrupados Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisin los valores que toman los datos, ya que esa informacin se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso, debemos buscar otro mtodo para determinar el valor de la mediana.

Me

LI

n Fi 2 fi

A LI

0.5 H i hi

La mediana slo tiene en cuenta la posicin de los valores en la muestra y por lo tanto tiene mejor comportamiento que la media cuando hay observaciones anmalas.

Moda, (Mo) Es el valor con mayor frecuencia. Si hay ms de una moda, la variable se dice multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o cualitativas). Si los datos estn agrupados hablamos de clase modal y ser aquella para la que la frecuencia absoluta sea mayor.

Mo

LI
1

1 2

LI

fi fi fi
1

fi

fi

fi

A
1

Donde:
1

fi fi

fi fi

67

Cmo elegir entre las medidas de tendencia central?- En general, la media es la medida de tendencia central ms til y ms empleada. El uso de la media es el ms apropiado cuando y la distribucin de los datos es unimodal y aproximadamente simtrica. Cuando valores extremos distorsionan la distribucin de los datos, el uso de la mediana es ms apropiado pues se ve menos afectada, pero en la prctica esta medida de tendencia central no se utiliza demasiado. Si se trata de una variable ordinal, o slo necesitas una descripcin rpida y aproximada de la tendencia central, puedes utilizar la moda, que tambin es til cuando la distribucin est distorsionada por valores extremos o la distribucin es bimodal. Clases de Distribuciones Distribucin Simtrica se presenta si todas las observaciones estn

concentradas en un solo valor de la variable, en este caso la media, mediana y moda coincidiran en el mismo.
x Me Mo

Distribucin asimtrica sesgada a la izquierda Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central ms que las observaciones de la parte derecha, generando una distribucin asimtrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correr a la izquierda tambin y por el mismo

68

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

motivo, la media ser menor que la mediana y ambas menor que la moda, es decir:
x Me Mo

Distribucin asimtrica sesgada a la derecha. En este caso la media, es mayor que la mediana y que la moda.
Mo Me x

. 3.2 Medidas de Posicin. Cuartiles Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se denotan por Qi , i=1,2,3

Qi
-

LI i

i.n Fk 4 fk

Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que l y al menos el 75% de los datos son mayores o iguales que l.

Q2, segundo cuartil, es la mediana, Q2 = Me. Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que l y al menos el 25% de los datos son mayores o iguales que l.

Percentiles Dividen la muestra ordenada en 100 partes iguales. 69

Pi

LI i

i.n Fk 100 fk

El i-simo percentil, Pi ( 1 i

99 ) es un valor tal que al menos el i% de los

datos son menores o iguales que l y al menos el (100-i) % de los datos son mayores o iguales que l.

A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 = P25, Q2 = P50 =Me y que Q3 = P75. Deciles Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,9

Di

LI i

i.n Fk 10 fk

3.3

Medidas de dispersin Mientras los estadsticos de tendencia central nos indican los valores alrededor de los cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o dispersin muestran si los valores de las observaciones estn prximos entre s o estn muy separados. Dos conjuntos de datos pueden tener la misma localizacin central y no obstante, ser muy distintos si uno se halla ms disperso que el otro. La dispersin es el grado en que los datos numricos tienden a extenderse alrededor de un valor medio. La dispersin de la distribucin suministra informacin complementaria que permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos estn ampliamente dispersos, la localizacin central ser menos representativa de los datos en su conjunto de lo que sera en el caso de datos que se acumulasen ms alrededor de la 70

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

media. Adems, si no conviene tener una amplia dispersin de valores respecto al centro o si esa dispersin implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la mxima dispersin. Por ejemplo, a los analistas financieros les interesa la dispersin de las ganancias de una empresa, las utilidades con una fuerte dispersin indican un riesgo mayor parar los accionistas que las utilidades que permanecen relativamente estables. Varianza. Slo tienen sentido para variables cuantitativas y se define:
n

xi S2
i 1

xi2
i 1

n
n

n x
2 n

x 2 , Para datos no tabulados. fi xi2

xi S2
i 1

fi
i 1

n
n

n x
2 n

x 2 , Para datos tabulados de variable discreta

mi S2
i 1

fi
i 1

f i mi2 n x 2 , Para datos tabulados por intervalos, para

variables continuas.

Observaciones sobre la varianza: Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas ocasiones no son fciles de interpretar. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Desviacin tpica (S) Es la raz cuadrada positiva de la varianza

s
71

s2

La desviacin tpica poblacional suele denotarse por Observaciones sobre la desviacin tpica:

Nos permite determinar con mayor grado de precisin dnde se sitan los valores de una distribucin de frecuencia en relacin con la media. Las unidades de la desviacin tpica se expresan en las mismas unidades de los datos. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Variables tipificadas Los distintos conjuntos de datos estn asociados por lo general a diferentes medias, ya sea porque son de naturaleza diferente (escalas de medidas diferentes). Con el propsito de reducir los datos a un mismo punto de referencia y a una escala comn, se realiza entre ellos una transformacin llamada tipificacin. Se conoce por tipificacin de una variable x a efectuar el cambio de origen y de escala de la variable.

Frmulas:
z

x x para muest ras s xpara poblacin

Esta nueva variable (z), carece de unidades de medida y permite comparar dos o ms cantidades que en un principio no son comparables porque aluden a conceptos diferentes. Tambin es aplicable a casos en que se quieran comparar individuos semejantes de poblaciones diferentes. Por ejemplo, si deseamos comparar el nivel acadmico de dos estudiantes de diferentes universidades, nos indica cuntas desviaciones estndar est un valor por arriba o por debajo de la media del conjunto de datos al cual pertenece. 72

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Ejemplo: Un Docente de la Universidad A obtuvo 84 puntos en sistemas de tributacin , en el que la nota media fue 76, y la desviacin tpica 10; Otro Docente de la Universidad B obtuvo 90 puntos, siendo la media 82 y la desviacin tpica 16. Cual de los Docentes presenta mejor nivel de conocimientos de sistemas de tributacin?.

Docente de la Universidad A
x = 76

Docente de la Universidad B
x = 82

s = 10 x = 84 z=
84 76 10 0,8

s = 16 x = 90 z=
90 82 16 0,5

Sobresali ms el Docente de la Universidad A. Coeficiente de variacin Muestral de Pearson Las medidas de dispersin anteriores dependen de las unidades de medida, el coeficiente de variacin es, en cambio, una medida de dispersin relativa y adimensional.
CV S |X|

CV es apropiado en poblaciones donde los datos son positivos. Si 0<CV<1.5, los datos provienen de una poblacin homognea Si CV>1.5, los datos provienen de una poblacin heterognea.

El coeficiente de variacin es til, en razn de su carcter adimensional, para comparar muestras con medias desiguales, donde las unidades de medida de las observaciones son diferentes. Tambin para decidir cual muestra es ms homognea o menos variable 73

Recorrido o rango Es la diferencia entre el mayor y menor valor de una muestra.

x max

x min

Rango semiintercuartlico y amplitud intercuartil El rango semiintercuartlico es la mitad de la diferencia entre el tercer y primer cuartil, Q = (Q3 Q1)/2. La amplitud intercuartil es el doble del valor anterior, 2Q = IQR = (Q3 Q1).

Cmo elegir entre las medidas de dispersin?- La medida de dispersin ms til es la desviacin tpica. Slo debes usar el rango cuando dispones de pocas medidas o cuando todo lo que necesitas conocer es la dispersin general de las medidas. Utiliza el coeficiente de variacin cuando quieras tener una idea de la variabilidad relativa de dos o ms variables cuyas medias son muy diferentes en magnitud. Esto se ve facilitado por su carcter adimensional, es decir, no depende de las unidades en que se mida la media

3.4

MEDIDAS DE FORMA Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y Hacen referencia a la forma de la distribucin, simtrica, asimetra a la derecha o a la izquierda. En general la mejor manera de verlo es por la representacin grfica, pero si no la tenemos existen coeficientes que nos indican la forma de la distribucin. Los ms utilizados son:

Coeficiente de asimetra de Pearson, El coeficiente de asimetra de una variable mide el grado de asimetra de la distribucin de sus datos en torno a su media, es adimensional y se define como sigue: 74

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Ap

x Mo S

Este coeficiente puede ser:

Ap Ap

0 , entonces la media igual que la moda, distribucin simtrica 0 , entonces la media mayor que la moda, asimetra a la derecha

positiva

Ap

0 , entonces la media menor que la moda, asimetra a la izquierda

negativa.

Curtosis. hace referencia al mayor o menor apuntamiento que tiene una distribucin de frecuencias respecto a una distribucin Normal, por lo tanto slo se estudia en comparacin con la campana de Gauss, se determina mediante:
K P75 P25 P90 P 10 0.5

Este coeficiente puede ser:


K 0 , la curva es igual que la normal, se llama Mesocrtica

K
K

0 , la curva es ms puntiaguda que la normal se llama Leptocrtica


0 , la curva es ms aplastada que la normal, se llama Platicrtica

75

EJERCICIOS RESUELTOS. 1) La siguiente tabla muestra los coeficientes de inteligencia de 480 trabajadores de una empresa. C.I fi 70 4 Calcule: a) El C.I. medio de los trabajadores. b) Su desviacin tpica. c) Si el gerente de la empresa afirma que exactamente la mitad de los 74 9 78 16 82 28 86 45 90 66 94 85 98 72 102 106 110 114 118 122 126 54 38 27 18 11 5 2

trabajadores de la empresa tienen un C.I. superior al del trabajador Juan, qu C.I. tiene Juan? d) Supongamos que se desea realizar un estudios sobre mercadotecnia , para ello se debe seleccionar a un grupo de trabajadores con mayor C.I., pero la empresa solo puede utilizar al 15% de los trabajadores. Qu C.I. deber tener un trabajador como mnimo para ser considerado dentro de ese grupo de elegidos? e) Se van a preparar unas clases de apoyo en gestin empresarial , para un 25% de los trabajadores de la empresa , precisamente para aquellos que tengan menor C.I. Hasta que trabajador de qu C.I. deberemos considerar en estas clases?

SOLUCION: La variable de estudio es el cociente intelectual (X)

76

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

xi 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 1470

fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2 n=480

fixi 280 666 1248 2296 3870 5940 7990 7056 5508 4028 2970 2052 1298 610 252 46064

fixi2 19600 49284 97344 188272 332820 534600 751060 691488 561816 426968 326700 233928 153164 74420 31752 4473216

Fi 4 13 29 57 102 168 253 325 379 417 444 462 473 478 480

Hi 0.0083 0.0271 0.0604 0.1188 0.2125 0.35 0.5271 0.6771 0.7896 0.8688 0.925 0.9625 0.9854 0.9958 1

a) Media
x f 1 x1 f 2 x2 ..... n fkxk 46064 480 95.96

b) Varianza y desviacin.
n

xi S2
i 1

x n

fi
i 1

fi xi2 n x2

4473216 480

95.96

110.88

110.88 10.52

c) Mediana. n=480 ( Par)

x Me

n 2

x 2

n 1 2

480 2

x 2

480 1 2

x 240 2

x 241

94 94 2

94

77

d) Percentil 85

P 106 85
e) Percentil 25

P25

90

2) Una empresa contrata los servicios de un corredor de bolsa, para decidir su inversin en una de las dos acciones A y B. Los resultados de las utilidades de estas acciones en los ltimos 7 meses en miles de dlares esta dado en el cuadro siguiente. Accin 1 A B 57 80 Utilidades en miles de dlares. 2 55 40 3 54 62 4 52 72 5 62 46 6 55 80 7 59 40

a) Halle e interprete la media, mediana y moda de las utilidades. b) Estadsticamente Cul de las acciones es ms recomendable para la empresa que esta interesado en una mayor utilidad? Cul de las acciones es ms recomendable para la empresa que esta interesado en un menor riesgo de inversin? Fundamente su respuesta. SOLUCION: XA 57 55 54 52 62 55 59 394 XB 80 40 62 72 46 80 40 420 78 XA2 3249 3025 2916 2704 3844 3025 3481 22244 x B2 6400 1600 3844 5184 2116 6400 1600 27144

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

a) Estadsticos de A.
n

xA

x1 x 2 ..... xn n

xi
i 1

394 7

56.28

MeA
MeA
MoA

xn
2

, para n impar n=7

xn
2

x7
2

x4

55

55

Estadsticos de B.
n

xB

x1 x 2 ..... xn n

xi
i 1

420 7

60

MeB
MeB
MoB1

xn
2

, para n impar n=7

xn
2

x7
2

x4

62

40

MoB 2

80

b) Calcular la varianza
n

xi
2 SA i 1

xi2
i 1

2 xA

22244 (56.28) 2 7

10.27

CVA
n

S | XA |
xi x

10.27 56.28
2 n

0.057
xi2

2 SB

i 1

i 1

n
S | XB |

n
277.7 60

2 xB

27144 7

602

277.7

CVB

0.277

La informacin se ilustra en el grafico siguiente. 79

80,00

70,00

Utilidad

60,00

50,00

40,00

Accin

3.- Con el fin de realizar un estudio sobre las retenciones econmicas de quinta categora a los trabajadores de una empresa, se selecciono aleatoriamente a 24 trabajadores, obtenindose las siguientes cantidades de retencin econmica en cientos de soles. Retencin Econmica. [0, 1> [1, 2> [2, 3> [3, 4> [4, 5> [5, 6> [6, 7> [7, 8> [8, 9> Nmero de trabajadores 2 2 3 6 7 1 1 1 1

a) Halla la media, varianza, la desviacin tpica y coeficiente de variacin. 80

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

b) Mediana c) Moda. SOLUCION: I [0, 1> [1, 2> [2, 3> [3, 4> [4, 5> [5, 6> [6, 7> [7, 8> [8, 9> Total Media.
fi mi x n 92 24

fi 2 2 3 6 7 1 1 1 1 24

mi 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 40.5

mifi 1 3 7.5 21 31.5 5.5 6.5 7.5 8.5 92

mi2fi 0.5 4.5 18.75 73.5 141.75 30.25 42.25 56.25 72.25 440

Fi 2 4 7 13 20 21 22 23 24

a) Media, varianza, desviacin y coeficiente de variacin.

3.83

Varianza.
mi2 fi S2 n x2 440 24

3.83

3.66

Desviacin.

s
Coeficiente de Variacin.
CV

3.66 1.91

S |X|

1.91 3.83

0.498

Mediana
Me 3 12 7 *1 3.833 6

81

Moda
Mo Li 1 A 1 2

1 7 6 1 1 7 1 6
Mo 4 1 1 6 *1 4.14

a.

El colegio de administradores aplico un test de conocimientos en una escala de 0 a 20 a 60 profesionales del rea, respecto a obteniendo los siguientes resultados. Nivel de conocimientos de riesgo de inversion. 0-5 5-10 10-13 13-18 18-20 10 15 25 8 2 Nro de administradores riesgo de inversin ,

a) Calcule la media, varianza y la desviacin. b) Determine la mediana y la moda c) Determine e interprete Q1, Q3, P10 y P90 d) Coeficiente de curtosis y de asimetra. SOLUCION: Intervalo 0-5 5 -10 10-13 13-18 18-20 fi. 10 15 25 8 2 60 82 Fi 10 25 50 58 60 mi 2.5 7.5 11.5 15.5 19 56 mifi 25 112.5 287.5 124 38 587 mi2fi 62.5 843.75 3306.25 1922 722 6856.5

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

a) Media y varianza Media.


fi mi x n 587 60

9.78

Varianza.
mi2 fi S
2

x2

6856.5 60

9.782

18.63

Desviacin:

18.63

4.31

b) Mediana y moda Mediana

Me

Li

n Fk 2 fK

Determinamos

n 2

60 2

30

Me

Li

n Fk 2 fK

A 10

30 25 3 10.6 25

Moda
Mo Li 1 A 1 2

1 25 15 10 1 25 8 17

Mo

Li

1 A 10 1 2

10 3 11.11 10 17

c) Determine e interprete Q1, Q3, P10 y P90

83

Para obtener los cuarteles se tiene la relacin.

Qi

Li

i.n Fk 4 fK

Cuartil 1

Q1

Li

1.n Fk 4 fK

A 5

15 10 5 6.67 15

El 25% de los administradores presentan nivel de conocimientos de riesgo de inversin a 6.67 Cuartil 3

Q3

Li

3.n Fk 4 fK

A 10

45 25 3 12.4 25

El nivel de conocimientos mximo de riesgo de inversin del 75% de los administradores es de 12.4.

Para obtener los percentiles se tiene la relacin.

Pi

Li

i.n Fk 100 fK

Percentil 10

P 10

Li

10.n Fk 100 fK

A 0

6 0 5 3 10

El 10% de los administradores tienen nivel de conocimientos de riesgo de inversin entre 0 a 3

84

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Percentil 90

P90

Li

90.n Fk 100 fK

A 13

54 50 5 15.5 8

d) Coeficiente de Asimetra.

Ap

x Mo s

9.78 11.11 -0.308 4.31

Puesto que Ap < 0 la distribucin es asimtrica negativa o a izquierdas (desplazada hacia la izquierda). Coeficiente de curtosis de fisher.
K Q3 Q1 P90 P 10 0.5 12.4 6.67 0.5 -0.0416 15.5 3

Si k

0 , entonces la distribucin es platicrtica.

EJERCICIOS PROPUESTOS 1. Las utilidades de empresas dedicadas al rubro de alimentos, en una regin del pas presenta el siguiente comportamiento: Utilidades en miles de soles. Nmero de empresas Calcule e interprete: La media aritmtica, mediana y moda. Varianza, coeficiente de variacin. Cuartel 1, Decil 6 y Percentil 85. 7 8 10 20 5 [0, 40[ [40,70[ [70, 90[ [90,110[ [110,120]

85

2.- Una muestra de pequeas empresas se clasifica en funcin de su antigedad en el mercado y del porcentaje de deudas sobre el capital que presentan, con los siguientes resultados: Deudas 0-15 15-30 30-50 50-70 Empresas antiguas 19 13 7 4 Empresas Nuevas 29 10 11 32

En base a los resultados, Puede admitirse que el porcentaje de deudas de las empresas es independiente de su antigedad?. Fundamente su respuesta.

3.En una empresa donde los salarios tienen una media de 700 dlares y una desviacin estndar de 150 dlares, el sindicato solicita un reajuste de 25% ms un incentivo de 10 dlares. El Directorio acoge parcialmente la peticin rebajando los salarios solicitados en un 10%.

a) El Sindicato se declara satisfecho en sus negociaciones si el sueldo promedio final aumenta por lo menos en un 20% respecto de su valor actual. Se logra esto aceptando la proposicin del Directorio? Justifique su respuesta.
b) El Sindicato pretende con su proposicin aumentar la homogeneidad de

los sueldos de

sus afiliados Se logra este objetivo aceptando la

proposicin del Directorio? Fundamente su respuesta.


c)

Si en la Empresa laboran 500 funcionarios En qu porcentaje aument la planilla de sueldos respecto a la planilla inicial?.

4.

Una empresa constructora tiene 2 secciones A y B. Las distribuciones de ingresos diarios de sus empleados son los siguientes:

86

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Seccin A Ingresos ($) 80-100) 100-120) 120-140) 140-160) 160-180) 180-200) Frecuencia 30 80 40 10 4 1

Seccin B Ingresos ($) 60-90) 90-120) 120-150) 150-180) 180-210) 210-240) 240-270) Frecuencia 10 20 50 20 15 10 4

Calcular la media aritmtica y varianza de la seccin A y B. Compare los ingresos.

5. Un consultor de una empresa de planificacin financiera que asesora a quienes quieren establecer sus carteras de inversin personales. Hace poco el consultor estaba interesado en las tasas de rendimiento que haban ofrecido dos fondos de inversin diferentes a lo largo de los 5 ltimos aos. FIVENEZ presentaba tasas de retorno a lo largo de ese perodo de 12, 10, 13,9 y 11%; mientras que Corporacin Dinmica haba producido 13, 12, 14, 10, y 6%. Un cliente se puso en contacto con el consultor expres su inters por uno de estos fondos de inversin. ellos deber elegir el consultor para su cliente? Cul de

87

6.- En las siguientes tablas se registran los sueldos quincenales (en dolares) de 50 obreros de dos fbricas. Fbrica A Fbrica B Sueldo 45 55) 55 65) 65 75) 75 85) 85 95) fi 18 24 26 20 12 sueldo 45 55) 55 65) 65 75) 75 85) 85 95) fi 12 28 30 22 8

a) En cul fbrica hay mayor dispersin relativa? b) Un obrero que gana 140 mensuales. Dnde estara mejor remunerado con respecto a sus compaeros? c) Cul de las dos distribuciones es ms simtrica?

88

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

CAPITULO IV DISTRIBUCIONES BIDIMENSIONALES


Si resumir la informacin de una variable es de por si interesante, en investigacin lo es mucho ms el poner de manifiesto la posible relacin entre dos de ellas. El anlisis de la relacin de dos variables, X e Y, depende del tipo de variables y Segn sean los tipos de cada una de ellas se usa tcnicas estadsticas diferentes.

4.1 CUALITATIVA-CUALITATIVA. Cuando las variables de estudio son cualitativas (categricas) o cuantitativas discretas con poca modalidades, se suele presentar las observaciones de las

variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones se denomina tablas de contingencia. Las tablas de contingencia son de doble entrada organizada por filas y columnas y donde se presenta la distribucin de frecuencias conjuntas de las dos variables. Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamao n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj).

La frecuencia absoluta de un valor (xi, yj) es el nmero de veces que dicho valor aparece en la muestra. Se representa por fij , se cumple
k l

fij
i 1 j 1

89

La frecuencia relativa de un valor (xi, yj) es el cociente de la frecuencia absoluta fij entre el tamao de la muestra n, se representa por hij
hij fij , n

se cumple:

hij
i 1 j 1

Distribuciones marginales Nos indican el comportamiento aislado de cada una de las variables X e Y que dan lugar a una variable bidimensional. Frecuencia absoluta marginal de xi, fi.

fi1

fi 2 fil

fij
j 1

Frecuencia relativa marginal de xi, Frecuencia absoluta marginal de yj, f. j

hi .
f1 j

fi . n
f 2 j f kj
k

fij
i 1

Frecuencia relativa marginal de yj,

h. j

f. j n

Una tabla de doble entrada de una variable bidimensional sigue la estructura que se presenta a continuacin, en la que tienen cabida las frecuencias marginales (representadas en la ltima fila y ltima columna). Puede ser de frecuencias absolutas o relativas. Y X x1 x2 .. xk n.j fk1 f.1 f11 f21 .. f12 f22 .. fk2 f.2 ..... ..... ..... ..... ..... f1l f2l .. fkl f.l f1. f2. .. fk. n y1 y2 ..... yl ni.

Ejemplos. 1.- El gerente de ventas de la firma A desea determinar el comportamiento de las ventas de cuatro productos (I, II, III y IV), en funcin de la clase de clientes

90

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

clasificados en cuatro grupos. Una muestra aleatoria de las ventas suministro la siguiente informacin.
Grupo de clientes Profesionales Comerciantes Obreros Amas de casa I 30 155 130 35 II 35 50 30 15 Producto III 55 125 105 20 IV 40 80 50 45

Las ventas de los cuatro grupos son homogneas?

Solucin
Producto Grupo de clientes Profesionales Comerciantes Obreros Ama de casa Total I Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje 30 18.8% 155 37.8% 130 41.3% 35 30.4% 350 35.0% II 35 21.9% 50 12.2% 30 9.5% 15 13.0% 130 13.0% III 55 34.4% 125 30.5% 105 33.3% 20 17.4% 305 30.5% IV 40 25.0% 80 19.5% 50 15.9% 45 39.1% 215 21.5% Total 160 100.0% 410 100.0% 315 100.0% 115 100.0% 1000 100.0%

91

160 140 120 100 80 60 40 20 0 Profesionales Comerciantes Obreros Amas de casa I II III IV

4.2

CUALITATIVA-CUANTITATIVA. Supongamos que tenemos datos numricos para varias categoras, por

ejemplo en un experimento donde hacemos mediciones numricas en dos o ms grupos. En estos casos, lo que se realiza es un estudio descriptivo de la variable numrica resultados. en cada una de las muestras y se comparamos los

Ejemplo La estructura financiera de una firma se refiere a la forma en que se dividen los activos de la empresa por debe y haber, y el apalancamiento financiero se refiere al porcentaje de activos financiados por deuda. En un estudio financiero se afirma que el apalancamiento financiero puede utilizarse para aumentar la tasa de rendimiento sobre la inversin, es decir que, los accionistas pueden recibir rendimientos ms altos con la misma cantidad de inversin gracias a su uso. Los siguientes datos muestran las tasas de

rendimiento utilizando 3 diferentes niveles de apalancamiento financiero y un nivel de control (deuda cero) de empresas seleccionadas al azar:

92

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Tasas de Rendimiento Control 4.6 2 6.8 4.2 1.6 Bajo 2 7.4 1.8 3.2 4 Medio 7 4.5 11.6 6 6.8 Alto 7.9 6.8 5.8 9.2 11

Son las tasas medias de rendimiento en los niveles de apalancamiento financiero bajo, medio, alto y control diferentes? Solucin. Nivel de Apalancamiento Mean Alto Bajo Control Medio 8.140 3.68 3.840 7.18 4.158 5.13 4.468 7.07 Variance CoefVar Median 25.05 61.56 7.900 3.20 4.200 6.80

55.05 37.04

12

10

Tasas de rendimiento

2 Alto Bajo Control Nivel de apalancamiento Medio

93

4.3

CUANTITATIVA-CUANTITATIVA. Anlisis de dos variables cuantitativas y establecimiento de una relacin entre ellas. La forma mas sencilla de estudiar la posible asociacin entre estas variables es el diagrama de dispersin (Nube de puntos). Si reconocemos una tendencia, entonces el inters ahora ser el anlisis de regresin.

Media y varianza La informacin de las dos variables X e Y se puede resumir usando la media y la varianza como se muestra a continuacin: Media de la variable X: Media de la variable Y: Varianza de la variable X: s
2 x

fi xi n

fi yi n fi xi2 n
fi yi2 n

2 Varianza de la variable Y: s y

La covarianza Es una medida de la asociacin lineal existente entre dos variables. Resume la informacin contenida en el diagrama de dispersin. Presenta la siguiente expresin:
cov( x, y) sxy fi xi yi n x. y

Si la covarianza est muy prxima a cero, no existe relacin entre las variables o si existe es marcadamente no lineal, si es positiva, hay asociacin lineal positiva, y si es negativa, hay asociacin lineal negativa. Sin embargo, como la covarianza depende de las unidades de medida de las variables, no nos permite cuantificar el grado de asociacin lineal ni comparar la

94

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

asociacin existente entre distintos pares de variables. Para dar solucin a este problema se obtiene el coeficiente de correlacin.

Correlacin. Estudia la relacin o dependencia que existe entre dos variables que intervienen en una distribucin bidimensional.

Coeficiente de correlacin lineal. Es un nmero que mide el grado de dependencia entre las variables X e Y. Se mide mediante la siguiente frmula: Su valor est comprendido entre 1 y 1. Si r = -1 r = 1 todos los valores de la variable bidimensional se encuentran situados sobre una recta. Si 1< r < 0 se dice que las variables X e Y estn tambin en

s xy s x .s y

dependencia aleatoria. La correlacin es negativa. Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin en dependencia aleatoria.

La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es tanto ms dbil a medida que se aproxima a 0. Anlisis de Regresin. Regresin: conjunto de tcnicas que son usadas para establecer una relacin entre una variable cuantitativa llamada variable dependiente y una o ms variables independientes, llamadas predictoras. Estas tambin deberan ser cuantitativas, sin embargo algunas de ellas podran ser cualitativas. Modelo de regresin. Ecuacin que representa la relacin entre las variables
Y X

Estimacin de la lnea de regresin usando Mnimos Cuadrados 95

Se debe Minimizar el error cuadrtico medio:


n n

,
i 1

ei2
i 1

( yi
n

xi )2
n n

n
i 1

xi yi
n i 1 n

xi
i 1

yi

S xy S xx

n
i 1

xi2 (
i 1

xi ) 2

La pendiente , indica el cambio promedio en la variable de respuesta cuando la variable predictora aumenta en una unidad adicional. El intercepto , indica el valor promedio de la variable de respuesta cuando la variable predictora vale 0. Sin embargo carece de interpretacin prctica si es irrazonable pensar que el rango de valores de x incluye a cero.

A partir de la recta Y

X podemos calcular los valores de y conocidos

los de x. La fiabilidad que podemos conceder a los clculos obtenidos viene dada por el coeficiente de correlacin: si r es muy pequeo no tiene sentido realizar ningn tipo de estimaciones. Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores reales. Si r = 1 o r = -1, las estimaciones realizadas coincidirn con los valores reales. Ejemplos 1. Se realizo un estudio sobre el conocimiento(X) y aplicacin (Y) del software para la toma de decisiones. La informacin se muestra a continuacin. X 14.8 15.2 Y 14 14.7 a) b) c) 14.4 12 15.2 13.2 14 14.4 12.4 14.8 14 14.4 14.8 13.2 16.4 12.4 12

16 12.67 15.3 13.3 12.7

16 12.7 15.3

16 13.3 13.33

Trace un diagrama de dispersin. Ajuste una recta de regresin. Calcule la correlacin lineal e interprete dicho valor. 96

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Solucin:
Scatterplot of Y vs X
16

15

14

13

12 12 13 14 X 15 16 17

Resumen de calculos. X 14.8 15.2 14.4 15.2 13.2 14 14.4 12.4 14.8 14 14.4 14.8 13.2 16.4 12.4 213.6 Y 14 14.67 12 16 12.67 15.33 13.33 12.67 16 12.67 15.33 16 13.33 13.33 12 209.33 X.Y 207.2 222.984 172.8 243.2 167.244 214.62 191.952 157.108 236.8 177.38 220.752 236.8 175.956 218.612 148.8 2992.208 X2 219.04 231.04 207.36 231.04 174.24 196 207.36 153.76 219.04 196 207.36 219.04 174.24 268.96 153.76 3058.24 Y2 196 215.2089 144 256 160.5289 235.0089 177.6889 160.5289 256 160.5289 235.0089 256 177.6889 177.6889 144 2951.8801

97

x y
2 sx

xi N yi N xi2 N yi2 N

213.6 14.24 ; 15 209.33 13.96 ; 15 x


2

3058.24 14.242 1.11 15 2951.88 13.962 1.91 ; 15 2992.208 (14.24).(13.96) 0.69 15

2 sy

sxy

xi yi N

x. y

Recta de regresin
n n n

n
i 1

xi yi
n i 1 n

xi
i 1

yi
2

S xy S
2 x

n
i 1

2 i

(
i 1

xi )

0.69 1.11

0.62

x 13.96 0.62(14.24) 5.13


X 5.13 0.62 X
r sxy sx .s y 0.69 1.11. 1.91 0.47

Ejercicios propuestos. 1. Un asesor financiero quiere conocer las diferencias en la estructura de capital de varios tamaos de empresas en cierta industria. Hace una encuesta en un grupo de firmas que tienen distintas cantidades de activos y las divide en tres grupos. Clasifica cada una segn, que su deuda sea mayor o menor que el capital contable de los accionistas. A continuacin se dan los resultados de una encuesta.

98

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Deuda

Tamao de activos de la firma (En miles de dlares) <500 500-2000 10 >2000 8 Total 25

< que el capital social > que el capital social Total

10

18

37

17

28

17

62

Se puede concluir que las empresas tienen idntica estructura de capital?

2. Un especialista trabaja como corredor de bolsa para una empresa. Sus registros muestran que las tasas de rendimiento ( en porcentajes) de dos acciones para 8 meses seleccionados fueron de : Acciones A Acciones B 15.5 4.5 3.6 6.2 21.7 5.5 27.2 7.2 7.8 3.5 2.2 4.2 5.0 4.1 12.2 12

a) En que accin invertira la empresa, si el inters es tener un rendimiento mas alto. b) Que accin debera aconsejar el especialista a la empresa que prefieren menos riesgo. 3. En la contabilidad de costos, con frecuencia se trata de estimar los gastos indirectos basndose en el nmero de unidades producidas. La gerencia de la empresa ha reunido informacin sobre esos gastos y las unidades producidas en diferentes plantas. Gastos indirectos Unidades 40 42 53 35 56 39 48 30 37 40 191 170 272 155 280 173 234 116 153 178

a. Estimar la ecuacin. b. Prediga el gasto general cuando se produce 50 unidades. 4. Sea Y el ndice de precios al consumidor, tomado como base el ao 1990, es decir 2000 el ndice es 100. 99

Ao Y

2001 106

2002 111.1

2003 117.2

2004 121.3

2005 125.2

2006 128

2007 132.6

Predecir el ndice de precios para el ao 2008 En que ao podemos esperar que el ndice de precios sea de 150.57? 5. Una gran compaa llev a cabo un estudio para ubicar las variables que pudieran determinar el sueldo de un egresado universitario dos aos despus de haberse graduado como Tcnico Superior Universitario en un rea Administrativa. Los datos recogidos se presentan en la siguiente tabla: (La columna del sueldo es en cientos de miles). Edad Sexo E. Civil 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 25 26 27 27 27 27 25 23 24 26 29 25 31 26 24 26 28 25 29 F M M F M F M F M M F F M F M F F F M M C C S C D C S C S S C D C D S D C S C C 100 Ingls Sueldo A M B B A M A B B B M M A A B M B M B M 6,75 6,90 6,90 6,80 7,10 6,50 7,25 6,80 6,75 6,80 6,75 7,00 7,15 7,50 6,20 7,40 6,70 6,95 6,95 7,10

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Utilice la tcnica de estadstica descriptiva ms apropiada para analizar cada variable individualmente. Interprete lo obtenido.

Realice diagramas de cajas que le ayuden a visualizar como influye cada una de las variables en el sueldo que gana el individuo.

Como futuro Tcnico Superior en el rea Administrativa, cul seria la(s) caractersticas que usted debera tomar en consideracin para obtener el sueldo al que usted aspirara al egresar?

6.

Se desea estudiar la relacin entre los aumentos de precios y los salarios en 8 empresas tomadas al azar, tal que se define x: % de aumento de salarios e y: % de aumento de precios

x 169.3,

x2

3630.89,

xy 2731.82,

y 126.9,

y2

2498.01

a) Calcular la recta de ajuste e interpretar las componentes en funcin del problema b) Qu porcentaje del anlisis queda explicado por la recta de regresin? Que podra Ud. Decir al respecto? c) Estimar el porcentaje de aumento en los precios, si se produce un aumento del 20% en los salarios, es lgico estimar dado el resultado obtenido en b) ?

7.

Una aplicacin importante del anlisis de regresin en contabilidad es para estimar costos. Al reunir datos sobre volumen y costo y aplicar el mtodo de mnimos cuadrados para determinar la ecuacin de regresin donde se relacionan estas variables, un contador puede estimar el costo asociado con determinada operacin de manufactura. Se obtuvo la siguiente muestra de volmenes de produccin y costo total para una operacin de manufactura. Volumen de produccin (unidades) : 400 450 550 600 700 Costo total (en miles de $) :4 5.0 5.4 5.9 6.4 750 7.0

101

a) Estimar la ecuacin de regresin con la que se pueda predecir el costo total para determinado volumen de produccin. Interprete el significado de las componentes de la recta, en funcin del problema. b) Calcular el coeficiente de determinacin. Comentar su resultado en funcin de las variables en estudio. c) El programa de produccin de la empresa indica que el mes prximo se deben producir 500 unidades. Cual ser el costo total estimado para esta operacin?

8.

Suponga que usted tiene a su cargo el dinero de la regin de Piedmont, se le dan los siguientes datos de antecedentes sobre el suministro de dinero y el producto nacional bruto (ambos en millones de dlares):

Suministro de dinero 2 2.5 3.2 3.6 3.3 4 4.2 4.6 4.8 5

Producto Nacional Bruto 5 5.5 6 7 7.2 7.7 8.4 9 9.7 10

(a) Desarrolle la ecuacin de estimacin para predecir el PNB del suministro de dinero. (b) Cmo interpreta la pendiente de la lnea de regresin?. (c) Calcule e interprete el error estndar de la estimacin. 102

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

CAPITULO V PROBABILIDADES
El Clculo de Probabilidades se ocupa de estudiar ciertos experimentos que se denominan aleatorios, cuya caracterstica fundamental es la incertidumbre del resultado, esto significa que es imposible predecir los resultados porque hay ms de uno posible. En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su calificativo probable, considerando probable a aquellos eventos en los que

tenemos alto grado de creencia en su ocurrencia. En esta lnea probabilidad es un concepto asociado a una medida del azar. El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos inciertos. 5.1 EXPERIMENTO ALEATORIO. Es una accin que da lugar a resultados identificables y se caracteriza por: Todos los posibles resultados son conocidos previamente. Repeticiones en situaciones anlogas pueden dar resultados diferentes.

103

No se puede predecir el resultado del mismo antes de realizarlo, es decir, no se sabe cul de los posibles resultados aparecer al final. Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa relativo a todo acontecimiento incierto, por depender de la suerte o del azar, mientras que los deterministas son aquellos que se caracterizan por el hecho de que las mismas causas producen los mismos efectos. Espacio muestral. Es el conjunto de todos los resultados posibles del experimento y se denota por . A cada elemento de se denomina punto muestral w , es decir:

w / w es un punto muestral .

Evento o Suceso Aleatorio. Un evento aleatorio es un subconjunto del espacio muestral y se denota con letras maysculas. El evento seguro El evento imposible , es aquel que ocurre siempre al realizar el experimento. , es aquel que no ocurre nunca.

Lo s eventos elementales solo tienen un punto muestral. El evento complementario Ac , esta dado por todo los puntos muestrales que no estn en A 5.2 OPERACIONES DE EVENTOS. Unin de eventos: Dados dos eventos A y B de un mismo espacio muestral su unin se representa por A
B y es el evento que contiene los elementos B ocurre si al menos uno de

que estn en A o en B o en ambos. El evento A los dos eventos ocurre.

Interseccin de eventos: Dados dos eventos A y B de un mismo espacio muestral su interseccin se representa por A
B y es el evento que contiene

los elementos que estn en A y B al mismo tiempo. El evento A


B ocurre cuando ambos eventos ocurren simultneamente.

104

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Evento Complemento: El complemento de un evento A se representa por Ac y es el evento que contiene todos los elementos que no estn en A. El evento
Ac ocurre si A no ocurre.

5.3

DEFINICIN CLSICA DE PROBABILIDAD: La probabilidad de un suceso A se calcula como el nmero de casos favorables al suceso A, partido por el nmero de casos posibles del

experimento aleatorio.
p( A) casos favorables casos posibles

5.4

DEFINICIN AXIOMTICA DE PROBABILIDAD. La probabilidad es una funcin que asigna a cada suceso A real que varia entre 0 a 1. P: A i) 0 ii) p y que verifica: p(A)
p( A) 1

un nmero

iii) Si A y B son sucesos incompatibles,

p A B

p A

p B

Como consecuencia de estos tres axiomas, se verifican adems las siguientes propiedades: iv) v)

p( Ac ) 1 p A
p( ) 0
B,

vi) Si A vii) P( A \ B)

p( A)

p( B)

P( A) P( A

B) ,

A,B

viii) Si A 1 , A 2 , ...... , A n son incompatibles dos a dos, entonces

p A1
ix) Si A, B

A2

...

An

p A1

p A2

... p An

son dos sucesos cualesquiera, entonces 105

p A B
x) Si A, B
p( A) p A

p A

p B

p A B

son dos sucesos cualesquiera, entonces


Bc p A B

5.5

PROBABILIDAD CONDICIONADA.
Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce que otro evento B ha ocurrido. En este caso habria que referirse a la

probabilidad de A condicionada a B como la probabilidad de que ocurra A sabiendo que ha ocurrido B, la denotamos por P(A|B)
P( A | B) P( A B) , P(B) P( B)

0.

En consecuencia,
p(A B) =p( A) p( B ) A

Independencia. Dos sucesos A, B


p( A)

se dicen independientes si:


p( A | B) , o bien p( B) p( B | A)

Es decir, se cumplir que:

p( A

B)

p( B). p( A)

Si A y B son independientes, entonces A y B C son independientes, A C y B son independientes, y A C y B C son independientes. Observacin. Decimos que n sucesos A1, A2, An son independientes si para cada par (Ai, Aj), P( Ai
P( Ai Aj Ak ) Aj ) P( Ai ) P( Aj ) si i j
j , si para cada tro (Ai, Aj, Ak)

P( Ai ) P( Aj ) P( Ak ) si i

k y as sucesivamente. En general,

P( A1

A2 An) P( A1) P( A2) P( An)

106

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

Teorema de la probabilidad compuesta. Dados n sucesos A 1 , A 2 , ......., A se verifica:


P( A1 A2 An) P( A1) P( A2 | A1) P( A3 | A1 A2) P( An | A1 A2 An 1)

Teorema de la probabilidad total. Si suponemos que los eventos A1, A2, A3, ...., An, forman una particin de un espacio muestral y su unin es . ; esto es, que los eventos Ai son mutuamente excluyentes

A1

A2

An

Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que : i) A1 A2 ii)


Ai
n

j ( disjuntos dos a dos)

i 1

iii) p( Ai ) 0 ,

i 1,....n .

La probabilidad de un suceso B cualquiera es:


n

p ( B)
i 1

p( Ai) p( B | Ai)

p ( B)

p( A1 ) p( B

A1

p( A2 ) p( B

A2

) ....... p( An ) p( B

An

Teorema de Bayes. El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir de probabilidades previas, se llama regla Bayesiana. Las

probabilidades apriori o previas se conocen antes de obtener informacin 107

alguna del experimento en cuestin. Las probabilidades aposteriori se determinan despus de conocer los resultados del experimento.

El teorema de Bayes consiste en un mtodo para encontrar la probabilidad de una causa especfica cuando se observa un efecto particular. Esto es, si el evento B ha ocurrido, Cul es la probabilidad de que fue generado por el evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?. Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que p( Ai ) 0 ,
i 1,....n , entonces para un suceso B cualquiera se verifica:

p( Ai | B)

p( Ai B) p( B)

p( Ai) p( B | Ai)
n i

, i = 1, ...., n.

p( Ai ) p( B | Ai) 1

p( Ai | B)

p( A1 ) p( B

A1

p( Ai ) p( B | Ai) p( A2 ) p( B ) ....... p( An ) p( B ) A2 An

Problemas Resueltos.

1) SUNAT realiza un estudio respecto a

tres cuentas de una empresa para

confirmar o descartar la presencia de irregularidades en el sistema de cobro de impuestos. a) Cual es el espacio muestral.

108

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

b) Cual es la probabilidad de que dos de las cuentas irregularidades.

presente

c) Cual es la probabilidad de que la primera cuenta presente irregularidades y la ultima no presente irregularidades. d) Cual es la probabilidad de irregularidades Solucin. Denotemos con P, si la cuenta presenta irregularidades y con N, si la cuenta no presente irregulardades. a) que por lo menos una cuenta presente

PP N3 , PP P , PN2 N3 , PN2 P , N1P P , N1P N3 , N1N2 P , N1N2 N3 1 2 1 2 3 1 1 3 2 3 2 3

b) Sea el evento A: Se presenta dos irregularidades

PP N3 , PN2 P , N1P P 1 2 1 3 2 3
p( A) n( A) n( ) 3 8

c) Sea el evento B: Primera cuenta presenta irregularidades y el ltimo no presenta.

PP N3 , PN2 N3 1 2 1
p(C ) n(C ) n( ) 2 8

d) Sea el evento D: Por lo menos una cuenta presenta irregularidades.

PP N3 , PP P , PN2 N3 , PN2 P , N1P P , N1P N3 , N1N2 P 1 2 1 2 3 1 1 3 2 3 2 3

p( D)

n( D ) n( )

7 8

2) Un administrador de empresas con el propsito de incrementar sus utilidades, disea tres estrategias de marketing A, B y C. En el 40% de las sucursales, se aplica la estrategia A , de estas en el 1% de los casos no se presentan

incrementos en las utilidades, en el 30% de las sucursales se aplica la estrategia B y en el 2% no se presentan incrementos en las utilidades. En el resto de las 109

filiales se utiliza la estrategia C, observndose que en el 3% de las mismas no se presentan incrementos en las utilidades. Si se selecciona aleatoriamente una

filial de la empresa. Cual es la probabilidad de que : a) b) c) No presente incrementos en las utilidades. No presente incrementos en la utilidad y se haya aplicada la estrategia B. La filial haya empleado la estrategia C, dado que no se presento

incremento en su utilidad. Solucin


No incrementa 1% 99% A 40% 2% Estrategia 30% 98% B 3% 30% C 97% Incrementa Incrementa No incrementa Incrementa No incrementa

Sean los eventos. A: La filial de la empresa, aplica la estrategia A B: La filial de la empresa , aplica la estrategia B C: La filial de la empresa , aplica la estrategia C D: No se presenta incrementos en la utilidad.

a) p( D)

p( A) p( D ) A

p( B) p( D ) B

p(C ) p( D ) C

p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) 0.019 1.9%

b) p(B

D) =p( B) p( D ) B
D) =0.3*(0.02) 0.006 0.6%

p(B

110

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

c) p(C | D)
p(C | D)

p(C D) p ( D)

p( A) p( D | A)

p(C ) p( D | C ) p( B) p( D | B) p(C ) p( D | C )

0.3*(0.03) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03)

0.473 47.3%

3) Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco divididos en 3 categoras y clasificados segn el pago de deudas bancarias. Pago de deudas bancarias Al da En mora A 7 9 CATEGORIAS B 6 8 C 12 8

Si se elige un comercio al azar cul es la probabilidad de que: a) est en mora? b) pertenezca a la categora A o B? c) pertenezca a la categora C o est en mora? d) pertenezca a la categora A y est en mora? e) Dado que el pago de sus deudas bancarias esta al da. Cual es la probabilidad de que la empresa pertenezca a la categora B?. Solucion. Sean los eventos: A: Comercio pertenece a la categora A. B: Comercio pertenece a la categora B. C: Comercio pertenece a la categora C. D: Pago deudas bancarias en mora. E: Pago de deudas al da. a) p( D) b) p( A
p( A B)

n( D ) n( ) B)

25 50

0.5 p( B)
0 50

p( A)

p( A
30 50 0.6

B)

n( A) n( )

n( B ) n( )

n( A B ) n( )

16 14 50 50

111

c) p(C
p(C D)

D)
20 50

p(C )

p ( D)
37 50

p(C
0.74

D)

n(C ) n( )

n( D ) n( )

n(C D) n( )

25 8 50 50

d) p( A

D)

n( A D ) n( )
P( B E ) P( E )

9 50

0.18

e) P ( B | E )

n( B E ) n( ) n( E ) n( )

n( B E ) n( E )

8 25

4) Se hizo una auditoria a tres empresas A, B, y C, para tal efecto se analiza 3 cuentas de la empresa A, 2 cuentas de la empresa B y 5 cuentas de la empresa C. La probabilidad de que se presenten irregularidades en las cuentas de la

empresa A es de 1/3, que se presente en B es de 2/3 y que se presente en C es de 1/7. Se analiza una cuenta aleatoriamente y se encuentra que hay irregularidades. Cul es la probabilidad de que se trate de la empresa C? Solucin Sean los eventos A: Cuentas de la s empresa A. B: Cuentas de la s empresa B. C: Cuentas de la s empresa C. E: La cuenta presenta irregularidades.

112

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

1/3

A
3/10

D 2/3 E

2/10

B D 1/7 C D

5/10

p(C | E )

p(C E ) p( E )

p( A) p( E | A)

p(C ) p( E | C ) p( B) p( E | B) p(C ) p( E | C )

p(C | E )

3 1 * 10 3 3 1 2 2 5 1 * * * 10 3 10 3 10 7

21 32.8% 64

Problemas Propuestos. 1.-Un auditor tiene sobre su mesa dos grupos de 20 facturas cada uno. En el primer lote hay dos facturas con errores de clculo y en el segundo tres. Una corriente de aire hace que las facturas caigan de la mesa y, al recogerlas, una del primer grupo se confunde en el segundo. Cul es la probabilidad de que, al revisar una factura del segundo grupo tenga un error?

2.- Mara Campos, gerente del departamento de crdito de un banco, sabe que la compaa utiliza 3 mtodos para conminar a pagar a las personas con cuentas morosas. De los datos que se tiene registrados, ella sabe que 70% de los deudores son visitados personalmente, 20% se le sugiere que paguen va telefnica y al restante 10% se le enva una carta. Las probabilidades de recibir alguna cantidad de dinero debido a los pagos de una cuenta con estos 3 mtodos son 0,75 0,60; y 0,65 respectivamente. La seorita Campos acaba de 113

recibir el pago de una de las cuentas vencidas. Calcular la probabilidad de que la peticin de pago se haya hecho: a. Personalmente b. Por telfono c. Por correo

3.- Una empresa compra cierto tipo de pieza que es suministrada por 3 proveedores: el 45% de las piezas son compradas al 1er proveedor resultando defectuoso el 1%, el 2do proveedor suministra 30% de las piezas y de ellas es defectuoso el 2%. Las restantes piezas provienen del 3er proveedor, siendo defectuoso el 3% de las mismas. En un control de recepcin de artculos se selecciona una pieza al azar y es defectuosa. Calcular la probabilidad de que la haya suministrado el 2do proveedor. 4.- Una compaa de ventas por correo tiene tres empleados de almacn denominados U, V y W quienes toman productos de la bodega y los ensamblan para la subsiguiente verificacin y empaquetado. U comete un error en un pedido (toma un producto equivocado o la cantidad equivocada del producto) una de cada 100 veces, V comete un error en un pedido 5 veces de cada 100 y W se equivoca tres de cada 100. Si U, V y W cubren respectivamente el 30%, el 40% y el 30% de todos los pedidos. Cul es la probabilidad de que si se encuentra un error en un pedido, ste haya sido cometido por V?

5. En una encuesta entre alumnos de maestra en administracin se obtuvieron los datos siguientes acerca de el principal motivo del alumno para solicitar su ingreso a la escuela donde est matriculado. Motivo Tipo est. Tiempo Calidad de la escuela 421 Costo o comodidad 393 76 Otros Totales 890

114

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

completo Tiempo parcial Totales 400 821 593 986 46 122 1039 1929

a. Si un alumno es de tiempo completo. Cul es la probabilidad de que la calidad de la institucin sea el principal motivo para elegir su escuela?. b. Si un alumno es de tiempo parcial. Cul es la probabilidad de que la calidad de la escuela sea el motivo para elegirla? c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que el alumno menciona que la calidad de la escuela es el 1er motivo de su solicitud. Son independientes los eventos A y B?. Justifique su respuesta.

6. Antes de que un libro sea lanzado al mercado se recogen las reacciones de un grupo de personas a las que se les permite leer el libro previamente. Posteriormente a las ventas del libro se les asigna el calificativo de altas, moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se muestran en la siguiente tabla: Reacciones Ventas Altas Moderadas Bajas 173 88 42 101 211 113 61 70 141 Favorables Neutral Desfavorables

a) Cul es la probabilidad de que las ventas sean altas? b) Cul es la probabilidad de que las reacciones sean favorables? c) Si la reaccin del grupo es favorable?. Cul es la probabilidad de que las ventas sean altas? d) Si las ventas son bajas Cual es la probabilidad de que las opiniones hayan sido desfavorables? e) Cul es la probabilidad de que las opiniones sean favorables y las ventas sean altas?

115

f) Cul es la probabilidad de que las ventas sean favorables o desfavorables?. Son esos sucesos mutuamente excluyentes? Justifique g) Son los sucesos Opiniones desfavorables y Ventas Bajas independientes? Justifique.

7. En un estudio realizado para un supermercado se clasifican los clientes en aquellos que visitan el establecimiento de una manera frecuente u ocasional y de acuerdo a la frecuencia en que adquieren cierto alimento. En la siguiente tabla se presentan las proporciones correspondientes a cada uno de los grupos. Compra de productos Frecuencia en las visitas Frecuentes No Frecuentes 0,12 0,07 0,48 0,06 0,19 0,08 Regular Ocasional Nunca

a) Cual es la probabilidad de que un cliente visite frecuentemente el supermercado y compre regularmente el producto alimenticio? b) Cul es la probabilidad de que un cliente que nunca compra el producto visite el supermercado frecuentemente? c) Son los sucesos Nunca compra productos alimenticios y Visita el mercado frecuentemente independientes?. Justifique. d) Cul es la probabilidad de que un cliente realice compras ocasionales? e) Cul es la probabilidad de que un cliente no realice nunca compras del producto? f) Cul es la probabilidad de que un cliente visite el establecimiento frecuentemente o compre el producto regularmente? 8. Un proceso se puede ejecutar con uno de tres algoritmos posibles, digamos A, B y C. En el 20% de los casos se emplea el algoritmo A, mientras que los

algoritmos B y C son usados el mismo nmero de veces. En algunas ocasiones

116

Estadstica para la toma de decisiones

Dr. Cleto De La Torre Dueas

en que se realiza el proceso se producen atrasos. Esto ocurre el 10% de las ocasiones en que se usa el algoritmo A, siendo estos porcentajes del 15% en el caso en que se aplica el algoritmo B y el 5% en el caso en que se usa el algoritmo C. a) En qu porcentaje de las ejecuciones del proceso no se producen atrasos? b) Qu porcentaje de los atrasos de las ejecuciones del proceso son atribuibles al algoritmo B? c) Elegida, al azar, una ejecucin Qu probabilidad hay que no tenga retraso en su ejecucin y corresponda al uso del algoritmo A o C? Entre las ejecuciones que no han sufrido retraso en su ejecucin, Cul es el porcentaje de las que corresponden al uso de los algoritmos A o C 9.- Las previsiones sobre la inflacin de un determinado pas para el prximo ao la sitan por debajo del 2% con probabilidad 0,65, entre el 2% y el 3% con probabilidad 0,25 y por encima del 3% con probabilidad 0,1. Si la probabilidad de crear ms de 700.000 empleos es de 0,7 con inflacin baja, de 0,4 cuando sta se sita entre el 2% y el 3% y nula en otro caso, calcule: a) La probabilidad de que se creen ms de 700.000 empleos. b) Si antes de conocer el dato de inflacin anual, se sabe que se han creado ms de 700.000 empleos, cul es la probabilidad de cada uno de los tres niveles de inflacin considerados? 10.- Una fbrica produce tres productos, 1, 2 y 3, cada uno de ellos en calidad extra y comercial. La probabilidad de producir una unidad de calidad extra en cada uno de esos productos es: 0,75, 0,5 y 0,8, respectivamente. A su vez esos productos se fabrican en las siguientes proporciones: 45%, 35% y 20%, respectivamente. Con esa informacin responda a las siguientes cuestiones: a) Si se selecciona al azar una unidad producida, cul es la probabilidad de que sea de calidad comercial? b) Si se selecciona al azar una unidad producida y es de calidad comercial, de qu producto es ms probable que sea?

117

11.- Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco divididos en 3 categoras y clasificados segn tengan o no deudas impositivas: Impuestos Al da En mora Categora A 7 9 Categora B 6 8 Categora C 12 8

Si se elige un comercio al azar cul es la probabilidad de que: a) est en mora? b) pertenezca a la categora A o B? c) pertenezca a la categora C o est en mora? d) Suponga que ahora se eligen 3 comercios al azar. Cul es la probabilidad de que todos estn al da con los impuestos?

12.- El personal del Bco. A atiende distintos tipos de consultas, de las cuales una parte corresponde a autorizaciones de giros en descubierto. Se observa que slo 30% de los clientes aceptan las condiciones del banco: el 35 % a la tasa normal y el resto a una tasa mayor. La mitad de los clientes que no aceptan indica que la tasa ofrecida es mayor a la normal. a) Calcular la probabilidad de que si se recibe una consulta, sta corresponda a operaciones en descubierto a tasa mayor. b) Si la ltima consulta sobre descubierto se ofreci a tasa mayor, cual es la probabilidad de que el cliente la acepte?

118

CAPITULO VI VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD.


6.1 Definicines Una variable aleatoria (v.a) X es cualquier funcin, que transforma cada elemento del espacio muestral , en un numero real.

X:

Al conjunto de posibles valores de X se le llama rango de X (Rx)

Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta. Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua. Funcin de Probabilidad. Si X es una v.a discreta, la funcin de probabilidad de X viene dada por:
PX x P X x P /X x

, tal que
x Rx

PX ( x) 1

Funcin de densidad 119

ESTADISTICA

Si X es una v.a continua, la funcin de densidad


b

de X es una aplicacin

fX :

0,

tal que P a

b
a

f X ( x)dx ,tal que

f X ( x)dx 1

Funcin de distribucin La funcin de distribucin de una v.a X esta dada por:

FX ( x)

P( X

x)

P(

/ X( )

x)

Propiedades. F es continua por la derecha y es creciente Si X es una v.a discreta , entonces P a Si X es una v.a continua , entonces P a Si X es una v.a continua , entonces F ' ( x) limx

X X

b b

F b F b
f ( x)

F a F a

P X

dF ( x) dx

FX ( x) 0 y limx

FX ( x) 1

Definicin.La esperanza o media de una variable aleatoria X, denotada por E ( X ) o


X

se

define segn sea la variable discreta o continua, mediante:

x.P X E X
x Rx

x , si X es discreta

x. f ( x)dx, si X es continua
x Rx

Propiedades: El valor esperado de una constante es dicha constante E a bX

a bE X

Definicin.La varianza de una variable aleatoria X cuya media o esperanza es como


V X
2 X

, se define

E X

2 X

E X

E X

E X

E2 X

Propiedades. 120

CLETO DE LA TORRE

La raz cuadrada de la varianza se llama desviacin estndar.


2 X

E X

2 X

V aX b

a2V ( X )

Desigualdad de Chebyshev. Si X es una variable aleatoria, entonces para cualquier k


P X
X

se cumple

1 k2

Ejercicio resuelto. 1. Sea X la variable aleatoria definida como la suma de los valores que aparecen al lanzar dos dados. a) Determine la distribucin de probabilidad. b) Calcule la probabilidad P(5<X<8) c) La media y su varianza. Solucin. a) Resultados en 1 2 3 4 5 6

los dos dados 1 2 3 4 5 6 2 3 4 5 6 7 3 4 5 6 7 8 4 5 6 7 8 9 5 6 7 8 9 10 6 7 8 9 10 11 7 8 9 10 11 12

X: Suma de los valores de los dos dados Rx P(X) 2 3 4 5 6 7 8 9 10 11 12

1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36

121

ESTADISTICA

b) c)

p(5

8)

p(6)

p(7) 5/ 36 6 / 36 11/ 36

Media

E X
x Rx

x.P X
4 36 5 36

x , si X es discreta
6 36 5 36 4 36 3 36 2 36 1 36

E X
E X

1 36 252 36

2 36

3 36

10

11

12

Varianza.
2 X

E X

E2 X

E X2
E X2

1 36 1974 36 22

32

2 36

42

3 36

52

4 36

62

5 36

72

6 36

82

5 36

92

4 36

102

3 36

112

2 36

122

1 36

2 X

E X

E2 X

1974 36

252 36

6.2

DISTRIBUCIONES IMPORTANTES. Existen, como en el caso de la ltima variable ejemplificada, otras variables cuyas funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para una serie de aplicaciones. Nosotros citaremos brevemente algunos de los modelos de mayor importancia.

DISTRIBUCIONES DISCRETAS. Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles resultados: xito y Fracaso. Sea p = P (xito).

Distribucin Binomial. La distribucin binomial aparece cuando se dan las condiciones siguientes: -Tenemos un experimento aleatorio simple, con una situacin dicotmica, es decir xito y Fracaso. - Repetimos este experimento simple n veces de manera independiente. 122

CLETO DE LA TORRE

X = Nmero de xitos en n experimentos independientes de Bernoulli. Funcin de Probabilidad:

PX x
Valor esperado: Notacin: X
X

n Cx p x 1 p

n x

, si x

0,1,2,..., n

0
2 X

, en otro caso.

np. Varianza:

np 1 p .

B(n, p).

Distribucin de Pascal o Binomial Negativa. Notacin: X

BN(r, p).

X = Nmero de ensayos (experimentos independientes de Bernoulli) hasta conseguir el r-simo xito. Funcin de Probabilidad:

PX x
Valor esperado:

1 Crx 1 1 p

x r

pr

, si x

r , r 1, r 2,...

, en otro caso.
2 X

r . Varianza: p

r1 p p2

Nota: Si r = 1, X se dice que es una variable aleatoria con distribucin geomtrica de parmetro p, y se le denota por X G(p).

Distribucin Hipergeomtrica. Notacin: X

H(N, M, n).

Considrese una poblacin de N elementos, M de los cuales son de un tipo A, y supongamos se extraen sin reemplazo una muestra de n elementos de esta poblacin. Entonces: X = Nmero de elementos de tipo A en la muestra. Funcin de Probabilidad:
M N C x Cn xM

PX x

N Cn

, si x

0,1,2,..., n

0
Valor esperado:
X

, en otro caso.
2 X

M . Varianza: N
123

M M 1 N N

N n . N 1

ESTADISTICA

Notas:
b 1. En PX se esta usando la convencin que Ca

0, si a > b.
X

2. Si la eleccin de la muestra fuera con reemplazamiento, entonces

B n, p

M . N

Distribucin de Poisson. La distribucin de Poisson aparece en situaciones en las que se cuenta el nmero de apariciones de un determinado suceso o bien en un intervalo de tiempo dado (como el nmero de partculas emitidas en un segundo por un material radioactivo, o el nmero de pacientes que llegan a un servicio en un intervalo de tiempo dado) o bien en un recinto fsico (como el nmero de fallos en un metro de alambre de hierro producido. X = Nmero de eventos en 0, t . Funcin de Probabilidad:
x

PX x
Valor esperado:

e x! 0
2 X

, si x

0,1,2,...

, en otro caso.

. Varianza:

DISTRIBUCIONES CONTINUAS.

Distribucin Uniforme. Notacin: X

U a,b .

Esta distribucin se da cuando la variable aleatoria X puede tomar indistintamente cualquier valor en el intervalo a, b . Funcin de densidad:

1 fX x b a

, si x

a, b

0 , en otro caso.
Valor esperado:
X

a b . Varianza: 2
124

2 X

b a2 . 12

CLETO DE LA TORRE

Distribucin Normal. Notacin: X Funcin de densidad:

N( ,

2).

fX x
Valor esperado: Nota: Cuando
X

1 2
2 X

e
2

. Varianza:
2

=0y

= 1, a X se le denota por Z y se le llama una variable N (0, 1). Toda v.a.

aleatoria con distribucin normal estndar; vale decir, Z normal X

N ( , 2) puede convertirse con una v.a. normal estndar

(estandarizarse) a travs de la transformacin:

EJERCICIOS RESUELTOS

1.- Un auditor analiza 10 facturas, se sabe que por estudios anteriores que el 25% de las facturas presentan algn tipo de error. Calcular la probabilidad de que: a) Exactamente 4 facturas presenten error. b) Ninguno de las facturas presenten error. c) Todos presenten error. d) Por lo menos 8 presenten error. e) A lo sumo 3 presenten error. f) Calcular la Media y varianza Solucin Consideremos los sucesos A = La factura presenta error, P (A) = 0.25
A = La factura no presenta error, P ( A ) = 0.75

Se trata de una distribucin Binomial de parmetros B (10, 0.25 ) Sea X la variable aleatoria que representa el nmero de facturas presenta error 125

ESTADISTICA

a) P(Exactamente 4 facturas presenten errores) =

PX

10 (0.25)4 (0.75)6 4

0.1460

b ) P (Ninguno presenten errores) = P X

10 (0.25)0 (0.75)10 0

0.0563

c) P(Todo presenten errores) = P X

10

10 (0.25)10 (0.75)0 10

d) P(Por lo menos 8 presenten error) = P X

PX

PX

PX

10

10 (0.25)8 (0.75)2 8

10 (0.25)9 (0.75) 0 9

0.005

e) P( A lo sumo 3 presenten error ) =


P X

PX

PX

PX

PX

10 (0.25)0 (0.75)10 0
f) Media y Varianza
np 10 (0.25)
2

10 (0.25)1 (0.75)9 1

10 (0.25)2 (0.75)8 2

10 (0.25)3 (0.75)7 3

0.7759

2.5

np(1 p) 10(0.25)(0.75) 1.875

2.-

El treinta por ciento de los administradores de supermercados utilizan estrategias de marketing. Si se selecciona siete administradores, determinar la probabilidad de que. a) Ninguno de los 7 utiliza estrategias de marketing. b) Todos utilizan estrategias c) Al menos 2 utilizan marketing Solucin Consideremos los sucesos: A = Utilizan software, P(A) = 0.3 126

CLETO DE LA TORRE

A = No utilizan software, P ( A ) = 0.7

Por tanto se trata de una distribucin Binomial de parmetros B (7, 0.3) Sea X la variable aleatoria que representa el nmero de administradores que utilizan estrategias de marketing. a) P X b) P X c) P X

7 (0.3)0 (0.7)7 0 7 (0.3)7 (0.7)0 7 1 PX 1 1 PX

0.0824

0.0002 7 (0.3)0 (0.7)7 0 7 (0.3)1 (0.7)6 1

PX 1 1

0.6705

3.- El Ingreso medio diario de los gerentes de empresas en una ciudad es 60 dlares y la desviacin tpica es $6 . Suponiendo que los ingresos estn distribuidos normalmente. a) Cual es la probabilidad de que un gerente tenga ingresos menores a $ 64 b) Cual es la probabilidad de que un gerente tenga ingresos de $57 a ms ? c) Cual es la probabilidad de que un gerente tenga ingresos mayores de $63? d) Cual es la probabilidad de que un gerente tenga ingresos entre $57 a $65 ? e) Cual es la probabilidad de que un gerente tenga ingresos menores de $50? f) Cual es la probabilidad de que un gerente tenga ingresos entre $64 a $70 ? g) Si en total hay 200 gerentes en esa ciudad, .Cuantos cabe esperar que presenten ingresos mayores a $57 y menores de $64? Solucin. X: Ingreso de los gerentes.
60 (Media poblacional)
6

(Desviacin)

a) P( X

64)

P(

64

P( Z

64 60 ) 6

P( Z

0.67)

127

ESTADISTICA

(0.67)

z=0.67

0.5

(0.67) 0.5 0.24857=0.74857=74.857%

b) P( X

57)

P(

57

P( Z

57 60 ) 6

P( Z

0.5)

(0.5) 0.5

(0.5)

z= 0.5

0.19146+0.5=0.69146=69.146%

c) P( X

63)

P(

63

P( Z

63 60 ) 6

P( Z

0.5) 0.5

(0.5)

(0.5)

z=0.5

0.5 0.19146=0.30854=30.854%

d) P(57

65)
X

P(

57

65

P(

57 60 6

65 60 ) 6

P( 0.50

0.83)

(0.50)

(0.83) 0.19146+0.29373=0.48519=48.519%

128

CLETO DE LA TORRE

(0.5)

(0.83)

e) P( X

50)

P(

50

P( Z

50 60 ) 6

(0.167)

0.5

(0.167) 0.5 0.0675=0.4325=43.25%

f) P(64

70)

P(

64

70

P(0.67

1.67)

(1.67)

(0.67) 0.45254-0.24857=0.20397=20.397%

g) P(57

64)

P(

57

64

129

z= 0.167

z= 0.50

z=0.83

P( Z

0.167)

P(

64 60 6

70 60 ) 6

z=0.67 z=1.67
(0.67) (1.67)

P(

57 60 6

64 60 ) 6

ESTADISTICA

P( 0.5

0.67)

(0.5)

(0.67) 0.19146+0.24857=0.44003=44.003%

Cabe esperar el 44.003% de los gerentes, es decir 0.44003* 200 88

EJERCICIOS PROPUESTOS 1.- La empresa de asuntos financieros Tax Service se especializa en las devoluciones de importes de impuestos federales. Una reciente auditora de las declaraciones indic que se cometi un error en el 10% de las que manifest el ao pasado. Suponiendo que tal tasa contine en este periodo anual y elabore 60 declaraciones. Cul es la probabilidad de que realice: a) Ms de 9 errores? b) Por lo menos 9 errores?

2.- Los salarios de los trabajadores en cierta industria son en promedio $11,9 por hora y la desviacin estndar de $0,4. Si los salarios tienen una distribucin normal. Cul es la probabilidad de que un trabajador seleccionado al azar: a) Reciba salarios entre $10,9 y $11,9? b) Reciba salarios inferiores a $11? c) Reciba salarios superiores a $12,95? d) Cul debe ser el salario menor que gana un trabajador que se encuentra entre el 10% de los trabajadores que ms ganan? e) Si el dueo de la industria va a aumentarle el salario al 15% de los trabajadores que menos ganan. Cul ser el salario mximo que deber ganar un trabajador para ser beneficiado con el aumento?

3.- El volumen de acciones negociadas en la Bolsa es normal con una media de 646 millones de acciones y una desviacin de 100 millones de acciones. a) Cul es la probabilidad de que el volumen negociado sea menor de 400 millones?

130

CLETO DE LA TORRE

b) Cul es la probabilidad de que el volumen negociado de acciones oscile entre las 400 y las 600 acciones? c) Si la Bolsa quiere emitir un boletn de prensa sobre el 5% de los das ms activos Qu volumen publicar la prensa?

4.- Se toma una muestra de 12 trabajadores de una gran empresa para estudiar su actitud frente a un cambio en el mtodo de trabajo. Si el 60% de todos los trabajadores de la empresa estn a favor del cambio. Cul es la probabilidad de que menos de 5 de los miembros de la muestra estn a favor?

5.- La tasa real de desempleo es de 15%. Suponga que se seleccionan al azar 15 personas en posibilidad de trabajar. a) Cul es la cantidad esperada de desempleados? b) Cul es la varianza y la desviacin estndar de los desempleados? c) Cul es la probabilidad de que al menos 3 estn desempleados? d) Cul es la probabilidad de que haya entre 3 y 5 desempleados?

6.- Se sabe que el 30% de los clientes de una tarjeta de crdito a nivel nacional dejan en cero sus saldos para no incurrir en intereses morosos. En una muestra de 8 poseedores de esa tarjeta: a) Cul es la probabilidad de que de 4 a 6 clientes paguen sus cuentas antes de incurrir en el pago de intereses? b) Cul es la probabilidad de que 3 clientes o menos paguen sus cuentas antes de incurrir en pago de intereses?

7.- Sabiendo que la recaudacin diaria de cierto comercio minorista se distribuye normalmente con un monto promedio de $830 y un desvo estndar de $125: a) Cul es la probabilidad de que maana se recaude menos de $885? b) Cul es la probabilidad de que maana se recaude ms de $600? c) En qu porcentaje de los das se recauda entre $700 y $800? d) En qu porcentaje de los das se recauda entre $900 y $1500? 131

ESTADISTICA

e) Cul es el monto no superado en el 20% de los das? f) Cul es el monto slo superado en el 30% de los das?

8.-Las ventas mensuales de un producto tienen distribucin normal. Se sabe que el 15% de los meses se venden menos de 1.500 unidades , mientras que el 7% de los meses las ventas superan las 1800 unidades. a) Definir la variable aleatoria e identificar sus parmetros. b) Cul es la probabilidad de que las ventas mensuales sean de 1600 unidades? c) Cul es la venta garantizada el 90% de los meses?

9.- La creciente recesin econmica lleva a las empresas a modificar, entre otras cosas, sus condiciones de pago. En cierta industria se determin que en el ltimo ao las cobranzas se realizaron a los 120 das fecha factura en promedio, con un desvo tpico de 20 das (sin considerar los incobrables y clientes en gestin judicial) y que la variable das de cobranza se distribuye normalmente. a) Si no varan las condiciones econmicas ni comerciales para el ao prximo cree que es muy probable que en la industria estudiada lleguen a cobrar a ms de 150 das? b) En cuntos das como mximo se espera cobrar el 85 % de las operaciones ? c) Si la ltima cobranza se efectiviz en un plazo inferior al promedio de das, cul es la probabilidad de que la empresa haya cobrado despus de los 100 das ?

10.- El costo de un producto que se procesa en forma automtica est formado por el costo de los materiales del envase (0,07 m /unidad) y el costo del producto en s mismo (5 gramos/unidad), tomndose como unidad el envase de presentacin. Debido a ciertas fluctuaciones, dichos costos son variables aleatorias independientes que pueden considerarse normalmente distribuidas: - el costo de materiales (x) con media 180$/m y desvo estndar de 2$/m . - el costo del producto (y) con media 20$/gramo, y desvo estndar de 1,5 $/gramo. a) Cul es la probabilidad de que el costo del producto de una unidad supere los $ 122? b) Cul es la probabilidad de que el costo de un pack de 25 unidades supere los 2950$? 132
2 2 2

CLETO DE LA TORRE

CAPITULO VII INTRODUCCION AL MUESTREO


7.1 INTRODUCCION. El objetivo de la estadstica es hacer inferencias acerca de una poblacin con base en la informacin contenida en una muestra. Este mismo objetivo motiva el estudio del problema de muestreo. Consideraremos el problema particular del muestreo de una poblacin finita (coleccin finita de mediciones). En lo referente al muestreo, la inferencia consiste en la estimacin de un parmetro de poblacin, tal como una medida, un total o una proporcin con un lmite para el error de estimacin (precisin). Para un buen entendimiento del problema de muestreo, introduciremos enseguida, ciertos aspectos tcnicos comunes a las encuestas de muestreo. 7.2 DEFINICION DE TRMINOS, REVISIN DE CONCEPTOS. Poblacin (UNIVERSO): Es una coleccin finita o infinita de individuos o elementos. No necesariamente se refiere a una coleccin de organismos vivientes. En el muestreo, usualmente se distingue el significado de los trminos universo y poblacin, indicando con el primero un conjunto de elementos, individuos, unidades, seres y objetos, y con el segundo un conjunto de mediciones de los mismos. 133

ESTADISTICA

Una tarea importante para el investigador es definir cuidadosa y completamente la poblacin antes de recolectar la muestra. La definicin debe contener una descripcin de los elementos que sern incluidos y una especificacin de las mediciones que se van a considerar, ya que estas dos componentes estn interrelacionadas. Muestra: Es un subconjunto de la poblacin. Una muestra puede ser probabilstica (aleatoria) o no probabilstica.

Unidad de Muestreo: Es una coleccin de uno o ms elementos de la poblacin. Las unidades de muestreo cubren toda la poblacin. Una unidad de muestreo debe ser claramente definida, identificable y observable.

Unidad Reportante: Es la que suministra la informacin estadstica requerida o de la cual la informacin la informacin puede ser convenientemente averiguada.

Marco de Muestreo: Se presenta en forma de lista o mapa de las unidades de muestreo que conforman la poblacin. Forma el material bsico para la seleccin de la muestra. El marco muestral debe contener todas las unidades de muestreo que conforman la poblacin bajo estudio, y debe excluir unidades de cualquier otra poblacin.

Parmetro: Es un valor numrico de la poblacin usualmente desconocido que representa cierta caracterstica de la poblacin.

Estadstico: Es una funcin real de la muestra aleatoria, usado para estimar un parmetro, si un parmetro se denota con , el estimador se denotar con .

Estimacin: Es el valor que toma el estimador en los datos de la muestra.

Error de Estimacin: Es la diferencia absoluta entre el parmetro y su estimador, es decir |

| . Como se puede apreciar, es imposible conocer con exactitud el


134

CLETO DE LA TORRE

error de estimacin, pero podemos, al menos aproximadamente encontrar un lmite E tal que:

P(|
Para cualquier entre 0 y 1.

| E)

Si tiene distribucin aproximadamente normal, entonces para


E 1.96 V ( ) se cumple:

P(|

| E) 0.95

Limite para el error de estimacin: Denotado por E es dado por E 1.96 V ( ) . El factor E es llamado tambin precisin. Si E esta expresado en las mismas unidades de la medida de la variable, se le llama precisin absoluta. Si E est expresado como un porcentaje del parmetro que se est estimando, se le llama precisin relativa. Una ves estimado el lmite E, podemos afirmar que el parmetro el intervalo
E, E

se encuentra en

con una confianza del 95%. El intervalo anterior es

llamado intervalo de confianza.

Error de Muestreo: Este error se debe a que una muestra no produce informacin completa sobre una poblacin. Puede ser controlado por un diseo cuidadoso de la muestra y es estimado en gran parte por el factor E. Por esta razn, algunos autores denominan al factor E, error de muestreo.

Error de no Muestreo: Son los errores que se introducen imperceptiblemente a la encuesta y estos son ms difciles de controlar, infortunadamente estos errores no se pueden medir fcilmente, y aumentan a medida que aumenta el tamao de la muestra. Los tipos errores no muestrales que suelen presentarse son: Definicin equivocada del problema. Definicin defectuosa de la poblacin. Marco imperfecto o desactualizado. 135

ESTADISTICA

La no respuesta. El sesgo de respuesta. Diseo pobre del instrumento de medicin.

Sin embargo, los errores de no muestreo pueden ser controlados mediante una atencin cuidadosa en todas las etapas de la encuesta.

7.3

ENCUESTA. La funcin de la encuesta es la medicin del comportamiento, actitudes o caractersticas del encuestado, que es un individuo de la poblacin en estudio seleccionado para la muestra.

Diseo de la encuesta Pasos a seguir: Definir los objetivos Determinar el marco Disear el procedimiento de muestreo Disear el cuestionario Disear y realizar el trabajo de campo Codificar, depurar y analizar las respuestas Redactar el informe

Diseo de la muestra El diseo de la muestra incluye: La eleccin del procedimiento de muestreo La determinacin del tamao de la muestra

Existen varios procedimientos de muestreo, entre las principales se tiene muestreo: aleatorio simple, estratificado y sistemtico.

136

CLETO DE LA TORRE

7.4

MUESTREO ALEATORIO SIMPLE Definicin. Si una muestra de tamao n, es seleccionado de una poblacin de tamao N de tal manera que cada muestra posible tiene la misma probabilidad de ser seleccionada, el procedimiento de muestreo se llama Muestreo Aleatorio Simple (M. A. S.) El M. A. S. puede ser de 2 formas, sin preposicin (muestreo irrestricto aleatorio) y con reposicin. Procedimiento de seleccin. El procedimiento de seleccin de una Muestra Aleatoria Simple (M.A.S.) consiste en: i) ii) Enumerar las unidades de la poblacin, desde 1 hasta N. Usando la tabla de nmeros aleatorios seleccionar la primera unidad para la muestra. iii) Continuar la seleccin excluyendo las unidades repetidas (si es sin reposicin) o incluyendo las unidades repetidas (si es con reposicin) hasta completar el tamao de muestra n.

Tamao de la muestra Una parte fundamental para realizar un estudio estadstico de cualquier tipo es obtener unos resultados confiables y que puedan ser aplicables. Como ya se coment anteriormente, resulta casi imposible o imprctico llevar a cabo algunos estudios sobre toda una poblacin, por lo que la solucin es llevar a cabo el estudio basndose en un subconjunto de sta denominada muestra. Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es necesario que tal subconjunto de datos, o muestra, posea algunas caractersticas especficas que permitan, al final, generalizar los resultados hacia la poblacin en total.

Esas caractersticas tienen que ver principalmente con el tamao de la muestra y con la manera de obtenerla. El muestro, implica algo de incertidumbre que debe

137

ESTADISTICA

ser aceptada para poder realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo en ocasiones demasiado grande. Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: - El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. - El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. - El nivel de variabilidad que se calcula para comprobar la hiptesis.

1.

Tamao de muestra para Estimar , con precisin fijada por el investigador, el tamao de

Si se desea estimar

muestra necesario es dado por:


n
2 Z (1 2 Z (1 / 2) / 2) 2

*N

2 2

( N 1)

Poblacin finita.

2 Z (1

/ 2)

*
2

, Poblacin infinita.

Donde
2

Es la varianza poblacional
2

En la practica el valor de de una muestra piloto.

estimado por S2 a partir de una encuesta anterior o

2.

Tamao de la muestra para estimar P.

De manera simular, la frmula del tamao de muestra n para la estimacin de p con error mximo de estimacin de 100(1 - )%:
n Z
2 Z (1 2 (1 / 2) / 2)

y un nivel de confianza del

* N * p(1 p)
2

* p(1 p) ( N 1)

, Poblacin finita.

y si N

138

CLETO DE LA TORRE

2 Z (1

/ 2)

* p (1 p )
2

Poblacin infinita.

En este caso el valor de

esta entre 0 y 1, el valor de P es desconocido, por lo que

debe ser estimado preliminarmente a partir de una encuesta anterior, o de una muestra piloto. En ltima instancia el valor de P se puede sustituir por 0.5 y se obtendr un tamao de muestra mayor que el requerido.

Recomendaciones para el uso del M. A. S. Generalmente el M. A. S. Esta orientada a encuestas de pequea escala y raras veces a encuestas de gran escala, debido a que otros diseos proporcionan mayor o igual precisin a menor costo. En las encuestas por muestreo a gran escala, el M. A. S. es usado como parte de un diseo de muestreo mucho ms complejo. El M. A. S. es muy eficiente cuando la poblacin es homognea.

7.5

MUESTREO ESTRATIFICADO. Una muestra estratificada es la obtenida mediante la separacin de los elementos de la poblacin en grupos heterogneos disjuntos, llamados estratos y la seleccin posterior de una muestra aleatoria simple en cada estrato. Consideremos una poblacin de tamao N, la cual es dividida en k estratos (sub poblaciones) de tamaos Ni, i=1,2., k, tal que N

N1 N2 ... Nk

N1

N2

NK

El tamao de muestra se estima mediante:

139

ESTADISTICA

Z n
2

2 (1 2

/ 2)

*
i 1 2 (1

Ni2 pi (1 pi ) / wi
k

/ 2)

*
i 1

Ni pi (1 pi )

es wi el % de observaciones asignados al estrato i El tamao de muestra necesario de cada estrato, se puede obtener por afijacin proporcional al tamao de cada estrato, es decir:
ni n* Ni N n * wi , i 1,..., k

Cuando se realiza un muestreo estratificado, los tamaos muestrales en cada uno de los estratos, ni, los elige quien hace el muestreo, As en un estrato dado, se tiende a tomar una muestra ms grande cuando: - El estrato es ms grande; - El estrato posee mayor variabilidad interna (varianza); - El muestreo es ms barato en ese estrato. 7.6 MUESTREO SISTEMATICO Definicin.- Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y despus cada k-simo elemento, se denomina muestra sistemtica de intervalo de seleccin k. El muestreo sistemtico puede ser de dos formas, muestreo sistemtico simple y muestreo sistemtico circular. Procedimiento de seleccin del muestreo sistemtico simple. Una muestre sistemtica simple se obtiene cuando el intervalo de seleccin k es exactamente un numero entero. El procedimiento de seleccin de una muestra sistemtica simple consiste: i) Las unidades del marco deben ser ordenados en magnitud de acuerdo con algn esquema de ordenacin (poblacin ordenada) es base al orden se establece la numeracin desde 1 hasta N ii) Determinar el intervalo de seleccin k
N (k exactamente un numero entero) n

140

CLETO DE LA TORRE

iii)

Seleccionar un numero aleatorio entre 1 y k (arranque aleatorio) sea a el arranque aleatorio elegido, entonces los elementos de la muestra sistemtica, son los que ocupan las posiciones en el marco: a, k+a, 2k+a, 3k+a,......(n-1)k+a

141

ESTADISTICA

EJERCICIOS RESUELTOS 1. Un empresario dedicado al rubro de pizzera, desea hacer una estimacin del gasto que realizan las personas en pizza por semana, con 99% de confianza, suponiendo que el mximo error permitido es de un soles, adems de una muestra piloto se obtuvo una varianza de 25. Tambin se sabe la ciudad tiene 2500 ciudadanos Que tamao de muestra necesitara para investigar? Solucin.

N
n

2500,
2 Z (1 2 Z (1 / 2)

1,
/ 2) 2

25, Z(1
2 2

/ 2)

2.58
2.582 * 2500* 25 156.08 157

*N

( N 1)

2.582 * 25 (2500 1) 1

2.

Las compaas de auditora generalmente seleccionan una muestra aleatoria de los clientes de una banco y verifican los balances contables reportados por el banco. Si una compaa de este tipo se encuentra interesada en estimar la proporcin de cuentas para las cuales existe una discrepancia entre el cliente y el banco, cuntas cuentas debern seleccionarse del banco si esta tiene 25000 clientes, de manera tal que con una confianza del 95% la proporcin muestral se encuentre a no ms de 5% unidades de la proporcin real?. Solucin. Consideremos que no se tiene ningn estudio de este tipo, por tanto P 0.5 , del problema: N
n Z
2 Z (1 2 (1 / 2)

25000,
/ 2)

0.05, z(1

/ 2)

1.96

* NP(1 P)
2

* P(1 P) ( N 1)

1.962 *25000*0.5(1 0.5) 1.962 *0.5(1 0.5) (25000 1) 0.05


2

378.361 379

142

CLETO DE LA TORRE

3.

El administrador de una empresa A desea hacer un estudio de investigacin de mercado en cierta regin, respecto al posicionamiento que tiene su marca, con un nivel de confianza del 95% y un error del 5%. Suponiendo que en estudio realizado hace 10 aos, el nivel de posicionamiento de su marca es de 15% Cual debe ser el tamao de muestra para este estudio?

Solucin. La poblacin materia de estudio, no es finita, por tanto la relacin para estimar el tamao de muestra es:
n
2 Z (1 / 2)

* P (1 P )
2

Del problema se tiene los siguientes datos

P 0.15,
n

0.05, z(1
2

/ 2)

1.96

1.962 *0.15(1 0.15) 0.05

195.92 196

4.

Se desea lanzar un nuevo producto al mercado, para ello usted tiene que realizar un estudio de la demanda de este producto. Suponiendo que esta ciudad se divide en tres distritos, cuyo tamao poblacional se muestra en el cuadro siguiente: Distrito A B C Total Tamao de poblacin. 2000 1200 5000 8200

Considere que el tamao de muestra es 245, calcule el tamao de muestra por cada ciudad, necesario para este estudio. Solucin. En este ejemplo, los distritos forman los estratos:

143

ESTADISTICA

Ciudad A B C Total n=245. Usando la relacin,


ni n* Ni N

Ni 2000 1200 5000 N=8200

wi =2000/8200=0.24 =1200/8200=0.15 =5000/8200=0.61 1

n * wi , i 1,..., k , Se determina el tamao de muestra para cada

distritos.
nA nB n* NA N NB N n * wA n * wB 0.24*245 59.76 60

n*

0.15*245 35.85 36

nC

n*

NC N

n * wC

0.61*245 149.39 149

EJERCICIOS PROPUESTOS. 1. SUNAT tiene previsto realizar una auditoria a cuentas de un grupo de

empresas con la finalidad de estimar la proporcin de empresas que presentan desbalance financiero cuntas cuentas empresas debern seleccionarse de

manera tal que con una confianza del 99% la proporcin muestral se encuentre a no ms de 0.02 unidades de la proporcin real?. 2. Unos grandes almacenes tienen 1000 empleados en uno de sus centros. Calcular el tamao muestral necesario para estimar su salario anual medio con un error mximo de 80 soles para un nivel de confianza del 95%. (Por estudios anteriores se sabe que el salario anual sigue una distribucin normal con desviacin tpica de 70 soles). 3. Una tienda se interesa en estimar su volumen de ventas diarias. Supngase que el valor de la desviacin tpica es de 50 soles. Si el volumen de ventas se puede modelizar por una distribucin normal, cul debe ser el tamao de la muestra 144

CLETO DE LA TORRE

para que con una confianza del 95% la media muestral se encuentre a no ms de 20 soles del verdadero volumen medio de ventas? 4. Se esta realizando una auditoria respecto al incumplimiento de entrega de

facturas en un regin que tiene 4 provincias (A, B, C y D). Se sabe tambin que la provincia A tiene el 45% de la poblacional regional, la provincia B 10%, la provincia C el 22% y la provincia D el resto de la poblacin regional. Determine el tamao de muestra para este estudio, suponiendo que la regin tiene 12000 centros comerciales.
5.

Para un mercado de prueba, encuentre el tamao de muestra necesario para estimar proporcin real de consumidores satisfechos con un cierto producto nuevo, dentro de 0,04 nivel de confianza de 90%. Suponga que no tiene una buena idea del valor de la proporcin.

6.

Una tienda local vende bolsas de plstico para basura y ha recibido unas cuantas quejas con respecto a la resistencia de tales bolsas. Parece ser que las bolsas que se venden en la tienda son menos resistentes que las que vende su competidor y, en consecuencia, se rompen ms a menudo. Gustavo, gerente encargado de adquisicin, est interesado en determinar el peso mximo promedio que puede resistir una de las bolsas para basura sin que se rompa. Si la desviacin estndar del peso lmite que puede aguantar una bolsa es de 1,2 Kg., determine el nmero de bolsas que deben ser probadas con el fin de que Gustavo tenga una certeza de 95% de que el peso lmite promedio est dentro de 0,5 Kg., del promedio real.

7.

Elena acaba de adquirir un programa de computacin que afirma escoger acciones que aumentarn su precio durante la semana siguiente con un ndice de precisin de 85%. En cuntas acciones deber Elena probar el programa con el fin de estar 98% segura de que el porcentaje de acciones que realmente subirn de precio durante la semana prxima estar dentro de 0,05 de la muestra de la poblacin?.

8.

Se planea una investigacin para determinar los gastos mdicos familiares promedios por ao. La administracin de la compaa desea tener 95% de confianza de que el promedio muestral es correcto dentro de $50 del promedio

145

ESTADISTICA

real familiar. Un estudio piloto indica que la desviacin estndar se puede estimar como $400. Qu tamao de muestra se requiere?
9.

El Gerente de un banco desea 90% de confianza de tener un resultado correcto dentro de 0,05 de la proporcin de la poblacin real de ahorradores que tienen cuantas de ahorros y de cheques en el banco. De cuntos ahorradores debe ser su cuenta?

10.

Un grupo de consumidores desea estimar el monto de facturas de energa elctrica para el mes de julio para las viviendas unifamiliares en una ciudad grande. Con base a estudios realizados en otras ciudades se supone que la desviacin estndar es de 25 dlares. El grupo desea estimar el monto promedio para le mes de julio de 5 dlares del promedio verdadero con 99% de confianza. Qu tamao de muestra se necesita?

146

CLETO DE LA TORRE

CAPITULO VIII ESTIMACION POR INTERVALOS Y PRUEBAS DE HIPOTESIS


8.1 DISTRIBUCIONES MUESTRALES. DISTRIBUCION NORMAL. En este capitulo abordaremos el estudio de la distribucin normal y de otras distribuciones asociadas a funciones de una muestra al azar de esta variable. El porque de la importancia de la distribucin normal se ilustra a travs de las siguientes propiedades y distribuciones. PROPOSICION 1. Teorema del limite central (TLC). Si X1 , X 2 ,..., X n son n v.a.s independientes, donde cada Xi tiene la misma distribucin de valor esperado entonces para n suficientemente grande (en la prctica n aproximadamente y varianza
2,

30) se cumple que

n X i 1 i

X / n

N (0, 1). B (n, p) y n es

2. Aproximacin de la Binomial por la Normal. Si X suficientemente grande, entonces aproximadamente:

X np np 1 p
147

N (0, 1).

ESTADISTICA

Aqu, para el clculo de probabilidades, se recomienda utilizar la llamada correccin por continuidad: Si a aproximadamente: b son dos nmeros naturales, entonces

Pa

1 P a 2

1 b 2

Fz

1 2

np

np 1 p

Fz

1 2

np

np 1 p

LA DISTRIBUCION CHI-CUADRADO. Una v.a. X tiene distribucin chi-cuadrado con n grados de libertad, y se le denota por X
2

(n).

PROPOSICION. 1. Si Z N (0, 1), entonces Z2


2

(1).
2 1 2 2

2. Propiedad reproductiva. Si

...

2 k

son k variables aleatorias

independientes con distribuciones chi-cuadrado de respectivamente n1 , n2 ,..., nk grados de libertad, entonces


k 2 i 1 2 i

Es tambin una v.a. con distribucin chi-cuadrado de n libertad. 3. Si X1 , X 2 ,..., X n es una m.a de X N ( , 2), entonces

k n i 1 i

grados de

n 1 S2
2

(n -1).

LA DISTRIBUCION T DE STUDENT. Una v.a. X tiene distribucin t de Student con n grados de libertad, y se le denota por X t(n).

PROPOSICION. 1. Sea X 2. Si Z t(n). Si n es grande, entonces aproximadamente X N (0, 1) y


2

N (0, 1).

(n) son v.as independientes, entonces

148

CLETO DE LA TORRE

Z
2

t(n). En particular, dada una m.a. X1 , X 2 ,..., X n de X

N ( , 2), se

cumple que:

X S/ n

t (n -1).

LA DISTRIBUCION F DE FISHER. Una v.a. X tiene distribucin F de Fisher con n grados de libertad en el numerador y m grados de libertad en el denominador, y se le denota por X PROPOSICION. 1. Si X 2. Si
2 1
2 1 2 2

F (n, m).

F (n, m), entonces


2(n)

1 X

F (m, n). son v.as independientes, entonces N ( 1,


12),

2 2

2(m)

/n /m

F (m, n). En particular, si X1 , X 2 ,..., X n es una v.a. de X N ( 2,


22),

e Y1 , Y2 ,...,Ym una m.a de una v.a. Y entonces

donde X e Y son independientes,

S12

2 2 2 S 2 12

F (n -1, m - 1),

2 2 Siendo S1 y S 2 las varianzas muestrales asociadas a las poblaciones estadsticas

determinadas por X e Y, respectivamente. Nota: La distribucin normal estndar, t de Student, chi-cuadrado y F de Fisher poseen todas tablas en la que se tabulan algunos valores de su funcin de distribucin.

8.2

INTERVALOS DE CONFIANZA. Cuando tratamos la estimacin puntual, uno de los problemas que se plantearon es que el valor de la estimacin es solo uno de los valores (posiblemente infinitos) 149

ESTADISTICA

del estimador, obtenido al extraer una muestra concreta, de forma que si extraemos dos muestras distintas, las estimaciones sern distintas. Al hacer cualquier estimacin se est cometiendo un error, y seria deseable proporcionar una medida de la precisin de la estimacin del parmetro. En este tema vamos a introducir el concepto de intervalo de confianza como un intervalo cuyos extremos son variables que dependen de la muestra, y en el cual se confa que est el valor de parmetro. El intervalo se obtendr a partir de un estadstico generalmente relacionado con un estimador puntual, cuya distribucin no depende del parmetro desconocido, y una medida de la validez del intervalo es el nivel de confianza, que indica la proporcin de intervalos de todos los que se podran construir a partir de muestras distintas, que realmente contienen al parmetro.

Definicin. Un intervalo de confianza (IC) al 100(1 - )% para un parmetro poblacional de

una v.a. X es un intervalo con estadsticas L1 y L2 en los extremos (IC = L1, L2 ) tal que P L1

L2

Intervalo de confianza para la media El IC al 100(1 pivote a Z )% para , cuando


2

es conocida, se obtiene usando como

X / n

N (0, 1) y vienen dado por


X z1 X z1

Donde z1

denota al valor de la distribucin normal estndar, X es el valor de


2

la media muestral.

150

CLETO DE LA TORRE

1
/2 /2

Z(1
El IC al 100(1 pivote a T )% para , cuando
2

Z(1
es desconocida se obtiene usando como

X S/ n
X

t (n -1) y vienen dado por


t(1 S n X t(1 S , n

, n 1) 2

, n 1) 2

1
/2 /2

t(1
Donde t1
2
n

t(1

n 1 denota al valor de la distribucin t de Student con n 1 grados de


xi x
2

libertad y la varianza muestral dado por S 2

i 1

n 1

Intervalo de confianza para la varianza El IC al 100(1 - )% para 1) y vienen dado por :


2,

se obtiene usando como pivote a W

n 1 S2
2

(n -

n 1 S2
2 1

n 1 S2
2
2

n 1
2

n 1

151

ESTADISTICA

2 ( /2)

2 (1

/2)

Donde

2
2

n 1 y

2 1

n 1 denotan
2

a los

valores en la distribucin chi-

cuadrado con n 1 grados de libertad y la varianza muestral dado por:


n

xi S2
i 1

n 1

Intervalo de confianza para la razn de dos varianzas El IC al 100(1 )% para


2 1

2 1

2 2

2 2

, se obtiene usando como pivote a

S12 / 2 S2 /

2 1 2 2

F n1 1, n2 1 y vienen dado por

S12 f 2 S2
Donde

/ 2, n2 1, n1 1

2 1 2 2

S12 f 2 1 S2

/ 2, n2 1, n1 1

/ 2, n2 1, n1 1 y

f1

/ 2, n2 1, n1 1 denotan a los valores en la distribucin

2 F. S12 y S2 son las varianzas de dos muestras aleatorias independientes de tamaos

n1 y n2

Intervalo de confianza para la diferencia entre dos medias. El IC al 100(1 - )% para pivote a z
1 2

, cuando

2 1

2 2

es conocida se obtiene usando como

X1

X2 (
2 1

1 2 2

y vienen dado por:

n1

n2

152

CLETO DE LA TORRE

( X1

X 2 ) z(1

/ 2) *

2 1

2 2

n1

n2

( X1

X 2 ) z(1

/ 2) *

2 1

2 2

n1

n2

Intervalo de confianza para la proporcin p El IC al 100(1 - )% para p , se obtiene usando como pivote a

p1 p n

N (0, 1),

y vienen dado por:

p z1

p1 p n

p z1

p1 p n

Intervalo de confianza para la diferencia entre dos proporciones p1 El IC al 100(1 - )% para p1

p2

p2 , se obtiene usando como pivote a

( p1

p2 ) ( p1
p1 1 p1 n1

p2)
N (0, 1),

p2 1 p2 n2

y vienen dado por:

( p1 p2 ) z1 *
2

p1 1 p1 n1

p2 1 p2 n2

( p1 p2 ) ( p1 p2 ) z1 *
2

p1 1 p1 n1

p2 1 p2 n2

RESUMEN DE INTERVALO DE CONFIANZA. 153

ESTADISTICA

Intervalos de confianza de: La Media Si se asume pero n 30 La Media Si se asume que desconocido La diferencias de Medias
2 1 y 2 2 Conocidos
2 2

Limite inferior
X X z1 z1 n S n
, n 1)

Limite Superior
X X
S n

conocido

z1 z1

n S n
, n 1)

-Nota: Si la poblacin no es normal

es

t(1

t(1

S , n

( X1

X2)

z(1

/ 2) *

2 1

2 2

n1

n2
2 S2 n2

( X1

X2)

z(1

/ 2) *

2 1

2 2

n1

n2
2 S2 n2

--Nota: Si las poblaciones no son normales pero n1 30 y n2 30

( X1

X2)

z(1

/ 2) *

S12 n1

( X1

X2)

z(1

/ 2) *

S12 n1

La diferencia de Medias Asumiendo que: desconocidos


2 1 2 2 y

( X1 ( X1 X 2 ) t0 * S p
n1 1
2 S1

X 2 ) t0 * S p

1 n1
2 S2

1 n2

1 n1

1 n2

to t(1

/ 2,n1 + n 2 -2)

Sp
La diferencia de Medias
2 1 2 2 y desconocidos

n2 1 n1 n2 2
/ 2, v ) *

( X1

X 2 ) t(1
2 S1 n1 2 / n )2 ( S1 1 n1 1

S12 n1

2 S2 ( X1 n2

X 2 ) t(1

/ 2, v ) *

S12 n1

2 S2 n2

v
La varianza

2 S1 2 ) n1 2 ( S 2 / n2 ) 2 n2 1

n 1 S2
2 1

n 1 S2
2
2

n 1
2

n 1

La razn de varianzas.

S12 f S22
p z1

/ 2, n2 1, n1 1

S12 f 2 1 S2
p z1

/ 2, n2 1, n1 1

La proporcin

p1 p n

p1 p n

154

CLETO DE LA TORRE

La diferencia de proporciones

( p1 p2 ) z1 *
2

p1 1 p1 n1

p2 1 p2 n2

( p1 p2 ) z1 *
2

p1 1 p1 n1

p2 1 p2 n2

EJERCICIOS RESUELTOS 1.- En una muestra de 250 empresas se estimo el monto de recaudacin en un da, obtenindose un monto medio de 5900 soles y una desviacin tpica de 94 soles. Obtener un intervalo de confianza (al 95%) para el monto medio de recaudacin diaria. Solucin.

250, X

5900,

94, z1

1.96
2

Reemplazando en la relacin
X z1
2

z1

1
/2 /2

Z(1
5900 1.96
5888.34

Z(1
5900 1.96 94 250

94 250
5911.65

2.

Se realizo un estudio

en 30 minimercados sobre

el pago por derecho de

impuestos, obtenindose un pago medio de 256 soles y un desvo de 32 soles. Encontrar el intervalo de confianza para el 95%. Solucin.

30, X

256, s

32, t(1

, n 1)

2.045

155

ESTADISTICA

Reemplazando en la relacin
X t(1
, n 1) 2

S n

t(1

, n 1) 2

S 32 , 256 2.045 n 30

256 2.045

32 30

244.05

267.9

3.

Un investigador entrevisto a 200 profesionales sobre el conocimiento que estas tienen de la inversin en la bolsa de valores de Lima, de los cuales 140 afirman que conocen adecuadamente. Construir un intervalo de confianza del 95% para la proporcin de profesionales que conocen aspectos de inversin de BVL. Solucin.
p 140 200 0.7 , z1
p1 p n
2

1.96 , n=200

p z1

p p z1
p

p1 p n
0.7(1 0.7) 200

0.7 1.96
4.

0.7(1 0.7) 200

0.7 1.96

SUNAT con el propsito de incrementar la recaudacin fiscal, disea dos sistemas (A y B) de control para cumplimiento de entrega de facturas o boletas. El sistema A, se utiliza para controlar a 250 empresas, el sistema B a 200 empresas. Despus de un periodo de vigilancia de los sistemas se observo que 75 empresas vigiladas con el sistema A no entregan boletas o facturas A y 80 vigiladas con el sistema B tambin incumplieron con la entrega de facturas. Utilizando un intervalo de confianza del 95% Se puede aceptar que los dos sistemas presentan similar eficiencia ?

Solucin. Sistema A
p1 75 250 0.3 , n1

250

Sistema B

156

CLETO DE LA TORRE

p2

80 200

0.4 , n1

200

z1

1.96
2

( p1

p2 ) z1 *
2

p1 1 p1 n1

p2 1 p2 n2

( p1

p2 ) ( p1

p2 ) z1 *
2

p1 1 p1 n1

p2 1 p2 n2

(0.3 0.4) 1.96*

0.3 1 0.3 250

0.4 1 0.4 200

( p1 p2 ) (0.3 0.4) 1.96*

0.3 1 0.3 250

0.4 1 0.4 200

-0.18 ( p1 p2 ) -0.011
El intervalo contiene solo valores negativos, entonces.

( p1 p2 ) 0
nivel de eficiencia que el sistema B.

p1 p2

De la relacin anterior se concluye que el sistema de control A presenta menor

5.

Se realizo un estudio sobre las utilidades que presenta una empresa en dos provincias del Per ,con tal fin se selecciona aleatoriamente un grupo de 50 cuentas de la provincia A y 40 c de cuentas de la provincia B, observndose que en promedio en la ciudad A se genera una utilidad de 13 miles de soles y 15 miles de soles en la ciudad B y las desviaciones estndar de la ciudad A y B

respectivamente son 3 y 4 miles de soles. Utilizando un intervalo de confianza del 95% para la diferencia de medias Podemos concluir que las utilidades de la empresa en la ciudad B es mayor que la de A? Solucin. Ciudad A

x1 13,

3, n1

50

Ciudad B

x2 15,

4, n2

40

z1

1.96
2

( X1

X 2 ) z(1

/ 2) *

2 1

2 2

n1

n2

( X1

X 2 ) z(1

/ 2) *

2 1

2 2

n1

n2

157

ESTADISTICA

(13 15) 1.96*

9 16 50 40

(13 15) 1.96*

9 16 50 40

3.49
Como
1

0.50 0 , entonces
1 2

EJERCICIOS PROPUESTOS 1. De una muestra de 134 auditores empleados en grandes empresas de auditorias, 82 de ellos declararon que siempre que reciban un nuevo encargo de auditoria, preguntaban al auditor anterior cul haba sido la razn del cambio de auditor. Calcular un intervalo de confianza del 95% para la proporcin poblacional. 2. En una muestra aleatoria de personas que visitan un famoso centro turstico, 84 de 250 hombres y 156 de 250 mujeres compraron recuerdos de su visita. Construya un intervalo de confianza con un nivel del 95% para la diferencia entre las proporciones reales de hombres y mujeres que compran recuerdos. 3. La Cmara de Comercio de una ciudad est interesada en estimar la cantidad media de dinero que gasta una persona que asiste a convenciones por da. De las distintas convenciones que se llevan a cabo en la ciudad, se seleccionaron 16 personas y se les pregunt la cantidad que gastaban por da. Se obtuvo la siguiente informacin (en dlares): 150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146, 155, 163. Si se supone que la cantidad de dinero gastado en un da es una v.a. normal, obtener los intervalos de confianza a un nivel de 95 % para la cantidad media real. 4. La Cmara de Comercio de la ciudad A afirma que el ingreso medio de una familia de esta ciudad es de 500$ ms que el ingreso medio de una familia de la ciudad B. La Cmara de Comercio de B discute esto, y encarga un estudio sobre el tema. Se toman dos muestras, una en cada ciudad, y se obtienen los resultados siguientes : Ciudad A: nA Ciudad B: nB

514, x A 627, xB

23468, s2 A 22919, s2 A

29043.221 41948.337

Calcular el intervalo de confianza para la diferencia de los ingresos medios reales a un nivel del 99%. Conclusiones. (Suponer que las poblaciones son independientes). 158

CLETO DE LA TORRE

5. Jess es un corredor de la Bolsa de Valores y tiene curiosidad acerca de la cantidad de tiempo que existe entre la colocacin de una orden de venta y su ejecucin. Jess hizo un muestreo de 45 rdenes y encontr que el tiempo medio para la ejecucin fue de 24,3 minutos, con una desviacin estndar de 3,2 minutos. Ayude a Jess en la construccin de un intervalo de confianza de 95% para el tiempo medio para la ejecucin de una orden 6. Una muestra de 70 ejecutivos de una empresa fue investigada con respecto al pobre desempeo que sta tuvo en noviembre, 65% de los ejecutivos crea que la disminucin en las ventas se debi al alza inesperada de la temperatura, lo cual trajo como consecuencia que los consumidores retardaran la adquisicin de productos de invierno. Encuentre el lmite de confianza para esta porcin, dado un nivel de confianza igual a 0,95. 7. El dueo de una empresa investig aleatoriamente 150 de las 3000 cuentas de la compaa y determin que 60% de stas estaban en una posicin excelente. a.- Encuentre un intervalo de confianza de 95% para la proporcin de cuentas que estn en posicin excelente. b.- Basndose en el inciso anterior, Qu tipo de estimacin de intervalo podr usted dar para dar el nmero absoluto de cuentas que cumplen con los requisitos de excelencia, manteniendo el mismo nivel de confianza de 95%? 8. Un investigador de mercado de una compaa de productos electrnicos desea estudiar los hbitos televisivos de los residentes de una pequea ciudad. Selecciona una muestra aleatoria de 40 participantes y les pide que mantengan un registro detallado de lo que ven en televisin durante una semana. Los resultados son los siguientes: Tiempo frente al televisor: x = 15,3 h. s = 3,8 h. 27 participantes ven las noticias al menos 3 noches por semana a) Establezca un intervalo de confianza de 95% para el promedio semanal de tiempo que ven televisin en esta ciudad. b) Establezca un intervalo de confianza de 95% para la proporcin de participantes que ven las noticias al menos 3 noches por semana.

159

ESTADISTICA

c)

Qu tamao de muestra necesita si desea tener 95% de confianza de que su resultado es correcto dentro de 2 horas y supone que la desviacin estndar de la poblacin es igual a 5 horas?

d)

Qu tamao de muestra necesita si desea una confianza de 95% de estar dentro de 0,035 de la proporcin real de los que ven las noticias al menos 3 noches por semana si no dispona de estimaciones anteriores?

e)

Con base en (c) y (d), qu tamao de muestra debe seleccionar si slo realiza un estudio?

9. Se toma una muestra de 12 empleados de una planta productora, el nmero de horas extra que estos empleados hicieron durante el ltimo mes fueron: 22 ;16 ; 28 ; 12 ; 18 ; 36 ; 23 ; 11 ; 41 ; 29 ; 26 ; 31 a) Calcular un estimador puntual para la proporcin de empleados que trabajan ms de 20 horas b) Calcular un estimador puntual para el nmero medio de horas extras que trabajan los empleados. 10. Las negociaciones salariales entre su empresa y el sindicato que representa a sus trabajadores estn al borde de la ruptura. Hay un desacuerdo considerable sobre el nivel salarial medio de los trabajadores de la sucursal A y B. Los salarios fueron establecidos por el antiguo convenio colectivo firmado hace tres aos y se basa en la estricta antigedad. Como los salarios estn muy controlados por el convenio colectivo, se supone que la variacin salarial es la misma en las dos sucursales y que los salarios siguen una distribucin normal. Pero se piensa que hay diferencia entre los niveles salariales medios a causa de las diferentes estructuras de antigedad entre las dos sucursales. El negociador del convenio colectivo por parte de la direccin le pide que elabore un intervalo de confianza del 98% para la diferencia entre los niveles salariales medios. Si existe una diferencia entre las medias, habr que hacer ajustes para elevar los salarios ms bajos hasta el nivel de los ms altos. Con los datos que se dan a continuacin, qu ajustes habr que hacer, en caso de ser necesario?. Sucursal A nA

23, xA =17.53 $ por hora, s2 =93.10 A

2 Sucursal B nA 19, xA =15.50 $ por hora, sA =87.10

160

CLETO DE LA TORRE

161

ESTADISTICA

8.4 PRUEBAS DE HIPOTESIS En muchas situaciones el investigador tiene alguna idea o conjetura sobre el comportamiento de una o ms variables en la poblacin. El diseo de la investigacin debe permitir probar la veracidad de sus ideas sobre la poblacin en estudio, en base a los datos de la muestra. La idea o conjetura es una hiptesis y el procedimiento de toma de decisin sobre la hiptesis se conoce como prueba de hiptesis. Una hiptesis estadstica es una conjetura sobre el comportamiento probabilstica de una poblacin. Si la hiptesis estadstica identifica por completo la distribucin, recibe el nombre de hiptesis simple, y si no la especifica recibe el nombre de hiptesis

compuesta. El contraste de hiptesis tiene por finalidad decidir si una conjetura puede considerarse cierta, o debe rechazarse, basndonos en la informacin suministrada por una muestra. Hiptesis nula (denotada como H0). Esta hiptesis nula es la que se somete a comprobacin, y es la que se acepta o rechaza, como la conclusin final de un contraste.

Hiptesis alternativa (denotada como Ha). Se denomina hiptesis alternativa aquella hiptesis contra la cual queremos contrastar la hiptesis nula. Esta hiptesis puede ser simple o compuesta. Podemos cometer dos tipos de error: rechazar la hiptesis nula siendo sta cierta (error de tipo I) y aceptar la hiptesis nula cuando esta es falsa (error de tipo II).

Aceptar Ho Ho verdadera Ho falsa Decisin correcta Error Tipo II

Rechazar Ho Error Tipo I Decisin correcta

Denominamos nivel de significacin ( ) de un contraste a la mxima probabilidad de cometer un error del tipo I que estamos dispuestos a sumir.

162

CLETO DE LA TORRE

La decisin de rechazar, o no, la hiptesis nula la tomamos a partir de la informacin proporcionada por la muestra (estadstico de prueba). Realizamos una particin del espacio muestral en dos regiones, la regin crtica en la que se rechaza la hiptesis nula (tiene probabilidad que se acepta la hiptesis nula. A continuacin se dan una serie de regiones de aceptacin para ciertos contrastes de hiptesis con nivel de significacin . si H 0 es cierta) y la regin de aceptacin, en la

Antes de definir los pasos de una prueba de hiptesis se define algunos conceptos bsicos. 1. Nivel de significacin del contraste es la probabilidad de cometer un error del tipo I, es decir, de rechazar la hiptesis nula siendo cierta, y se acostumbra a denotar por 2. El contraste de hiptesis, es pues, un mecanismo mediante el cual se rechaza la hiptesis nula cuando existan diferencias significativas entre los valores muestrales y los valores tericos, y se acepte en caso contrario. Estas variables se medirn mediante una variable denominada estadgrafo de contraste, que sigue una distribucin determinada conocida, y que para cada muestra tomar un valor particular. 3. La regin crtica es el conjunto de valores del estadstico de contraste que nos induce a rechazar la hiptesis nula PASOS DE UNA PRUEBA DE HIPOTESIS. Los pasos que son convenientes seguir para realizar el contraste de hiptesis son: 1. Formulacin de hiptesis.

H0 :

Vs Ha :

Ha : .

Ha :

2. Elegir el nivel de significacin, 3. Estadstico de prueba.

4. Determinar la regin crtica. La forma de la regin crtica depende de la hiptesis alterna. Para Ha :
0

163

ESTADISTICA

1
/2 /2

Z(1
R.R. H0 R.A. H0

Z(1
R.R. H0

Para Ha :

Z(1
R.A. H0 R.R. H0

Para Ha :

Z(1
R.R. H0 R.A. H0

La regin de rechazo de la hiptesis nula es la sombreada. Se rechaza H0 cuando el estadstico de prueba toma un valor comprendido en la zona sombreada y se acepta Ho cuando el valor del estadstico de prueba cae en la regin de aceptacin, regin no sombreada.

164

CLETO DE LA TORRE

5. Conclusin. Determinar las conclusiones estadsticas del contraste (aceptar o rechazar Ho). A continuacin se presentan las pruebas de hiptesis en forma de resumen. PRUEBAS DE HIPOTESIS EN POBLACIONES NORMALES. Pruebas de Hiptesis. Hiptesis Nula Prueba de Medias H0: Si
2

Estadstica Prueba

de Criterio de rechazo de H0

Hiptesis Alternativa

Zc
Ha : Ha : > <
0 0 0

vs:

z1

conocido

Zc

/ n

Zc

z1

-Si la poblacin no es Ha: normal pero n 30 Prueba de Medias H0: =


0

Zc

s/ n

Zc
Tc t1

z1
n 1
2

Ha : Ha: Ha : > <

0 0 0

vs

Si se asume que :
2

Tc

X S/

Tc
Tc

t1
t1
z1
2

n 1
n 1

es desconocido de de Ha: Ha :
2 1 1 1 2

Prueba diferencias Medias H0:


1

Zc
> <

Zc

X1 X 2
2 1 n1 2 2 n2

2 2

Zc
Zc

z1
z1

vs:

Ha :

Asumiendo
2 1

Zc

X1 X 2
2 s1 n1 2 s2 n2

2 2

Conocidos

--Si las poblaciones no son normales pero n1 30 y n2 30 Prueba de diferencia de Medias H0:
1

Ha : vs Ha :

1 1

Tc

X1 X 2 Sp
1 1 n1 n2

Tc

t1

n1 n2 2

>

Tc t1

n1 n2 2

165

ESTADISTICA

Asumiendo
2 1 2 2

que: Ha:

<

Sp

2 2 n1 1 S1 n2 1 S2 c n1 n2 2

t1 n1 n2 2

desconocidos Prueba de diferencia de Medias H0:


1

Ha : vs Ha : Ha : y

1 1 1

Tc
v

X1 X 2
2 S1 n1 2 S2 n2
2 S1 2 ) n1 2 ( S 2 / n2 ) 2 n2 1

Tc

t1

v
2

> <

2 2

Tc t1

Asumiendo que:
2 1 2 2

2 S1 n1 2 ( S1 / n1 ) 2 n1 1

Tc
2 c

t1 v
2
2

desconocidos Prueba de varianzas H0:


2

Ha : Ha : Ha :

2 2 2

2 0 2 0 2 0

n 1

2 c

2 1

n 1
2

2 0

vs

2 c

n 1S
2 0

2 c
2 c

n 1
n 1

Prueba de razn de Ha: varianzas. Ha : H0:


2 1 2 2

2 1 2 1 2 1

2 2 2 2 2 2

Fc F nmax 1, nmin 1 Fc F1
2

Fc

vs

Ha :

2 Smax 2 Smin

Fc F1 n1 1, n2 1
Fc F n1 1, n2 1

Prueba proporciones

de Ha : p p0

Zc

p p0 p (1 p )/ n

Z c z1
Zc

H a : p > p0 H0: p =p0 Vs H a : p < p0

z1

Zc
Prueba de diferencia de proporciones Ha: p1 p2

z1
z1
2

Zc
pc

p1 p2 pc (1 pc ) pc (1 pc ) n1 n2

Zc

Ha: p1 > p2 H0: p1 =p2 Vs Ha: p1 < p2

n1 p1 n1

n2 p2 n2

Zc

z1

Zc

z1

166

CLETO DE LA TORRE

EJERCICIOS RESUELTOS 1.- El pago en promedio por concepto de impuestos de los establecimientos comerciales en una ciudad es de 355 soles. Se Sospecha que estos establecimientos evaden el pago de impuestos, pagando menos del debido. Para contrastar esta hiptesis se analiza las ventas de 60 establecimientos comerciales. Resulto una media muestral de 580 soles por concepto de impuestos. Proporcionan estos datos suficiente evidencia estadstica, al nivel de 95% de confianza, a favor de la hiptesis de que el pago de impuestos es mayor al contribuido actualmente? . Use Solucin Formulacin de hiptesis. H0: Ha: = 355 > 355
5% 180

Nivel de significancia, Estadstica de prueba.

Zc

/ n

180 , z1

1.645 , n 60, x1

580

Zc

580 355 180/ 60

9.68

Regin critica

=5%
Z0=1.645 Zc =9.68
Regin Aceptacin Regin Crtica

Conclusin. Como Zc

Zo

Se rechaza la hiptesis nula, por lo tanto se debe pagar ms de lo que actualmente se contribuye. 2- Se aplico una estrategia diferenciadora para colocar un producto en el mercado. 167

ESTADISTICA

En el cuadro siguiente se muestra las utilidades antes y despus de aplicar la estrategia en miles de dlares. Antes Despus 25 27 25 29 4 27 37 10 44 56 12 30 46 16 67 82 15 53 57 4 53 80 27 52 61 9

Diferencia 2

Hay suficiente evidencia estadstica (al nivel de significacin 0,05) a favor de que la estrategia presenta un efecto positivo?. Solucin Formulacin de hiptesis. H0: Ha:
d d

=0 0
5%

Nivel de significancia, Estadstica de prueba.


Tc
s
X
0

S/ n

7.76 , t(1

/ 2, n 1)

2.262

n 9, x1 11

Tc

11 0 7.76 / 9

4.25

Regin critica

t0=2.26 R.R. H0 R.A. H0

t0=2.26 tc=4.25 R.R. H0

Conclusin. Como tc

2.262 se rechaza la hiptesis nula.

168

CLETO DE LA TORRE

3.- Se desea comparar el nivel de posicionamiento de dos empresas A y B en una ciudad, para tal efecto se recopilo informacin de las recaudaciones diarias de las dos empresas. Los resultados del estudio se muestran a continuacin. Empresa A Empresa B

n1

13 , x1

138.6 , S12

29.16

n2

16 , x2

125.8 , S22

26.7

En base a la informacin, cual es su conclusin al 95% de confianza. Solucin. Formulacin de hiptesis. H0: Ha:
1 1

2 2

Nivel de significancia, Estadstica de prueba.

5%

Supongamos que las varianzas poblacionales son iguales, entonces el estadstico de prueba es:

Tc
De la informacin se tiene: Empresa A Empresa B

X1 X 2 Sp
1 n1 1 n2

t (n1 + n2 -2)

n1

13 , x1

138.6 , S12

29.16

n2

16 , x2

125.8 , S22

26.7

Sp

2 2 n1 1 S1 n2 1 S2 n1 n2 2

13 1 *29.16 16 1 *26.7 13 16 2

5.27

Tc

X1 X 2 Sp
1 n1 1 n2

138.6 125.8 1 1 5.27* 13 16


2 t0.975 13 16 2

6.50

Regin critica
T0 t1
2

n1 n2

t0.975 27

2.052

169

ESTADISTICA

t0=2.052 R.R. H0 R.A. H0

t0=2.052

tc=6.50

R.R. H0

Conclusin. Como Tc

T0 , entonces se rechaza H0.

4- El Ministerio de Economa viene desarrollando programas destinados a la poblacin, con la finalidad de que exijan la entrega de Boletas o facturas por todo servicio en dos regiones (A y B) del pas. Se selecciona a pobladores de ambas regiones que no presentaban esta cultura y se observo que de 600 residentes de la Regin A, 20% en la actualidad exige boleta o factura, en cambio de 600 residentes de la Regin B , 15 % en la actualidad exige la entrega de boletas. Es posible concluir con 95% de confianza que el programa a tenido similar resultado en las provincias A y B ? Solucin. Formulacin de hiptesis. H0: p1 =p2 Ha: p1 p2
5%

Nivel de significancia, Estadstica de prueba.

Zc

p1 p2 pc (1 pc ) pc (1 pc ) n1 n2

Provincia A.

p1

0.2 , n1

600

Provincia B.

p2
pc

0.15 , n2
n1 p1 n2 p2 n1 n2

600
600*0.2 600*0.15 600 600 0.175

170

CLETO DE LA TORRE

Zc

p1 p2 pc (1 pc ) pc (1 pc ) n1 n2

0.20 0.15 0.175(1 0.175) 0.175(1 0.175) 600 600

2.279

Regin critica

=5%
Z0=1.96
Regin Aceptacin

Zc =2.279
Regin Crtica

Conclusin. Como

Zc Zo , se rechaza la hiptesis nula, por tanto

p1

p2

EJERCICIOS PROPUESTOS
1)

Un especialista trabaja como corredor para una empresa. Sus registros muestran las tasas de rendimiento ( en porcentajes) para 10 meses en dos tipos de acciones Accin 1 5.6 7.2 7.3 6.3 6.3 7.1 6.2 8.3 8.2 8.2 7.9 5.3 8.0 8.1 6.2 6.2 5.3 prefieren:

Accin 2 7.5

7.3 5.9

Que tipo de Accin debera recomendar el especialista a sus clientes que a) Menos riesgo de inversin b) Mayor utilidad. Justifique adecuadamente sus respuestas.

2) Un grupo de economistas esta realizando un estudio sobre el comercio internacional del Per: consideran que en el actual contexto de continuas y profundas transformaciones, el comercio entre pases debera asumir un papel activo con el fin de ayudar al crecimiento de los pases que lo llevan a cabo. Se esta enfocando en un primer momento el comercio por el lado de las exportaciones ya que determinan la cantidad de dlares que ingresan al pas por va 171

ESTADISTICA

intercambio comercial y porque la estructura de las mismas mostrara un mayor o menor ingreso en divisas. A continuacin se presenta la informacin con la que cuenta el grupo de economistas sobre las exportaciones (en millones de dlares) para el Per a lo largo de 31 aos (desde 1960 -1990). Tradicionales

X1 1478 y s1 818 y No tradicionales X 2

340 y s2

357

En base a la informacin que se tiene se puede concluir que: a) Las exportaciones tradicionales en promedio anual es de 1500 millones de dlares. b) La diferencia entre las exportaciones tradicionales en promedio y las no tradicionales es mayor que 1000 millones de dlares. Justifique adecuadamente sus respuestas. Usar
1%

3) Un auditor quiere estimar el monto promedio de las cuentas por cobrar de la compaa A. Una muestra de 10 cuentas por cobrar seleccionadas al azar de un total de 400 cuentas que tiene esta compaa revela los siguientes datos. 500, 600, 750, 480, 900, 790, 860, 900, 500, 760. Estime la media de toda las cuentas cobrar utilizando un intervalo de confianza del 98%.Interprete el resultado brevemente. 4) La reaccin de un pequeo inversionistas con respecto a un cambio de poltica que modifique las reglas de juego de la economa es : retirar su inversin (A) o continuar con la inversin inicial(B). Un investigador quiere estimar la proporcin de inversionistas que reaccionan de manera A. a) Que tan grande debera ser la muestra si se desea que el estimado del

porcentaje de inversionistas de la poblacin que retiran su inversin tenga error de estimacin menor que 0.04 con un nivel de confianza del 95%, adems de una prueba piloto se obtuvo que 90% retirara su inversin b) El investigador realiza la encuesta con una m.a de pequeos inversionistas de tamao igual al que obtuvo en a) y obtiene que 300 inversionistas reaccin de manera A. Desarrolla el intervalo de confianza del 97% para el porcentaje de inversionistas que retiraran su inversin.

172

CLETO DE LA TORRE

5) El gerente de una cadena muy conocida de tiendas sospecha que su principal competidor esta intentando vender los mismos productos a precios ms bajos. Anteriormente las dos tiendas haban mantenido un balance en los precios de forma tal que la mitad de los artculos de una eran ligeramente ms caros que los de la otra y viceversa, para investigar esta posibilidad, envi un comprador a la otra tienda para ver los precios de 50 artculos seleccionados al azar, observndose: 1,1,1,0,1,0,1,1,1,0,1,1,0,0,0,1,0,1,0,1,1,1,0,0,1,1,1,0,0,1,0,0,0,1,1,0,1,0,1,0,1,0,0,0,1,1,1,0,1,1. Donde 1 indica precios ms bajos y 0 indica que los precios se mantienen igual que antes. Se confirma la sospecha del gerente? 1. Cuando Eastern Airlines se acogi a la proteccin de las leyes de bancarrota en 1989 en virtud del captulo 11, se hizo evidente que muchas de las mayores empresas de la nacin estaban en dificultades financieras. Durante una sesin de un subcomit del Senado, el senador Kennedy estim que las empresas que buscan liberarse de las presiones de los acreedores deban, de media, ms de 2200 millones de dlares. Una comprobacin de 17 juicios recientes en virtud del captulo 11 revel que las empresas implicadas deban 2430 millones de dlares, con una desviacin tpica de 900 millones de dlares. Est respaldada la afirmacin de Kennedy al nivel del 10%?. 2. De una muestra de 361 propietarios de pequeos comercios que quebraron en un perodo determinado, 105 no tuvieron asesoramiento profesional antes de abrir el negocio. Por experiencia se sabe que lo que ha venido ocurriendo es que a lo sumo el 25% de los comercios que no reciben asesoramiento quiebran. Analice si estos resultados prueban que ha habido un aumento en el porcentaje de quiebras. Utilice un nivel del 90%. 3. Un investigador de marketing quiere determinar si existe alguna diferencia en la proporcin de hombres que responden favorablemente a un determinado anuncio y la proporcin de mujeres que lo hacen. De 875 hombres, 412 informan que tienen una impresin positiva; de las 910 mujeres encuestadas, slo 309 estn a favor. Contrastar las hiptesis a nivel de significancia del 5% 4. Una corporacin bancaria quiere comparar el nivel medio de las cuentas de ahorro abiertas en bancos comerciales del Lima con las de Cusco. Muestras de 230 agencias 173

ESTADISTICA

bancarias del Lima y 302 en Cusco, tienen medias de 1512 dlares y 1317 dlares, respectivamente. Se sabe que la desviacin tpica en las cuentas para cada estado son 517 dlares para el Lima y 485 dlares para Cusco. Contrastar la hiptesis de que no hay diferencia de ahorros medios al nivel del 5%. 5. Muchos estudios econmicos se ocupan de sectores en los cuales una gran parte del dominio del mercado se concentra en manos de unas pocas empresas. Se teme que las empresas poderosas en sectores de tan alta concentracin dominen el mercado con fines egostas. Se emparejaron las empresas de nueve sectores concentrados con las de un nmero igual de sectores en los cuales el poder econmico estaba ms disperso. Se hicieron coincidir las empresas de cada grupo en cuanto a competencia extranjera, estructuras de costo y todos los dems factores que pueden afectar a los precios industriales. A continuacin se indican los incrementos medios del precio en porcentajes de cada sector. Al nivel del 5%, parece que los sectores concentrados presentan una presin inflacionaria ms pronunciada que los sectores menos concentrados? Pareados de sectores 1 2 3 4 5 6 7 8 9 Sectores concentrados 3.7 4.1 2.1 -0.9 4.6 5.2 6.7 3.8 4.9 Sectores menos concentrados 3.2 3.7 2.6 0.1 4.1 4.8 5.2 3.9 4.6

174

CLETO DE LA TORRE

CAPITULO IX PRUEBA DE CHI-CUADRADO


Las pruebas de hiptesis desarrolladas anteriormente, estn basadas en el supuesto de que la muestra pertenezca a una poblacin con distribucin conocida. Muchas de las investigaciones cientficas Aqu abordaremos dos problemas muy interesantes dentro de lo que se conoce con el nombre de estadstica no paramtrica. La prueba de homogeneidad y la prueba de independencia. La justificacin de estos problemas es comparar las frecuencias esperadas y las observadas.

9.1

TABLA DE CONTINGENCIA Es relativamente frecuente encontrarse con informacin referida a la observacin de dos caractersticas de una poblacin, en las que se establecen modalidades o categoras, mediante las cuales se clasifican los individuos o elementos que constituyen una muestra de la misma. Este tipo de distribucin bidimensional de frecuencias suele presentarse en forma de tabla de doble entrada, tambin llamada tabla de contingencia. La informacin obtenida del estudio generalmente se presenta en una tabla de contingencias, en esta se tiene un conjunto de n elementos clasificados de acuerdo a dos criterios, X e Y, cada uno de los cuales tiene una serie de categoras mutuamente excluyentes: 175

ESTADISTICA

Y1
X1 X2
...

Y2

...Yj ... o1 j o2 j
...

Yc
o1c

Total

o11

o12 o22
...

n1.
n2.
...

o21
...

o2c
...

Xi
...

oi1
...

oi 2
...

oij
...

oic
...

ni.
...

Xr
Total

or1

or 2 n.2

orj n. j

orc

nc.

n.1

n.c

En esta tabla, oij representa la frecuencia observada, es decir, el nmero de individuos que pertenecen simultneamente a las categoras X i e Yj .
r

o. j
i 1

nij y oi.

nij
j 1

En esta seccin se vern las pruebas de homogeneidad y de independencia. Si bien ambas pruebas presentan el mismo procedimiento de clculo, las hiptesis a probar son diferentes y por lo tanto las conclusiones obtenidas tambin. 9.2 PRUEBA DE HOMOGENEIDAD. En ocasiones ocurre que tenemos a varias poblaciones clasificadas de acuerdo con las categoras definidas para una determinada variable. La pregunta que se sugiere inmediatamente es si la proporcin de individuos pertenecientes a cada una de las clases es la misma en todas las poblaciones. Si, con la informacin suministrada por las muestras obtenidas, se puede aceptar que esto es as, diremos que las poblaciones son homogneas con respecto a la variable de clasificacin utilizada. Existen r poblaciones y una muestra aleatoria es extrada desde cada poblacin. Sea ni. el tamao de la muestra extrada de la i-sima poblacin. Cada observacin de cada muestra puede ser clasificada en una de c categoras 176

CLETO DE LA TORRE

diferentes. Los datos son arreglados en la siguiente tabla de contingencia r c: Categora Categora Poblacin 1 O 11 O 12 2 1 O22 Poblacin 2 O 21 . Poblacin r Total O r2 n.1 O r2 n.2 ... .. . . .. . .... o rc n.c n r. n.. nrCategora Total n 1. O 1c c O2c n2

En la tabla, oij es el nmero de observaciones de la muestra i clasificadas en la categora j; n.j es el nmero total de observaciones en la categora j extradas desde las r poblaciones y n.. es el total de observaciones extradas desde las r poblaciones. Hiptesis: Sea
ij

la probabilidad de que una observacin seleccionada de la poblacin i

sea clasificada en la categora j. Entonces las hiptesis son: Ho :


1j

=... =

rj

para todo j = 1, 2,c

H1: Al menos una igualdad no se cumple. Las hiptesis pueden expresarse equivalentemente de la siguiente manera: H0: La variable aleatoria tiene la misma distribucin de probabilidades en las r poblaciones. H1: La variable aleatoria tiene una distribucin de probabilidades diferente en al menos una de las poblaciones. La estadstica de prueba esta dado por:
r 2 xc j 1 j 1 c

(oij eij

eij )

x 2 (r 1)(c 1) donde eij

ni .x

n. j n..

Regla de decisin:
2 La hiptesis nula se rechaza con un nivel de significacin a si el xc resulta mayor

que el valor de tabla x 2 1

,( r 1)( c 1)

177

ESTADISTICA

9.3 PRUEBA DE INDEPENDENCIA Esta prueba permite analizar si dos variables aleatorias son o no independientes. Dado una muestra aleatoria de tamao n.. es extrada, y cada observacin de la muestra es clasificada de acuerdo a dos criterios (variables X y Y). Usando el primer criterio cada observacin es clasificada en una de r filas y usando el segundo criterio en una de c columnas. Los datos son arreglados en la siguiente tabla de contingencia rxc:

Fila 1 Fila 2

Columna Columna ... 0 11 0 12 . .. 1 2 0 21 0 22 ...


Columna c Total O ic ni. 0 2c n2.


Fila r Total

O r2 n .i

O r2 n .2

. .

.. ..

0 rc n .,

n ro n..

En la tabla, o jj es el nmero de observaciones clasificadas en la fila i columna j, n i . es el nmero total de observaciones en la fila i y n. j es el nmero total de observaciones en la columna j. Hiptesis: Sea
ij

la probabilidad de que una observacin sea clasificada en la fila i


i.

columna j, fila i y
.j

la probabilidad de que una observacin sea clasificada en la

la probabilidad de que una observacin sea clasificada en la columna

j. Entonces las hiptesis son: Ho:


ij i. . j

para todo i = 1, ... r, j = 1, ... c.

H1: Al menos una igualdad no se cumple. Las hiptesis pueden expresarse, en forma equivalente de la siguiente manera: Ho: Las variables X y Y son independientes. HI: Las variables X y Y no son independientes. Estadstico de prueba:

178

CLETO DE LA TORRE

r 2 xc j 1

c j 1

(oij eij

eij )

x 2 (r 1)(c 1) donde eij

ni .x

n. j n..

Regla de decisin: Se adopta la siguiente regla de decisin: Si Si


2 c 2 c 2 ( r 1)( c 1) 2 ( r 1)( c 1)

entonces se acepta la hipotes H 0 entonces se rechaza la hipotes H 0

Como puede observarse el procedimiento es muy similar al de la prueba de homogeneidad, y a veces suelen confundirse. EJERCICIOS RESUELTOS 8.2.1 En una investigacin realizada sobre las preferencias de 3 marcas, se obtuvo los siguientes resultados. Marcas Preferencias Si No Total A 70 130 200 B 100 100 200 C 150 50 200 Total 320 280 600

Podemos concluir con 95% de confianza que las preferencias de las marcas es similar? Solucin. H0: Las preferencias de las tres marcas son similares. H1: Las preferencias de los tres marcas no son similares
e11 320* 200 106.67 , e12 600 320* 200 106.67 , e13 600 320* 200 106.67 600

e21
2 c

280* 200 600


2

93.33 , e22

280* 200 600


2

93.33 , e23
2

280* 200 600


2

93.33

70 106.67 106.67

100 106.67 106.67

150 106.67 106.67


179

130 93.33 93.33

100 93.33 93.33

50 93.33 93.33

ESTADISTICA

2 c

65.625
2 0

De la tabla de chi-cuadrado ,

5.991

=5.99

=65.625

R.A. H0

R.R. H0

Como

2 c

2 0

, se rechaza la hiptesis nula

Las preferencias de los tres marcas no son similares.

2.- En un estudio sobre el uso de tres tcnicas de valorizacin de empresas de distinto tamao, se obtuvo los siguientes resultados. Tcnicas de valorizacin Tamao de la empresa Alto Actualmente En el pasado Nunca Total 51 92 68 211 Medio 22 21 9 52 Bajo 43 28 22 93 Total 116 141 99 356

El uso de tcnicas de valorizacin es independiente del tamao de la empresa? Solucin. Ho: El uso de tcnicas de valorizacin es independiente del tamao de empresa. HI: El uso de tcnicas de valorizacin es empresa.. Las frecuencias observadas y esperadas (frecuencias esperadas entre parntesis) se presentan en la siguiente tabla: dependiente del tamao de la

180

CLETO DE LA TORRE

Tamao de la empresa Uso de software Alto Actualmente En el pasado Nunca Total 51 (68.75) 92(83.57) 68(58.68) 211 Medio 22(16.94) 21(20.60) 9(14.46) 52 Bajo 43(30.30) 28(36.83) 22(25.86) 93 Total 116 141 99 356

Con estos datos el estadstico de prueba es:


3 3

xc2
i 1 j 1

oij

eij eij

18.510

Los grados de libertad para el estadstico de prueba son (3 -1)(3-1) = 4. El


2 valor de tabla para un nivel de significacin del 5% es x(0.95,4)

9.488 . Como el

valor calculado es mayor que el valor de tabla se rechaza H o y se concluye que existe suficiente evidencia estadstica para aceptar que el uso de tcnicas de valorizacin depende del tamao de la empresa .

3.- Un asesor financiero quiere conocer las diferencias en la estructura de capital de varios tamaos de empresa en cierta industria. Hace una encuesta en un grupo de firmas que tienen distintas cantidades de activos y las dividen tres grupos.

Clasifica cada una segn que su deuda sea mayor que el capital contable de las acciones o que su deuda total sea menor. A continuacin se dan los resultados de la encuesta:

Deuda con respecto Tamao de activos de la firma( en miles) al capital social Menor Mayor Total < $ 500 12 5 17 $500-2000 13 15 28 181 >$2000 4 13 17

Total

29 33 62

ESTADISTICA

Tienen idntica estructura de capital los 3 tamaos de empresa? Solucin Ho: La Estructura de capital es similar en los distintos tipos de empresa. (Independientes) HI: La Estructura de capital es similar en los distintos tipos de empresa (Dependientes)
Estructura de capital Menor Mayor Total Tamao de activos de la firma < $ 500 $500-2000 >$2000 12 13 4 70.6% 46.4% 23.5% 5 15 13 29.4% 53.6% 76.5% 17 28 17 100.0% 100.0% 100.0%

Total 29 46.8% 33 53.2% 62 100.0%

Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje , P-valor=0.023

Chi-cuadrado=7.563

EL p-valor, juega un papel muy importante en la decisin de las hiptesis. Si pvalor < 0.05 se acepta la hiptesis alterna con un nivel de confianza del 95%, en este caso influye el factor; en el caso que p > 0.05 la decisin es aceptar la hiptesis nula, no influye el factor. En nuestro ejemplo p-valor<0.05, se rechaza la hiptesis nula. capital es similar en los distintos tipos de empresa. EJERCICIOS PROPUESTOS La estructura de

1)

Durante la ultima ronda negociaciones del GATT (acuerdo general de tarifas y

comercio), un grupo de investigadores de Latinoamrica evalu en base a encuestas la actitud de los representantes de los pases desarrollados respecto al proteccionismo de sus mercados individuales, especficamente su posicin frente a la importacin de ciertos bienes manufacturados de piases en vas de desarrollo como los Latinoamericanos. Se interrogo a representantes de EEUU, Japn y de la Comunidad Econmica Europea (CEE).

182

CLETO DE LA TORRE

Numero de representantes por paises. EEUU A favor de la importancia En contra de la 35 65 Japon 76 74 CEE 37 43

importancia En base a los datos puede inferir los investigadores que el GATT ha cumplido su objetivo de liberalizar el comercio y homogeneizar las tendencias comerciales de sus pases miembros mas importantes. Use este estudio.
1% . Redacte un informe tcnico sobre

2) Un investigador quiere averiguar si hay diferencias significativas en las tasas de rendimiento de valores, bonos y fondos mutuos. Con tal motivo se ha seleccionado muestras aleatorias de inversin y ha registrado las tasas de rendimiento en cuatro entidades financieras. Entidades Financieras A Valores Bonos Fondos mutuos Influye en la tasa de rendimiento el tipo de inversin y la entidad financiera?.Use
5% . Redacte Adecuadamente sus conclusiones.

B 6.0 3.1 3.1

C 2.0 2.2 2.9

D 4.1 5.3 6

4.5 4.0 3.5

3) El departamento de tarjetas de crdito bancarias del California Bank sabe que por su larga experiencia, que 5% de los tarjeta habientes han tenido algunos estudios de bachillerato, 15% han terminado dicho nivel escolar, 25% han tenido ciertos estudios universitarios, y 55% han concluido la instruccin en universidad. De los 500 tarjeta habientes que fueron reportados por falta de pago en este mes, 50 tenan estudios de bachillerato, 100 terminaron tal nivel escolar, 190 tenan cierta preparacin universitaria y 160 concluyeron la instruccin en la universidad. Se puede concluir

183

ESTADISTICA

que la distribucin de tarjeta habientes que no han pagado sus cuentas es diferente de la de los dems?. Aplique el nivel de significancia de 0,01

4) Doscientos hombres de diversos niveles de gerenciales, seleccionados al azar, fueron entrevistados con respecto a su inters o preocupacin acerca de asuntos ambientales. La respuesta de cada persona se registr en una de tres categoras: inters nulo, algo de inters y gran preocupacin. Los resultados fueron: Nivel de gerencial Preocupacin Sin inters Gerencia alta Gerencia media Supervisor Jefe de grupo 15 20 7 28 Algo de inters Gran preocupacin 13 19 7 21 12 21 6 31

Utilice el nivel de significancia de 0,01 para determinar si existe relacin entre el nivel directivo o gerencial y el inters en asuntos ambientales.

5) Un administrador de marca est preocupado porque su producto puede estar mal distribuido a lo largo de todo el pas. En una encuesta en la que el pas fue dividido en 4 regiones geogrficas, se investig una muestra aleatoria de 100 consumidores de cada regin, obtenindose los siguientes resultados: Adquisiciones NE Adquirieron la marca No la adquirieron 60 45 55 50 40 Regin NO 55 SE 45 SO 50

Si el nivel de significancia es de 0,05. Cul es su conclusin?

6) Se encuest a varios directores generales de empresas y se les pidi que valoraran la dependencia entre el rendimiento financiero de su empresa y la estrategia de la misma, siendo los resultados los siguientes: 184

CLETO DE LA TORRE

Estrategia

Rendimiento financiero Bajo Medio 25 52 49 Alto 18 23 61

Baja Media Alta

15 30 23

A qu conclusin llega usted? Utilice un nivel de confianza del 90% para su prueba.

7) Se clasific una muestra de agencias inmobiliarias segn su nmero de empleados y por si tenan o no un plan de marketing, para estudiar si haba o no dependencia entre ambas variables Nmero de empleados Menos de 100 Entre 100 y 500 Ms de 500 Con plan de Marketing 13 18 32 Sin plan de Marketing 10 12 6

Utilizando un nivel de significacin del 1% realice la prueba correspondiente.

8) El incluir en las etiquetas de los productos alimenticios el precio unitario del producto tiene por objeto el facilitar a los compradores la eleccin. Sin embargo, un experto en estudios sobre el comportamiento de los consumidores , han encontrado que aquellos de nivel soioeconmico bajo no estn usando la ventaja que representa el tener exhibido en la etiqueta el precio unitario. En un estudio posterior, y a manera de corroboracin de los resultados reportados, un economista observ el proceso de seleccin de 1000 compradores en tres supermercados. Estos se encontraban ubicados en tres reas distintas de la ciudad, y correspondan a clases sociales de nivel bajo, medio y alto respectivamente. Se haban puesto paquetes de productos de la misma marca pero conprecios unitarios distintos. Los datos sobre los 1000 compradores, clasificados de acuerdo a su clase socioeconmica y al hecho de haber comprado con base en los precios unitarios o no, fueron: BAJA Us pp.uu. 249 MEDIA 494 185 ALTA 201

ESTADISTICA

No us pp.uu.

26

26

Muestran los datos al nivel 0.05 evedencia que respalde los reportes del experto ?

9) Con el objeto de asesorar correctamente a sus clientes, un banco pidi la opinin de 50 analistas en inversin de cada una de tres firmas consultoras distintas, todas miembros de la bolsa . A cada uno le fu preguntado especficamente cual de los tres tipos de inversin, bonos, acciones o bonos convertibles recomendara. Las respuestas se presentan en la siguiente tabla: FIRMAS A Acciones Bonos Bonos convertibles 13 31 6 CONSULTORAS B 16 24 10 C 7 35 18

Proporcionan stos datos evidencia al nivel 0.10 de que las tres firmas consultoras opinan distinto?

10) En un da dado, el gerente de un supermercado observ el nmero de clientes que escogieron cada una de las 6 cajas de pago distintas de la salida. Los resultados fueron: Caja nmero Frecuencia 1 84 2 110 3 146 4 152 5 61 6 47

Presentan los datos suficiente evidencia de que hay cajas preferidas al nivel 0.05?

11) Se ha realizado un estudio sobre la utilizacin de ciertas fuentes de financiacin externas para las pequeas y medianas empresas (PYMES). Para ello se han seleccionado aleatoriamente 500 PYMES de una regin. Las empresas se clasifican segn su tamao en tres categoras (micros, pequeas y medianas) y segn hayan utilizado o no alguna de las fuentes de financiacin especificadas en el cuestionario. Los datos obtenidos son: Si utiliza financiacin Micros 115 186 No utiliza financiacin 325

CLETO DE LA TORRE

Pequeas Medianas

20 15

20 5

Existe alguna relacin entre el tamao de la empresa y el hecho de recurrir o no a las fuentes de financiacin indicadas?. Utilice un nivel de significacin del 5%.

187

ESTADISTICA

CAPITULO X TOMA DE DECISION.


Una decisin es una eleccin consciente y racional, orientada a conseguir un objetivo, que se realiza entre diversas posibilidades de actuacin (o alternativas). Antes de tomar una decisin deberemos calcular cual ser el resultado de escoger una alternativa. En funcin de las consecuencias previsibles para cada alternativa se tomar la decisin. As, los elementos que constituyen la estructura de la decisin son: los objetivos de quin decide y las restricciones para conseguirlos; las alternativas posibles y potenciales; las consecuencias de cada alternativa; el escenario en el que se toma la decisin y las preferencias de quien decide. Los problemas de decisin que vamos a estudiar se plantean cuando una persona (decisor) tiene que elegir una opcin entre un conjunto de posibilidades sabiendo que las consecuencias que acarrea su decisin no dependen solo de la opcin que elija, sino tambin de una serie de factores externos que no controla. Trataremos de estudiar criterios objetivos para tomar una decisin de forma que las consecuencias nos sean favorables. 10.1 OBSERVACIONES Se llama espacio de acciones (Aj) al conjunto de todas las posibles alternativas entre las que el decisor puede elegir.

188

CLETO DE LA TORRE

Se llama espacio de estados o eventos (Ei) de la naturaleza, al conjunto de todos los posibles valores de los factores externos que no controla el decidor, pero determinan el nivel de xito de una accin determinada. La teora de decisin consiste en un conjunto de tcnicas para elegir la mejor accin.

10.2 PASOS EN LA TEORIA DE DECISIONES. En un problema de decisin, lo primero que debemos identificar son las opciones entre las que debemos elegir. El segundo paso del planteamiento consiste en identificar los factores externos que no puede controlar el decisor pero que incluyen en las consecuencias, en este paso se asigna probabilidades (pi) a los posibles eventos. En el tercer paso se construye una tabla de pago, la misma que debe contener la lista de las acciones alternativas, posibles eventos y los pagos. El cuarto paso es el proceso de la toma de decisiones, para ello existen varios criterios, la mismas que se desarrollaran posteriormente. Tablas de pago. El pago se define como la utilidad neta es decir ventas menos costos. Los pagos X ij de la tabla de pagos son valores que consisten de prdidas o ganancias que dependen del evento Ei y de la accin Aj. Tabla de pagos. Eventos Probabilidades Acciones A1 E1 E2 E3

A2

...

An

P1 P1 P1

X 11

X 12 X 22 X 32

X 1n X 2n X 3n

X 21 X 31

EK

P1

X k1

Xk2

X kn

10.3 TOMA DE DECISIONES. I. Criterios basados solo en probabilidades. 189

ESTADISTICA

Este criterio consiste en decidir por el evento que tiene la mxima probabilidad. II. Criterios Basados solo en las consecuencias econmicas. a. Criterio Maximin. Consiste en determinar el valor mnimo que resulta de cada accin a tomar en la tabla de pagos, y elegir como la mejor accin aquella cuya resultante es mayor. Este es el criterio ms conservador ya que est basado en lograr lo mejor de las peores condiciones posibles. El criterio maximin, corresponde a un pensamiento pesimista, pues razona sobre lo peor que le puede ocurrir al decisor cuando elige una alternativa. b. Criterio Maximax. Consiste en determinar el valor mximo que resulta de cada accin a tomar en la tabla de pagos, y elegir como la mejor accin aquella cuya resultante es mayor c. Criterio de prdida de oportunidad condicional (Arrepentimiento mnimas). El arrepentimiento o prdida de oportunidad condicional se define como la cantidad de pago perdido al no tomar la accin del pago ms alto para cada evento posible. Este criterio toma como la mejor accin aquella para la cual el arrepentimiento mximo posible es menor. III. Criterios basados solo en probabilidades y consecuencias econmicas a. Criterio del pago esperado (PE) Llamado tambin Criterio Bayesiano, bajo este criterio la mejor accin es aquella que tiene el mayor resultado econmico esperado (promedio) b. Criterio de la prdida de oportunidad esperada(POE) La mejor accin es aquella que minimiza las perdidas de oportunidad esperada. Los clculos son similares de PE excepto que se usa perdidas de oportunidades en vez de pagos. Ejemplo 1 190

CLETO DE LA TORRE

Un vendedor al menudeo adquiere cierto producto a 3000 dlares la caja y lo vende en 5000 dlares. El elevado margen de utilidad refleja que los productos son perecedores, puesto que se pierde 500 dlares despus de cinco das. Con base en experiencias en productos similares el vendedor confa en que la demanda del producto esta entre 9 y 12 cajas. Si los valores de probabilidad estimadas para las demandas de 9 a 12 cajas son: 0.3, 0.4, 0.2, y 0.1 respectivamente.

a. Describa todo los posibles eventos y las posibles acciones a tomar. b. Construya una tabla de ganancias. c. Determine las mejores decisiones utilizando el criterio de probabilidad mxima. d. Determine las mejores decisiones desde el punto de vista de los criterios: i) maximin, ii) mximax. e. Determine la mejore decisin desde el punto de vista del criterio del pago esperado (PE) f. Determine la mejore decisin desde el punto de vista del criterio del perdida de oportunidad condicional (Criterio de arrepentimiento condicional) g. Construya una tabla de perdidas de oportunidades esperadas y determine la mejor decisin utilizando este criterio.

Solucin: a. Posibles eventos: E1: Vender 9 cajas. E2: Vender 10 cajas. E3: Vender 11 cajas. 191

ESTADISTICA

E4: Vender 12 cajas. Posibles acciones a tomar: A1: Comprar 9 cajas. A2: Comprar 10 cajas. A3: Comprar 11 cajas. A4: Comprar 12 cajas.

b.

Tabla de ganancias. Demanda de mercado E1: 9 E2 : 10 E3 : 11 E4 : 12 P1 = 0.3 P2 = 0.4 P3 = 0.2 P4 = 0.1 Probabilidades A1 : 9 18000 18000 18000 18000 Comprar A2: 10 14500 20000 20000 20000 A3: 11 11000 16500 22000 22000 A4: 12 7500 13000 18500 24000

Si se compra 9 cajas (C = 9), las ganancias (G) para las 4 demandas (D) respectivas D=9, 10, 11, 12 son iguales a: G=9x5000-9x3000-0x500=18000. Si se compra 10 cajas (C = 10), las ganancias (G) para : D = 9 es G = 9x5000-10x3000- 1x500=14500. D = 10, 11, 12 es G = 10x5000-10x3000- 0x500=20000. Si se compra 11 cajas (C = 11), las ganancias (G) para : D = 9 es G = 9x5000-11x3000 - 2x500=11000. D = 10 es G = 10x5000-11x3000 - 1x500=16500. D = 11, 12 es G = 11x5000-11x3000- 0x500=22000. Si se compra 12 cajas (C = 12), las ganancias (G) para : D = 9 es G = 9x5000-12x3000 - 3x500=7500. D = 10 es G = 10x5000-12x3000 - 2x500=13000. D = 11 es G = 11x5000-12x3000 - 1x500=18500. D = 12 es G = 12x5000-12x3000 - 0x500=24000.

192

CLETO DE LA TORRE

c.

Criterio de probabilidad mxima. En base a este criterio, la mejor eleccin es comprar 10 cajas.

d.

Criterio maximin: Demanda de mercado E1 : 9 E2 : 10 E3 : 11 E4 : 12 Mnimos A1 : 9 18000 18000 18000 18000 18000 Comprar A2: 10 14500 20000 20000 20000 14500 A3: 11 11000 16500 22000 22000 11000 A4: 12 7500 13000 18500 24000 7500

El mayor de estos cuatro valores mnimos es 18000, por tanto la mejor accin es comprar 9 cajas.

Criterio maximax: Demanda de mercado E1 : 9 E2 : 10 E3 : 11 E4 : 12 Mximos A1 : 9 18000 18000 18000 18000 18000 Comprar A2: 10 14500 20000 20000 20000 20000 A3: 11 11000 16500 22000 22000 22000 A4: 12 7500 13000 18500 24000 24000

El mayor de estos cuatro valores es 24000, por tanto la mejor accin es comprar 12 cajas. e. Criterio de pago esperado (PE) Demanda de mercado E1 : 9 E2 : 10 E3 : 11 A1 : 9 18000 18000 18000 Comprar A2: 10 14500 20000 20000 193 A3: 11 11000 16500 22000 A4: 12 7500 13000 18500

ESTADISTICA

E4 : 12 Pago esperado

18000 18000

20000 18625

22000 17875

24000 15750

Se elige la accin que tiene mayor PE, esto es comprar 10 cajas.

f.

Criterio de prdida de oportunidad condicional. Si la demanda fuera de 9 unidades (D=9), lo correcto es producir 9 para tener una ganancia de G = 9x5000-9x3000=18000 no hay prdida de oportunidad, sin embargo si se produce 10 unidades, cuando la demanda es 9, la ganancia es G = 9x5000-10x3000- 1x500=14500, para este caso la prdida de oportunidades es: 18000-14500=3500 Tabla de prdida de oportunidad condicional

Demanda de mercado E1: 9 A1: 9 18000 18000 0 E2 : 10 20000 18000 2000 E3 : 11 22000 18000 4000 E4 : 12 24000 18000 6000 Mximos 6000 4000 A2: 10

Comprar A3: 11 18000 11000 7000 20000 16500 3500 22000 22000 0 24000 22000 2000 7000 A4: 12 18000 7500 11500 20000 13000 7000 22000 18500 3500 24000 24000 0 11500

18000 14500 3500 20000 20000 0 22000 20000 2000 24000 20000 4000

El menor de estos mximos es 4000, la accin optima es A2, comprar 10 cajas. g. Tabla de perdidas de oportunidades esperadas (POE) Comprar A1 : 9 0 2000 A2: 10 3500 0 194 A3: 11 7000 3500 A4: 12 11500 7000

Demanda de mercado E1: 9 E2 : 10

CLETO DE LA TORRE

E3 : 11 E4 : 12 POE (Promedios)

4000 6000 3000 2375

2000 4000

0 2000 3125

3500 0 5500

La menor de estas perdidas de oportunidades esperadas es de 2375, por el criterio POE, la mejor accin es comprar 10 cajas.

10.4 ARBOL DE DECISIONES Es utilizado para estructurar el proceso de Toma de decisiones bajo Incertidumbre. Variable de decisin: Son las alternativas disponibles Variable de estado : Estados de la naturaleza, estados futuros, ocurrencias probables. El esquema de un rbol de decisin es la siguiente.

Nodo de Decisin

Alternativas de decisin

Nodo de azar

Ramas de estado

Resultados

Los nodos finales representan todos los posibles resultados, asociados con cada una de las alternativas de decisin

10.5 Toma de decisin Bayesiana. Mientras que los criterios de decisin analizados anteriormente ignoran las probabilidades para los estados naturales respectivos, la toma de decisin 195

ESTADISTICA

bayesina la toma en cuenta, especficamente se elige la alternativa con la mejor retribucin esperada. Retribucin esperada=VME=
i 1

pi mi

Donde: Pi: Probabilidad de que ocurra el estado natural i. Mi: La retribucin si se selecciona esta alternativa y ocurre el estado natural i.

EJEMPLO Un inversionista debe decidir si realiza una inversin de $ 50000 en la ciudad A o B para construir un mercado en una rea residencial, no se sabe si esta rea residencial crecer para convertirse en un mercado grande o moderado. Si invierte en la ciudad A y el mercado es grande la ganancia neta se estima en $75000; si el mercado es moderado habr una perdida de $ 30000. Si invierte en la ciudad B y el mercado es grande, la ganancia neta ser de $150000, si el mercado es moderado la ganancia ser de $50000. Si el inversionista estima una probabilidad de 40% de que el mercado sea grande. Determine si el inversionista debe realizar o no el deposito. Solucin.

Alternativa

Probabilidad de Cada estado natural


0.4 Mercado es grande

Retribucin en dlares

$ 75000

Invertir en la ciudad A 0.6 Mercado es moderado

-$ 30000

VME ciudad A=0.4x75000+0.6x(-30000)=$12000


196

CLETO DE LA TORRE

VME Ciudad B=0.4x150000+0.6x(50000)=$90000


0.4 Mercado es grande Invertir en la ciudad B

$ 150000

0.6 Mercado es moderado

$ 50000

Al comparar las retribuciones esperadas se deduce que debe invertir en la ciudad B. EJERCICIOS. 1. Una tienda de moda tiene la oportunidad de abrir un local en un centro comercial muy conocido y con mucho xito. Alternativamente, puede abrir la tienda en un nuevo centro comercial a un coste mucho mas bajo, de forma que si ese nuevo centro tiene gran ausencia calculan que los beneficios anuales sern de 300000 euros, si la ausencia es moderada sern de 135000 euros y si es baja esperan unas perdidas de 23000 euros. Si abren la tienda en el centro comercial ya establecido, los beneficios que calculan dependen, tambin, del grado de xito del nuevo centro, ya que son competidores directos. Si la ausencia al nuevo centro es baja, los beneficios para la tienda instalada en el centro comercial conocido. Utilice por lo menos tres criterios para la toma de decisin

2. Un vendedor de computadoras adquiere una computadora en 1000 dlares y lo vende en 1800 dlares, el valor de la computadora se deprecia en seis meses en 600 dlares. En base a la experiencia el vendedor confa en que la demanda del producto esta entre 10 y 14 unidades en un periodo de seis meses. Si los valores de probabilidad estimadas para las demandas de 10 a 14 unidades son: 0.3, 0.25, 0.19, 0.15 y 0.11 respectivamente.

a. Describa todo los posibles eventos y las posibles acciones a tomar. 197

ESTADISTICA

b. Construya una tabla de ganancias. c. Determine las mejores decisiones utilizando el criterio de probabilidad mxima. d. Determine las mejores decisiones desde el punto de vista de los criterios: i) maximin, ii) mximax. e. Determine la mejore decisin desde el punto de vista del criterio del pago esperado (PE) f. Determine la mejore decisin desde el punto de vista del criterio del perdida de oportunidad condicional (Criterio de arrepentimiento condicional) g. Construya una tabla de perdidas de oportunidades esperadas y determine la mejor decisin utilizando este criterio.

3. Cada hotel de cierta cadena debe decidir cual de las tres posibles promociones que ofrece la compaa matriz lanzara para la prxima campaa de invierno. La promocin playa depende mucho del tiempo. Si es calido y soleado, calculan unos beneficios de unos 90000 soles, si es fri y lluvioso de 5000 soles y si es intermedio de unos 25000 soles. Al contrario para la promocin ski calculan una perdidas de 6000 soles si el tiempo el calido, unos beneficios de 15000 soles si es intermedio 70000 soles si es fri y lluvioso. La promocin relax es independiente del tiempo y con ella esperan unos beneficios de unos 55000 soles. a) Uno de los hoteles de dicha cadena esta situado en una zona en la el 80% de los inviernos son calidos y soleados y nunca son fros y lluviosos, que promocin debern lanzar?, con que valor asociado? b) Otro hotel esta situado en una zona en la que el 40% de las veces el invierno es fri y lluvioso y el 30% es intermedio, que opcin recomendaras para este otro hotel?

198

CLETO DE LA TORRE

199

ESTADISTICA

CAPITULO XI DISEO EXPERIMENTAL


El diseo de experimentos es en la actualidad una de las herramientas principales utilizados en la investigacin estadstica, el objetivo que se tiene es estudiar el efecto de un factor sobre una variable respuesta. Disear un experimento, simplemente significa planear un experimento de modo que se rena la informacin que sea pertinente al problema bajo investigacin. Muy a menudo se coleccionan datos que pueden tener muy poco o ningn valor, en la solucin del problema. El diseo de un experimento, es entonces, la secuencia completa de pasos tomados de antemano para asegurar que los datos apropiados se obtendrn de modo que permitan un anlisis objetivo que conduzca a deducciones vlidas con respecto al problema establecido. 11.1 CONCEPTOS BASICOS FACTOR. Son todas aquellas variables cuyo efecto se desea medir, en algunos casos se les llama tratamiento. NIVEL Es el conjunto de valores que tiene la variable independiente o factor en el experimento.

200

CLETO DE LA TORRE

UNIDAD EXPERIMENTAL Es la entidad ms pequea a lo que se aplica el tratamiento, es decir; es el elemento donde se realiza la medicin.

ERROR EXPERIMENTAL Es la medida de la variacin, existente entre observaciones de las unidades experimentales. En un Diseo Experimental se tiene variabilidad inherente a la unidad experimental y otra variabilidad debida a los tratamientos. Para reducir el error experimental se siguen algunos pasos: Repetir el experimento Adicionar ms tratamientos Introducir variables o bloques

El proceso o sistema bajo estudio puede representarse por medio del modelo:

Podemos pensar que el proceso es una combinacin de maquinarias, personas y otros recursos que transforman alguna entrada, en una salida que tienen una o ms respuestas observadas 11.2 OBJETIVOS DEL DISEO EXPERIMENTAL Determinar las variables con mayor influencia en la respuesta 201

ESTADISTICA

Determinar el mejor valor de las variables que influyen en la respuesta de manera que: La respuesta se aproxime al valor deseado La variabilidad de la respuesta sea pequea Se minimiza el efecto de las variables incontrolables 11.3 DISEO UNIFACTORIAL (Diseo completamente aleatorio) Es el Diseo Experimental ms simple. En este Diseo los tratamientos (niveles) se distribuyen al azar en todas las unidades experimentales. Este diseo es muy til cuando las unidades experimentales (homogeneidad) VENTAJAS Y DESVENTAJAS VENTAJAS Este Diseo es fcil de planear y es flexible en cuanto al nmero de repeticiones y unidades experimentales del tratamiento tienen variabilidad uniformemente repartidos

DESVENTAJAS Solo es aplicable, cuando el material experimental es homogneo Los resultados del experimento se pueden agrupar de la siguiente forma:

factor variedad

yij
A Y11 B Y22 B Y23 A Y14 C Y31 A Y12 C Y33 D Y44 B Y21 D Y42 A Y13 C Y34 D Y41 C Y32 D Y43 B Y24

A
niveles

B C D

Donde ( yij ) es el resultado de la medicin del i-simo tratamiento en la j-sima repeticin.

202

CLETO DE LA TORRE

En resumen: Tratam

1
Y11 Y12 Y1 j Y1n

2
Y21 Y22 Y2 j Y2 n

i
Yi1 Yi 2 Yij Yin

a
Ya1 Ya 2 Yaj Yan
TOTAL

TOTALES Medias Varianzas

Y1.
Y1.
2 s1.

Y2.
Y2.

Yi .
Yi.

Ya .
Yan
2 sa.

Y..
Y..
2 s..

2 s2. si2.

Donde:
n

Yi.
j 1

Yij , Total del i-simo tratamiento


n

Yi .
j 1
a

Yij
Yi.
i 1

Yi . , Media del i-simo tratamiento n


a n

Y..
Y..

Yij , Total
i 1 j 1

Y.. , Media total an

En esta parte desarrollaremos el Anlisis de Varianza para el modelo de Efectos fijos del Diseo Completamente al Azar. (DCA).

11.4 ANALISIS DE VARIANZA Es la tcnica mediante el cual se mide los efectos de los tratamientos puesto que descompone la Varianza Total en diferentes fuentes de variabilidad definida por el 203

ESTADISTICA

modelo. Para el cual se siguen los siguientes pasos:

H0 :

H1:
SCT

j , para algn par (i,j)

La frmula asumida para calcular la suma de los cuadrados es la siguiente:


a n

yij
i 1 j 1

y..
a

yij
i 1 j 1

y..2 N
an

,N

an

SCA
i 1

yi2. ni

y..2 N

SCE
siguiente forma:

SCT

SCA

Los cuadrados medios son los estimadores de las varianzas y son obtenidos de la

CMA

SCA a 1

CME

SCE a(n 1)

V ( ij )

varianza del error.


2

Por otra parte el cociente de 2 variables de Fisher

se distribuye mediante la distribucin

Fc

SCA a 1 SCE a(n 1)

a 1,a n 1

gl

f(1 R.A. H0 R.R. H0

204

CLETO DE LA TORRE

Anlisis de la varianza. Fuentes de Varianza Tratamiento a-1 Error Total a(n-1) an-1 SCA SCE STT CMA CME
CMA CME

g.l

SC

CM

FCAL

Conclusiones: Si Fc Si Fc F0 Se rechaza H0 F0 Se acepta H0

11.5 DISEO EXPERIMENTAL DE DOS FACTORES El anlisis de la varianza de dos factores esta formado como su nombre indica

por dos factores que a su vez tienen la misma importancia en este tipo de anlisis existen a niveles del factor A y b niveles de factor B. Este tipo de anlisis se determinan segn el numero de observaciones; si cada unidad experimental tiene una observacin, el modelo del anlisis univariado de la varianza de dos factores se denomina sin replica, en este caso no existe

interaccin entre los dos factores. En este tipo de anlisis el control local (unidad experimental) por el factor A l cual esta constituido por todo los del factor B o variantes repetidas una sola vez siendo el factor A una repeticin con la condicin de que los del factor B estn dentro del factor A . de donde se puede afirmar que cada factor A contiene los elementos del factor B el cual disminuye el error experimental. TABLA DE ANALISIS DE VARIANZA Fuentes de Varianza Factor A a-1 SCA CMA
CMA CME

g.l

SC

CM

FCAL

205

ESTADISTICA

Factor B Interaccin AB Error Total

b-1 (a-1)(b-1)

SCB SCAB

CMB CMAB

CMB CME CMAB CME

ab(n-1) abn-1

SCE

CME

Donde:
a b n

SCT
i 1 j 1 k 1

Y
n

2 ijk

2 ...

abn

SCA
i 1

2 i ..

2 ...

bn

abn

SCB
j 1

2 . j.

2 ...

an

abn

b j 1

SCAB
i 1

2 ij.

2 ...

abn

SCA SCB

SCE = SCT-(SCA+SCB+SCAB) El cuadrado medio, se obtiene: Para el factor A Para el factor B Para la interaccin AB Para el error : CMA : CMB : CMAB : CME
SCA a 1 SCB b 1

SCAB (a 1)(b 1) SCAB ab(n 1)

INTERACCIN. En estadstica, la idea de una interaccin, es medir el efecto de una

206

CLETO DE LA TORRE

variable (factor), manteniendo constante los dems. Figura: Interaccin de factores. De la grfica anterior se concluye que geomtricamente existe interaccin cuando las lneas no son paralelas, en cambio no existe interaccin, cuando las lneas son paralelas.

APLICACIONES. 1.- Se desea evaluar la efectividad de tres estrategias de marketing A, B y C en las ventas. En el cuadro siguiente se observa las ventas semanales de un producto de miles de unidades. A 35 30,6 26,8 37,9 13,7 49 B 22,6 14,4 26,3 13,8 17,4 18.5 C 16,6 12,1 7,2 6,6 12,5 15,1

Se puede concluir que el efecto de las tres estrategias es diferente? Solucin La hiptesis estadstica esta dado por:

H0 :

H1:

Estrategia A 35 30.6 26.8 37.9 13.7

Estrategia B 36 30.7 26.9 37.10 13.8 207

Estrategia C 37 30.8 26.10 37.11 13.9

ESTADISTICA

49 Totales N Media

50 84 6

51 86 6

y1.

y2.

y3.

88 6

y..

258 N=18

y1. =14 y2. =14.3333333 y3. =14.6666667 y.. =14.3333333

SCT
i 1 j 1
a

yij
yi. ni y..2 N

y..2 N

35

30.6

26.8

.... 51

2582 18

2194.57

SCA
i 1

842 862 882 6

2582 18

0.7059

SCE SCT SCA 2193.87


Anlisis de la varianza. Fuentes de Varianza Tratamiento 2 Error Total 15 17 0.7059 2193.87 2194.57 0.35295 146.258 0.00220775 g.l SC CM FC

fc

De la tabla FO=3.68, Se acepta HO, por lo tanto las tres estrategias de ventas presenta similar efecto.

2.- Un investigador analiza el efecto de 5 tipos de publicidad en cinco reas geogrficas, los resultados se mide en trminos del incremento en las ventas. La informacin obtenida del estudio se muestra en el cuadro siguiente. 208

CLETO DE LA TORRE

Area geogrfica Publicidad R1 E1 R1 E1 R2 E1 R2 E1 R3 E1 R3 E1 R4 E1 R4 E1 R5 E1 R5 E1 R1 E2 R1 E2 R2 E2 R2 E2 R3 E2 R3 E2 R4 E2 R4 E2 R5 E2 R5 E2 R1 E3 R1 E3 R2 E3 R2 E3 R3 E3

Incremento en las ventas


85 45 100 20 85 95 73 87 250 170 110 30 100 20 90 80 50 110 120 250 60 0 40 45 50

Incremento Tiempo Tratamiento en las ventas


100 200 250 260 340 0 70 30 100 100 180 210 200 350 420 30 60 110 100 170 150 10 20 40 20

R3 E3 R4 E3 R4 E3 R5 E3 R5 E3 R1 E4 R1 E4 R2 E4 R2 E4 R3 E4 R3 E4 R4 E4 R4 E4 R5 E4 R5 E4 R1 E5 R1 E5 R2 E5 R2 E5 R3 E5 R3 E5 R4 E5 R4 E5 R5 E5 R5 E5

Con 95% cual es su conclusin de este estudio. 209

ESTADISTICA

Anlisis de Varianza para Ventas Fuente de variacin Factores A:Publicidad B:Region INTERACCION AB Error TOTAL 170472. 43110.5 450339. 16 25 49 10654.5 1724.42 6.18 0.0000 54658.0 182098. 4 4 13664.5 45524.5 7.92 26.40 0.0003 0.0000 Suma de Cuadrados Gl Cuadrado Medio Fc Valor-P

Del anlisis de varianza que se muestra en el cuadro anterior se puede concluir con 95% de confianza que el factor publicidad influyen en el incremento de las ventas. (P-valor < 0.05), es decir algunos de estos tipos de publicidad genera mayor incremento en las ventas. Tambin del mismo cuadro se puede desprender que el factor regin influye (p-valor < 0.05) es decir que en determinados regiones las ventas son mayores que los otros. Para determinar que publicidad tiene mejor efecto en las ventas se aplica las pruebas de comparacin de mltiples que se ilustra grficamente.

200 170 140 110 80 50 E1 E2 E3 P ublic idad E4 E5

De este grafico se observa que el tipo de publicidad, E4 estadsticamente tienen mejor efecto en las ventas en comparacin con los otros tipos de publicidad. Por otra parte los tipos de publicidad E1 y E2 tienen similar efecto y el tipo de publicidad E5 tiene el menor efecto en las ventas. 210

V entas

CLETO DE LA TORRE

En el grafico siguiente se observa el anlisis del incremento en las ventas por Regin.

250 200 150 100 50 0 R1 R2 R3 Region R4 R5

Las ventas en las regin 5, son mayores en promedio que las otras regiones, en cambio las ventas en las regiones 3 y 4 son similares y menor a las ventas de la regin 5.

V entas

400

Region R1 R2 R3 R4 R5

300
V entas

200

100

0 E1 E2 E3 P ublicidad E4 E5

El tipo de publicidad E5, no presenta efecto en las regiones 4 y 5.

EJERCICIOS

211

ESTADISTICA

1. Una empresa, con el propsito de mejorar sus ventas disea 4 tipos de oferta, en tres regiones del pas. En el cuadro siguiente se muestra los resultados del incremento de ventas en dlares. Regin A I 109 110 II 110 112 III 116 114 B 110 115 110 111 119 115 Tipos de oferta C 108 109 111 109 124 119 D 110 108 114 112 120 117

Con 95% de confianza Cual es su conclusin respecto del efecto de la oferta? 2. El propietario de una empresa ha probado tres polticas diferentes de cambio de cheques para reducir el gran nmero de cheques sin fondo que recibia su empresa. El desea saber cual poltica minimiza el problema. En el cuadro siguiente se muestra la reduccin del nmero de cheques sin fondos que recibe esta empresa. Poltica A B C

48 42 68 54 59 71 78 62 87 83 80 98 96 92 10 Pruebe si hay diferencia entre los tres tipos de poltica, usando un nivel de significacin de 5%

3. La tabla siguiente muestra el posicionamiento de un producto de 4 marcas (A, B, C y D) en una regin del pas. Contrastar a un nivel de confianza de 95%, la hiptesis nula de que no existe diferencia en el posicionamiento en le mercado de las 4 marcas. Posicionamiento (%)

212

CLETO DE LA TORRE

Marca A Marca B Marca C Marca D

10 4 15 7

37 35 5 11

12 32 10 1

31 19 12 8

11 33 6 2

9 18 6 5

23 8 15 3

4.- La estructura financiera de una firma se refiere a la forma en que se dividen los activos de la empresa por debe y haber, y el apalancamiento financiero se refiere al porcentaje de activos financiados por deuda. En un estudio financiero se afirma que el apalancamiento financiero puede utilizarse para aumentar la tasa de rendimiento sobre la inversin, es decir que, los accionistas pueden recibir rendimientos ms altos con la misma cantidad de inversin gracias a su uso. Los siguientes datos muestran las tasas de rendimiento utilizando 3 diferentes niveles de apalancamiento financiero y un nivel de control (deuda cero) de empresas seleccionadas al azar: Tasas de Rendimiento Control 4.6 2 6.8 4.2 1.6 Bajo 2 7.4 1.8 3.2 4 Medio 7 4.5 11.6 6 6.8 Alto 7.9 6.8 5.8 9.2 11

En funcin de la informacin cual su conclusin de este estudio.

213

ESTADISTICA

Tabla Normal Estndar

Z 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9

0 0 0.03983 0.07926 0.11781 0.15542 0.19146 0.22575 0.25804 0.28814 0.31594 0.34134 0.36433 0.38493 0.4032 0.41924 0.43319 0.4452 0.45543 0.46407 0.47128 0.47725 0.48214 0.4861 0.48928 0.4918 0.49379 0.49534 0.49653 0.49744 0.49813 0.49865 0.49903 0.49931 0.49952 0.49956 0.49977 0.49984 0.49989 0.49993 0.49995

0.01 0.00399 0.04395 0.08617 0.12172 0.1591 0.19497 0.22907 0.26115 0.29103 0.31859 0.34375 0.3665 0.38686 0.4049 0.42073 0.43448 0.4463 0.45637 0.46485 0.47193 0.47778 0.48257 0.48645 0.48956 0.49202 0.49396 0.49547 0.49664 0.49752 0.49819 0.49869 0.49906 0.49934 0.49953 0.49968 0.49978 0.49985 0.4999 0.49993 0.49995

0.02

0.03

0.04

0.05

0.06 0.02392 0.06356

0.07 0.0279 0.0675

0.08 0.03188 0.07124 0.11026 0.14803 0.18439 0.21904 0.25175 0.2823 0.31057 0.33646 0.35993 0.381 0.39973 0.41621 0.43056 0.44295 0.45352 0.46246 0.46995 0.47615 0.48124 0.48537 0.4887 0.49134 0.49343 0.49506 0.49632 0.49728 0.49801 0.49856 0.49897 0.49926 0.49948 0.49964 0.49975 0.49983 0.49988 0.49992 0.49995 0.49997

0.09 0.03586 0.07534 0.11409 0.15173 0.18793 0.2224 0.2549 0.28524 0.31327 0.33891 0.36214 0.38298 0.40147 0.41774 0.43189 0.44408 0.45449 0.46327 0.47062 0.4767 0.48169 0.48574 0.48899 0.49158 0.49361 0.4952 0.49643 0.49736 0.49807 0.4986 0.499 0.49929 0.4995 0.49965 0.49976 0.49983 0.49989 0.49992 0.49995 0.49997

0.00798 0.01197 0.01595 0.01994 0.04776 0.05172 0.05567 0.05962 0.08706 0.09095 0.09483 0.09871 0.12552 0.16276 0.1293 0.13307 0.13683 0.1664 0.17003 0.17364 0.2054 0.20884

0.10257 0.10642 0.14058 0.14431 0.17724 0.18082 0.21226 0.21566 0.24537 0.24857 0.27637 0.27935 0.3051 0.30785 0.33147 0.33398 0.35543 0.35769 0.37698 0.379 0.39616 0.39796 0.41308 0.41466 0.42785 0.42922 0.44062 0.44179 0.45154 0.45254 0.46079 0.46164 0.46856 0.46926 0.475 0.47558 0.4803 0.48077 0.48461 0.48809 0.49086 0.485 0.4884 0.4911

0.19847 0.20194 0.26424

0.23237 0.23565 0.23891 0.24215 0.2673 0.27035 0.27337 0.29389 0.29373 0.29955 0.30234 0.32124 0.32381 0.32639 0.32894 0.34614 0.34849 0.35083 0.35314 0.36864 0.37076 0.37286 0.37923 0.38877 0.39065 0.39251 0.39435 0.40658 0.40824 0.40988 0.41149 0.4222 0.42364 0.42507 0.42647 0.43574 0.43699 0.43822 0.43943 0.44738 0.44845 0.4495 0.45053 0.45728 0.45818 0.45907 0.45994 0.46562 0.46637 0.46712 0.46784 0.47257 0.4732 0.47381 0.47441 0.47831 0.47882 0.47932 0.47982 0.48299 0.48341 0.48382 0.48422 0.48679 0.48713 0.48745 0.48778 0.48983 0.49001 0.49036 0.49061 0.49224 0.49245 0.49266 0.49286 0.49413 0.4943 0.49446 0.49461 0.4956 0.49573 0.49585 0.49597 0.49674 0.49683 0.49693 0.49702 0.4976 0.49767 0.49774 0.49781 0.49825 0.4983 0.49836 0.49841 0.49874 0.49878 0.49882 0.49886 0.4991 0.49913 0.49916 0.49918 0.49936 0.49938 0.49969 0.4994 0.49942 0.4996 0.49955 0.49957 0.49958 0.49978 0.49979 0.4999

0.49305 0.49324 0.49477 0.49491 0.49609 0.49621 0.49711 0.4972 0.49788 0.49795 0.49846 0.49851 0.49889 0.49893 0.49921 0.49924 0.49944 0.49946 0.49961 0.49962 0.49973 0.49974 0.49981 0.49982 0.49987 0.49988 0.49992 0.49992 0.49994 0.49995 0.49996 0.49996

0.4997 0.49971 0.49972 0.4998 0.49981

0.49985 0.49986 0.49986 0.49987 0.4999 0.49991 0.49991 0.49993 0.49994 0.49994 0.49994 0.49996 0.49996 0.49996 0.49996

214

CLETO DE LA TORRE

TABLA DE LA DISTRIBUCION T-STUDENT


gl

p x c

0.75 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.7 0.697 0.695 0.694 0.692 0.691 0.69 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.681 0.679 0.677 0.674

0.80 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.851 0.848 0.845 0.842

0.85 1.963 1.386 1.250 1.190 1.156 1.134 1.119 1.108 1.100 1.093 1.088 1.083 1.079 1.076 1.074 1.071 1.069 1.067 1.066 1.064 1.063 1.061 1.060 1.059 1.058 1.058 1.057 1.056 1.055 1.055 1.050 1.046 1.041 1.036

0.9 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.296 1.289 1.282

0.95

0.975

0.99

0.995

6.314 12.706 31.821 63.657 2.920 4.303 6.965 9.925 2.353 3.182 4.541 5.841 2.132 2.776 3.747 4.604 2.015 2.571 3.365 4.032 1.943 2.447 3.143 3.707 1.895 2.365 2.998 3.499 1.860 2.306 2.896 3.355 1.833 2.262 2.821 3.250 1.812 2.228 2.764 3.169 1.796 2.201 2.718 3.106 1.782 2.179 2.681 3.055 1.771 2.160 2.650 3.012 1.761 2.145 2.624 2.977 1.753 2.131 2.602 2.947 1.746 2.120 2.583 2.921 1.740 2.110 2.567 2.898 1.734 2.101 2.552 2.878 1.729 2.093 2.539 2.861 1.725 2.086 2.528 2.845 1.721 2.080 2.518 2.831 1.717 2.074 2.508 2.819 1.714 2.069 2.500 2.807 1.711 2.064 2.492 2.797 1.708 2.060 2.485 2.787 1.706 2.056 2.479 2.779 1.703 2.052 2.473 2.771 1.701 2.048 2.467 2.763 1.699 2.045 2.462 2.756 1.697 2.042 2.457 2.750 1.684 2.021 2.423 2.704 1.671 2.000 2.390 2.660 1.658 1.980 2.358 2.617 1.645 1.960 2.326 2.576

215

ESTADISTICA

TABLA DE LA DISTRIBUCION CHI CUADRADO ( p x c gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 0.01 0 0.01 0.07 0.21 0.41 0.68 0.99 1.34 1.73 2.16 2.6 3.07 3.57 4.07 4.6 5.14 5.7 6.26 6.84 7.43 8.03 8.64 9.26 9.89 10.5 13.8 17.2 20.7 24.3 28 31.7 35.5 39.4 43.3 47.2 51.2 55.2 59.2 63.3 0.01 0 0.02 0.11 0.3 0.55 0.87 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.9 9.54 10.2 10.9 11.5 15 18.5 22.2 25.9 29.7 33.6 37.5 41.4 45.4 49.5 53.5 57.6 61.8 65.9 0.025 0 0.05 0.22 0.48 0.83 1.24 1.69 2.18 2.7 3.25 3.82 4.4 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.28 10.98 11.69 12.4 13.12 16.79 20.57 24.43 28.37 32.36 36.4 40.48 44.6 48.76 52.94 57.15 61.39 65.65 69.92 0.05 0 0.1 0.35 0.71 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 11.59 12.34 13.09 13.85 14.61 18.49 22.47 26.51 30.61 34.76 38.96 43.19 47.45 51.74 56.05 60.39 64.75 69.13 73.52 0.1 0.02 0.21 0.58 1.06 1.61 2.2 2.83 3.49 4.17 4.87 5.58 6.3 7.04 7.79 8.55 9.31 10.09 10.86 11.65 12.44 13.24 14.04 14.85 15.66 16.47 20.6 24.8 29.05 33.35 37.69 42.06 46.46 50.88 55.33 59.79 64.28 68.78 73.29 77.82 0.2 0.06 0.45 1.01 1.65 2.34 3.07 3.82 4.59 5.38 6.18 6.99 7.81 8.63 9.47 10.31 11.15 12 12.86 13.72 14.58 15.44 16.31 17.19 18.06 18.94 23.36 27.84 32.34 36.88 41.45 46.04 50.64 55.26 59.9 64.55 69.21 73.88 78.56 83.25 0.4 0.27 1.02 1.87 2.75 3.66 4.57 5.49 6.42 7.36 8.3 9.24 10.18 11.13 12.08 13.03 13.98 14.94 15.89 16.85 17.81 18.77 19.73 20.69 21.65 22.62 27.44 32.28 37.13 42 46.86 51.74 56.62 61.51 66.4 71.29 76.19 81.09 85.99 90.9 0.6 0.71 1.83 2.95 4.04 5.13 6.21 7.28 8.35 9.41 10.47 11.53 12.58 13.64 14.69 15.73 16.78 17.82 18.87 19.91 20.95 21.99 23.03 24.07 25.11 26.14 31.32 36.47 41.62 46.76 51.89 57.02 62.13 67.25 72.36 77.46 82.57 87.67 92.76 97.85 0.8 1.64 3.22 4.64 5.99 7.29 8.56 9.8 11.03 12.24 13.44 14.63 15.81 16.98 18.15 19.31 20.47 21.61 22.76 23.9 25.04 26.17 27.3 28.43 29.55 30.68 36.25 41.78 47.27 52.73 58.16 63.58 68.97 74.35 79.71 85.07 90.41 95.73 101.05 106.36 0.9 2.71 4.61 6.25 7.78 9.24 10.64 12.02 13.36 14.68 15.99 17.28 18.55 19.81 21.06 22.31 23.54 24.77 25.99 27.2 28.41 29.62 30.81 32.01 33.2 34.38 40.26 46.06 51.81 57.51 63.17 68.8 74.4 79.97 85.53 91.06 96.58 102.1 107.6 113 0.95 3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25 26.3 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.42 37.65 43.77 49.8 55.76 61.66 67.5 73.31 79.08 84.82 90.53 96.22 101.88 107.52 113.15 118.75

1
0.975 5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.53 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 46.98 53.2 59.34 65.41 71.42 77.38 83.3 89.18 95.02 100.8 106.6 112.4 118.1 123.9

) 0.99 6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58 32 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 50.89 57.34 63.69 69.96 76.15 82.29 88.38 94.42 100.4 106.4 112.3 118.2 124.1 130 0.995 7.88 10.6 12.84 14.86 16.75 18.55 20.28 21.95 23.59 25.19 26.76 28.3 29.82 31.32 32.8 34.27 35.72 37.16 38.58 40 41.4 42.8 44.18 45.56 46.93 53.67 60.27 66.77 73.17 79.49 85.75 91.95 98.1 104.2 110.3 116.3 122.3 128.3 134.3

216

CLETO DE LA TORRE

PRUEBAS DE HIPTESIS

SI 1 grupo n20 NO Distribucin Normal NO SI Prueba T para la media Prueba Z para la media

Prueba del signo para la mediana

SI

Prueba Z para la diferencia de medias

SI

n30

SI

Nmero de Grupos

2 grupos

i n d e p e n d i e n t e s
NO

Varianzas iguales

SI Prueba T para la diferencia de medias


Prueba T para la diferencia de medias con ajuste de NO grados de libertad.

NO

Distribucin normal

NO

Prueba de Mann Whintney para comparacin de poblaciones

SI

Prueba Z para la media de la diferencia en datos apareados SI

n30

Prueba T para la media de la diferencia en datos apareados Prueba del signo o de Wilcoxon para datos apareados

NODistribucin

normal

NO

3 o ms grupos

i n d e p e n d i e n t e s

SI

ANOVA comparacin de tratamientos

Distribucin normal SI con varianzas semejantes


NO SI

Prueba de Krusskal Wallis comparacin de tratamientos.

Distribucin normal con varianzas NO semejantes


NO

ANOVA en bloque - comparacin de tratamientos. Prueba de Friedman - comparacin de tratamientos.

217

ESTADISTICA

PRUEBAS DE HIPTESIS
SI Prueba Z para la proporcin poblacional 1 grupo

Muestra grande nP y n(1-P) > 5


NO
SI

Prueba Binomial para la proporcin poblacional

SI

Prueba exacta de Fisher comparacin de proporciones

2 grupos

Nmero de Grupos

i n d e p e n d i e n t e s

SI

Frecuencias esperadas pequeas


No Prueba Z o Ji-Cuadrado para comparacin de proporciones NO

NO

Prueba de McNeman Comparacin de proporciones

SI

Prueba Ji - Cuadrado (reunir categoras) Para comparacin de proporciones

3 o ms grupos

i n d e p e n d i e n t e s

SI

Frecuencias esperadas pequeas


No Prueba Ji-Cuadrado para comparacin de proporciones NO

NO

Prueba Q de Cockran Comparacin de proporciones

218

CLETO DE LA TORRE

PRUEBAS DE HIPTESIS
Coeficiente de correlacin lineal de pearson

Continua

Ordinal y/o cardinal

Coeficiente de correlacin por rangos de Spearman

Escala de medicin para ambas variables.


SI

-Prueba de chi-cuadrado (Coeficiente de contingencia) -Riesgos relativos( Estudios Cohorte). -Odds Ratio( Estudios caso-control) -Coeficiente de correlacin

Nominal

Cada variable tiene dos categoras (Tabla 2x2)

NO

Prueba de chi-cuadrado para independencia de variables (Coeficiente de contingencia)

219

ESTADISTICA

MTODOS ESTADSTICOS DE ACUERDO AL TIPO DE VARIABLES y NIVEL DE INVESTIGACION.

Tipo de Descripcin Variables individuales

Tipo de variable

Nivel de investigacin

Mtodo o Tcnica Estadstica. Tabla de Frecuencias, proporciones, o porcentajes. Representados por grafico de barras, sectores o pictogramas.

Cualitativa (Nominal y Ordinal)

DESCRIPTIVA

Escala de actitud de Likert)

Intervalo de confianza y prueba de hiptesis de la proporcin.

Variables individuales

Cuantitativa (Intervalo o razn)

DESCRIPTIVA

-Distribucin de frecuencias por intervalos. -Medias, desviacin , , varianza, percentiles. -Intervalo de confianza y prueba de hiptesis de la media. -Anlisis factorial, anlisis de compontes principales.

Asociacin entre variables

V. Ind: Cualitativa con V.Dep: Cualitativa

EXPLICATIVA

-Tablas de contingencia. -Calculo de riesgos. -Pruebas de chicuadrado: independencia -Grafico de barras de doble entrada. -Pruebas de Kendall, de Spearman.

220

CLETO DE LA TORRE

-Anlisis de correspondencias Asociacin entre variables V. Ind: : Cualitativa(s) (Grupos) con V.Dep: Cuantitativa (Rpta) COMPARATIVA, -Tablas con clasificacin categrica, con promedios, desviaciones, etc. -prueba t-student

Asociacin entre variables

V. Ind: : Cualitativa(s) (factores) con V.Dep: Cuantitativa(Rpta)

EXPERIMENTAL, CUASI EXPERIMENTAL

Diseo experimental (ANOVA) -Prueba de comparacin de medias.

Asociacin entre variables

V. Ind: : Cuantitativa(s) con V.Dep: Cuantitativa

RELACIONAL, CORRELACIONAL

-Grafico de dispersin. - Anlisis de regresin. -coeficiente de correlacin de pearson.

Asociacin entre variables

V. Ind: : Cuantitativa(s), cualitativa(s) Con V.Dep: Cualitativa

EXPLICATIVA

-Regresin Logstica. -Anlisis Discriminante.

221

ESTADISTICA

PRUEBAS ESTADSTICAS DE ACUERDO A LA ESCALA DE MEDICIN DE LA VARIABLE. Tipo de Descripcin Variables individuales Escala de la variable Nominal -Prueba Z para una proporcin poblacional. -Prueba de chi-cuadrado para varias proporciones en una sola poblacin. -Intervalos de confianza para proporciones. -Prueba de McNemar, -Prueba de Mantel Haenzel Variables individuales o ms de una variable Ordinales -Prueba de signos o binomial para la media poblacional. -Pruebas de wilcoxon para rangos. Prueba de U Mann Whitney( dos o ms poblaciones) -Prueba de Kruskal Wallis. -Prueba de Friedman. Variables individuales Mas de una variables Intercalar o de razn. Intercalar o de razn -Prueba de t para una media poblacional. -intervalos de confianza. -Prueba de hipotes e intervalos de confianza para diferencia de medias. -Prueba de varianzas Mtodo o Tcnica Estadstica.

222