Вы находитесь на странице: 1из 72

SEMINARIO PERMANENTE DE TESIS

Curso 2012

Dr. Manuel Daz Molina

HACIA LA CONFECCIN DE UN PRODUCTO ESCRITO

!!!Calidad de Estructura y lgica internas. la tesis Introduccin. parmetros Conclusiones. mnimos Uso del lenguaje: estilo, vocabulario, gramtica, ortografa y puntuacin. Errores comunes y recomendaciones. Citas y notas al pie de pgina. Reglas concernientes a los nombres de los autores. Reglas concernientes a las obras. Bibliografa. Indice general e ndice detallado. Indice de tablas y grficos. Anexos.

Bibliografa. Indice general e ndice detallado. Indice de tablas y grficos. Anexos.

Existen requisitos mnimos para una Tesis Doctoral?

Presentacin final. Exposicin oral. Publicacin. Informes. Monografas. Artculos cientficos. Artculos de divulgacin. Tesis de grado. Tesis de postgrado. Tesis Doctorales.

Cules son las diferencias entre tesis doctoral y artculos cientficos?

CUAL ES EL FUNDAMENTO FILOSOFICO DE LA INVESTIGACION?

El ser humano esta en constante bsqueda de explicaciones. Desea Conocer-Describir-Interpretar los fenmenos. El punto de partida de la ciencia reside en la voluntad del hombre de servirse de su razn para comprender y controlar su naturaleza; pues el primer problema planteado por la ciencia estriba en saber, como es posible su existencia (Abarca 1991). Comprender y Predecir.

Complejidad en relacin a la experiencia humana, en el mundo actual (multiplicidad de fueras polticas, econmicas, fsicas, biolgicas, psicolgicas que intervienen en su conformacin).

Formulacin de generacin del investigacin).

diversos paradigmas en la conocimiento (enfoques de

PARADIGMA Concepcin del objeto de estudio de una ciencia, de los problemas generales a estudiar, de la naturaleza de sus mtodos y tcnicas, de la informacin requerida y finalmente, de la forma de explicar, interpretar o comprender, segn sea el caso los resultados de la investigacin realizada.

FILOSOFIA

Intento del espritu humano para llegar a una concepcin del universo mediante la AUTOREFLEXION SOBRE SUS FUNCIONES VALORICAS TEORICAS Y PRACTICAS TEORIA DE LA CONCEPCION DEL UNIVERSO

EPISTEMOLOGIA EPISTEME= SABER /CONOCIMIENTO LOGOS= ESTUDIO

CIENCIA

FILOSOFIA

REFLEXION SOBRE UNA CONDUCTA TEORICA

TEORIA DEL CONOCIMIENTO CIENTIFICO O TEORIA DE LA CIENCIA

COMO REFLEXION SOBRE LA CONDUCTA PRACTICA (VALORES) TOMA SENTIDO DE TEORIA DE LOS VALORES.
Fuente: Vargas-Mendoza (2006)

DIFICULTADES DE LA TEORIA DEL CONOCIMIENTO

La posibilidad del conocimiento humano puede realmente el sujeto aprehender el objeto? El origen del conocimiento es la razn o la experiencia la fuente del conocimiento humano? La esencia del conocimiento humano es el sujeto el que determina al objeto o viceversa? Las formas del conocimiento humano el conocimiento es racional o puede ser intuitivo?

El criterio de verdad cmo sabemos que nuestro conocimiento es verdadero?

ORIGEN DEL CONOCIMIENTO

RACIONALISMO

EMPIRISMO

INTELECTUALISMO

APRIORISMO

Postura epistemolgica que sostiene que es el pensamiento , la razn, la fuente principal del conocimiento humano. Platn, San Agustn, Descartes, Leibnitz.

Sostiene que el conocimiento proviene de la experiencia, del contacto directo con la realidad. Se desarrolla en la edad moderna con Locke y Hume, Condillac y Jhon Stuart Milltz.

Postura que trata de mediar entre racionalismo y empirismo. Aristteles inicia y en la edad media Santo Thomas de Aquino. Concibe el elemento racional como derivado del emprico.

Es un segundo intento entre racionalismo y empirismo. Se considera a Kant como su fundador. Concibe que el elemento a priori no proviene de la experiencia, sino del pensamiento.

John Locke (1632-1704) Ensayo del Conocimiento Emmanuel Kant (1724-1804) Crtica de la Razn Pura

ESENCIA DEL PROBLEMA EN INVESTIGACION

DISCERNIMIENTO ENTRE LA RELACION DE SUJETO OBJETO


INTENTOS DE SOLUCION

Premetafsica

Metafsica

Teologa

SOLUCIONES METAFSICAS

REALISMO
Postura epistemolgica que afirma que existen cosas reales ,independientes de la conciencia .Esta postura se encentra en Demcrito, Galileo, Descartes, Loccke, Sheller.

FENOMENALISMO IDEALISMO
No existen cosas reales independientes de la conciencia. Para Berkeley el ser de las cosas equivale a ser percibidas. Para Mach la nica fuente del conocimiento es la sensacin. Teora intermedia segn la cual, no conocemos las cosas como realmente son, en s mismas, sino como se nos aparecen. El mundo se nos presenta en razn a una organizacin a priori de la conciencia y no por las cosas en si mismas. (Kant).

CIENCIA MODERNA
RAICES

Francis Bacon (1561-1526) Galileo (1564-1642) Escuela positivista Augusto Comte (1798-1857) Estados por los que ha transitado el conocimiento : teolgico, metafsicos y cientficos (positivo). Escuela fenomenolgica Edmund Husser (1859-1938) describir las esencias dada a la conciencia, rechazando toda explicacin causal de los fenmenos. Descripcin pura, se captan por intuicin o captacin inmediata (Antropologa, Sociologa)

VERIFICACION DE LA VERDAD

EMPIRISMO LOGICO O NEOPOSITIVISMO

CIRCULO DE VIENA Morizt Schlick (1882-1936) Rudlof Carnap (1871-1970) Friedrich Waismann yOtto Neurath

Principio de la verificabilidad; dos tipos de proposiciones, las dotadas de sentido y las carentes por entero de sentido. Su mximo inters est en determinar el criterio objetivo de validacin o justificacin del conocimiento.

RACIONALISMO CRTICO KARL RAIMUND POPPER (1902-1994)


Conjeturas y refutaciones (1963)

Ataca el racionalismo de Descartes y el empirismo de Hume.

En el comienzo del saber, solo hay CONJETURAS, modelos, hiptesis, teora siempre sometida a revisin la FALSACION es un criterio OBJETIVO. Gracias a ella, puede darse un progreso en el conocimiento de la ciencia. Este progreso no por la comprobacin de las teoras, sino por su refutacin, no por verificacin, sino por falsacin. El mtodo hipottico-deductivo es fuente de verdadero conocimiento y progreso cientfico. Es la lgica deductiva la base del mtodo cientfico. Segn esta lgica, si las premisas de una inferencia vlida son verdaderas, la conclusin debe ser tambin verdadera.

EJEMPLO: INVESTIGACION CUALITATIVA

La percepcin como pauta de anlisis espacial

Fuente: De Castro, 1997.

DIFERENTES REALIDADES La percepcin como pauta de anlisis espacial

Fuente: De Castro, 1997.

Taxonoma de Bloom
Categoriza niveles de abstraccin de las habilidades cognitivas en orden creciente

Nivel 1 Nivel 2 Nivel 3 Nivel 4 Nivel 5 Nivel 6

Conocimiento (recordar hechos, ideas, conceptos, principios) Comprensin (explicar, interpretar el sentido de la informacin) Aplicacin (utilizar un concepto, un principio, un mtodo o una teora para resolver un problema) Anlisis (identificar y separar los componentes de la informacin, extraer la relacin, jerarquizar las ideas) Sntesis (crear nuevas ideas, generalizar, relacionar, deducir, extraer conclusiones) Evaluacin (tomar decisiones razonadas, realizar un juicio basado en una batera de criterios preestablecidos)

Bloom, B. S. (1956) Taxonomy of Educational Objectives.

EL MTODO CIENTFICO M CIENT

La observacin: se observa un problema y se realiza una revisin observaci revisi bibliogrfica. bibliogr La formulacin de hiptesis: una vez observado el problema y formulaci hip ahondado un poco ms en el se trata de elaborar explicaciones m provisionales que lo describan de la mejor forma posible. La realizacin de predicciones: a partir de las hiptesis se realizan realizaci hip predicciones de lo que se tendr que encontrar bajo determinadas tendr condiciones en el caso de que resultara cierta.

Verificacin de las hiptesis: para poder verificar las hiptesis del Verificaci hip hip estudio se hace necesario elaborar un diseo de investigacin que dise investigaci incluya la seleccin de los mtodos ms acordes a los objetivos que selecci m m se persiguen, la seleccin de los instrumentos de obtencin de la selecci obtenci informacin, el tipo de muestreo a realizar y el anlisis de los datos informaci an obtenidos en el trabajo de campo. Replicacin: tras las realizacin del trabajo de campo y el anlisis e Replicaci realizaci an interpretacin de la informacin obtenida se estar en condiciones de interpretaci informaci estar rechazar, modificar o mantener las hiptesis de partida. Este proceso hip es pblico y se da a conocer para que otros cientficos puedan p cient duplicar la investigacin. Tras ser repetidamente contrastada las investigaci hiptesis de partida se podrn convertir finalmente en teora. hip podr teor

10

LA PLURALIDAD METODOLGICA ACTUAL METODOL

Cuantitativa (mtodo deductivo en el cual se subrayan la confiabilidad y el hecho de poder reproducir la investigacin): se rige por criterios de distribucin representatividad estadstica.

Cualitativa (mtodo inductivo en el cual el investigador sigue el diseo de la investigacin y subraya la validez): proporciona informacin de desvela el punta de vista del actor obtenida a travs de anlisis de documentos y entrevistas en profundidad y se desvela a medida que el estudio progresa.

Utilizacin de ambos enfoques:


El modelo de las dos etapas: dentro de una misma investigacin, se aplica primero un enfoque y despus el otro, de forma casi independiente, y en cada etapa se siguen las tcnicas correspondientes a cada enfoque.

El modelo de enfoque dominante: se lleva a cabo bajo la perspectiva de alguno de los enfoques, el cual prevalece, y el estudio conserva componentes del otro enfoque.

El modelo mixto: Constituye el mayor nivel de integracin entre los enfoques cualitativo y cuantitativo, donde los dos se combinan durante todo el proceso de investigacin: triangulacin.

Este concepto nace en la topografa y la navegacin adquiriendo el significado de: utilizacin de mltiples puntos de referencia para localizar la posicin exacta de un objeto en el espacio. En nuestro caso se refiere a la utilizacin de distintas metodologas en el anlisis de una misma realidad social.

11

Problemas:

a) La dificultad de obtener mediciones exactas. b) La posible influencia del proceso de medicin sobre los medici resultados. c) La dificultad del uso de experimentos para probar las hiptesis hip de partida.

ESTADISTICA HERRAMIENTA QUE APORTA MAYOR OBJETIVIDAD

ESTADSTICA
Definicin
La estadstica puede ser definida como: Ciencia que se ocupa del estudio de fenmenos de tipo genrico, normalmente complejos y enmarcados en un universo variable, mediante el empleo de modelos de reduccin de la informacin y de anlisis de validacin de los resultados en trminos de representatividad (Sanchz-Crepso, Manzano 2002).

12

Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las caractersticas de todas las observaciones bajo consideracin.

INVESTIGACIN El uso de la Estadstica es muy amplio, resulta difcil nombrar un rea en la cual no se utilice. Los mtodos estadsticos han encontrado aplicacin en:

Gobierno Negocios Ciencias Sociales Ingeniera Ciencias Fsica y Naturales Educacin Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual.

13

Definicin

Descriptiva

Es la ciencia y tcnica que tiene que ver con la recoleccin, procesamiento, anlisis e interpretacin de datos.

ESTADSTICA DESCRIPTIVA
Incluye la tabulacin, representacin y descripcin de conjuntos de datos. A partir de ellos se puede organizar, simplificar y resumir informacin bsica.

Conjunto de datos
Cualquier investigacin estadstica comienza con la definicin de los datos de la investigacin. Qu son los datos? Qu se puede hacer con los datos de la investigacin? Una de las primeras cuestiones a resolver es organizar los datos de tal forma que tengan una disposicin que facilite la lectura y el entendimiento de ellos. En este sentido, la primera accin a realizar es ordenar los datos desde el punto de vista que a nosotros nos interesa investigar.

14

LAS VARIABLES
Datos se colectan sobre las caractersticas especficas de cada sujeto, formndose grupos para ser comparados.

Estas caractersticas se llaman variables, ya que cambian de sujeto a sujeto.

CLASIFICACIN
Las variables pueden ser clasificadas como cuantitativas (intervalares) o cualitativas (categricas), dependiendo si los valores presentados tienen o no un orden de magnitud natural (cuantitativas), o simplemente un atributo no sometido a cuantificacin (cualitativa). Una variable es medida utilizando una escala de medicin. La eleccin de la (s) escala (s) de medicin a utilizar depende, en primer lugar, del tipo de variable en estudio, y, adems, del manejo estadstico a la que se someter la informacin. En trminos prcticos, existe una correspondencia directa entre el concepto de variable y escala de medicin.

15

Clasificacin por su escala de medicin:

Cualitativas
Dicotmicas-binarias: cuando slo pueden adoptar un slo valor sin jerarqua entre s; hombre - mujer, positivo-negativo, presente-ausente. Ordinales: cuando adems, se suma la posibilidad de poderse ordenar, en el sentido de mayor que o menor que. (nivel socioeconmico, nivel de renta, nivel educacional etc). Nominales cuando los datos correspondan a una variable cualitativa que se agrupa sin ninguna jerarqua entre s, como por ejemplo: nombres de personas, de establecimientos, raza, grupos sanguneos, estado civil, color de pelo, etc. Estas variables no tienen ningn orden inherente a ellas ni un orden de jerarqua.

Cuantitativas
Discretas Cuando no cabe la posibilidad de hallar valores intermedios, comprendidos entre dos atributos de la variable (n de hijos, n de contratos). Continuas Son aquellas variables en las cuales se pueden hallar valores intermedios entre dos valores dados, al formar una escala ininterrumpida de valores ej: peso, altura,etc.

16

Segn su funcin en la investigacin: Seg funci investigaci

Independientes: se trata de aquellas dimensiones de un fenmeno que pretenden explicar a la variable dependiente. Se trata de la variable que afecta a la dependiente, a la que hay que medir. Figuran en las hiptesis de la investigacin e indican posible causa de la variacin de la variable que centra el inters de la investigacin. Ej.: Por qu la inflacin es mayor cuando existe alto nivel de consumo? Creo que la variable que da respuesta a esta interrogante puede ser el aumento del dinero circulante. As, la inflacin sera la variable dependiente y el aumento del circulante sera la independiente, es decir la que explicara lo que estoy tratando de averiguar. . Dependientes: son aquellas cuyos atributos dependen de las independientes. En caso de hacerse un grfico que muestre mejor el funcionamiento de las variables, deben aparecer ambas.

Perturbadoras o intervinientes:

Son aquellas dimensiones que median entre las variables dependientes y las independientes. En la relacin entre las anteriores cabe la posibilidad, siempre, de que existan otras variables mediando en esa relacin. Se tratan de explicaciones alternativas. Si su efecto se controla bien, dejan de ser perturbadoras y se convierten en variables de control. Ej. Los accidentes de auto entre los jvenes de entre 18 y 28 aos se deben al consumo de alcohol. Tenemos que la variable dependiente son los accidentes de trfico y la independiente el consumo de alcohol. Las variables perturbadoras podran ser: velocidad del vehculo, condiciones atmosfricas, que pueden considerarse causas secundarias, segn los resultados de la investigacin y terminan siendo controlados. Se van tratando de eliminar .

17

HERRAMIENTAS BSICAS EN ESTADSTICA DESCRIPTIVA


Variables Descripcin Estadsticos y Grficos

Cualitativas en frecuencias escala nominal

valores no mtricos con ausencia de orden entre ellos (Sexo, hbito

Distribucin de Moda,%,tasas, razones

de fumar, color de ojos, religin)

Cualitativas en escala ordinal

Valores no mtricos con presencia de orden

Mnimo, Mxima Mediana, Cuartiles

entre ellos (grados militares, Percentiles, Grficos organigrama de una empresa, de caja.

escalafn de los profesores universitarios,

Variables Grficos

Descripcin

Estadsticos y

Cuantitativas en

Cuantitativas

Media, Rango, Varianza Desviacin Tpica, C.V. Coeficiente Simetra

escala de intervalo discretas o razn continuas

en escala de intervalo Coeficiente Kurtosis en escala de razn Histograma

18

Nominal

Sirven para identificar objetos Los valores numricos son nombres de categoras Los nmeros no tienen magnitud Los nmeros no miden Ninguna relacin

Genero, profesiones, usuarios Identificacin de cuestionarios Tipos de establecimiento Variables ilustrativas en anlisis Tipos de ropa, tipos de empresa Factoriales

Estudios de segmentacin Identificacin de perfiles de consumidores

Ordinal

Establecen orden de prefrerencias Es una forma fcil de Recoger informacin

Preferencias por marcas

Estudios de preferencia Similitudes Disimilitudes Posicionamiento

Mtrica de Intervalo

Miden diferencias entre Objetos Los intervalos son iguales El cero no es origen Los valores numricos muestran orden y magnitud

Grados de acuerdo Temperaturas

Estudios de actitudes Estudios de opcin

Mtrica Continua

Los valores numricos muestran Origen, orden y distancia Los intervalos son iguales El cero es ausencia de magnitud

Edad Peso Renta Ventas Cuotas de mercado

Estudios de imagen Estudios de segmentacin Estudios de posicionamiento

POBLACIN Y MUESTRA
Poblacin: conjunto de todas las observaciones posibles de las caractersticas de inters (variable). Normalmente, es demasiado grande para poder abarcarlo. MUESTRA POBLACIN

Muestra: conjunto de observaciones obtenidas de la poblacin, deber ser representativo, esta formado por miembros seleccionados de la poblacin (individuos o unidades experimentales).

19

POBLACIN

MUESTRA

GARANTIAS QUE DEBE MANTENER LA MUESTRA

REPRESENTATIVIDAD

ACCESIBILIDAD

TAMAO

TIPO DE MUESTREO

20

UNIDADES DE MUESTREO

Unidades de muestreo: Es el elemento o elementos que se encuentran disponibles para su seleccin. Pueden coincidir, o no, con las unidades de la poblacin. Marco: para poder seleccionar la muestra se necesita disponer de un marco, en sentido estricto, es la lista de las unidades de muestreo y debe ser tal que: 1. Cada elemento de la poblacin figure en l. 2. Cada elementos de la poblacin figure una solo vez 3. Slo contenga los elementos de la poblacin

MUESTRA ALEATORIA

21

ERRORES EN EL MUESTREO

FUENTES DE ERROR

CARACTERSTICAS DEL ERROR No se puede eliminar Se puede acotar el error Decrece si la muestra se amplia Es menor cuanto mas homognea es la muestra

Aleatorio o del propio muestreo

El error existe porque se estudia la muestra El parmetro varia de una muestra a otra

Sistemtico o ajenos al muestreo

La muestra no es representativa porque ha sido mal seleccionada La muestra es difcil de localizar Preguntas mal redactadas Sesgo introducidos por el entrevistador Grupos que no quieren responder

Se puede reducir de forma Importante cuidando los detalles Crece con el tamao de la muestra Es necesario dar instrucciones claras y precisas

Accesibilidad:
Si bien las muestras deben especificarse en base a los requisitos de la investigacin, no es menos cierto que debe considerarse la dimensin de cun factible es contar con la participacin de la muestra que queremos estudiar

Del mismo modo, obliga a revisar distintas alternativas de muestreo antes de definir la muestra final
Esto implica dedicar tiempo especfico del desarrollo del estudio al contacto, reclutamiento y seguimiento de los sujetos muestrales

22

TIPOS DE MUESTRA

ENFOQUE CUANTITATIVO

ENFOQUE CUALITATIVO

PROBABILSTICA NO PROBABILSTICA PROBABIL PROBABIL

NO PROBABILSTICA PROBABIL

Ventajas que reporta el uso de Muestras:


Reduce los costos: Al obtener datos a partir de una muestra de una poblacin los costos sern menores ya que no ser necesario medir a toda la poblacin. Los costos estn tanto referido a los materiales, procedimientos como al personal. Mayor rapidez: Por el hecho de ser un subconjunto de la Poblacin permite acceder de manera ms eficiente y rpida para el levantamiento de los datos. Posibilita una mayor precisin de las observaciones al contar con un nmero restringido de casos a estudiar.

23

Muestreo NO PROBABILSTICO

La seleccin de la muestra no es aleatoria, sino que se basa en parte en el juicio del responsable de la investigacin. No se basa en ninguna teora de la probabilidad y por lo tanto no es posible calcular el precio del error cometido. No es posible calcular estos errores ni la confianza de las estimaciones que , adems, no siempre se reducen aumentando el tamao de la muestra. No es posible generalizar resultados ni extrapolar estos a ninguna situacin

PRINCIPALES CLASES DE MUESTREO NO PROBABILSTICO


La muestra se selecciona segn criterio de comodidad Rpido Se usa en encuesta a estudiantes, Establecimientos comerciales Investigaciones exploratorias Estadstica descriptiva

CONVENIENCIA

CRITERIO

La muestra se selecciona segn criterio de experto para unidades ms representativas Rapidez. Test en una empresa, Ciudades para test de mercado. Tamao de muestra pequeo

BOLA DE NIEVE

Comodidad seleccin muestra, Identificar caractersticas ms Escazas. Se usa para estudiar poblaciones muy especializadas y difciles de localizar.

24

Muestreo PROBABILSTICO

La seleccin de la muestra es al azar.

Cada elemento de la poblacin tiene la misma probabilidad de ser elegido. Se puede conocer el error y la confianza de las estimaciones.

Es en general, ms complicado que el no probabilstico pero es el nico que puede evaluar la representatividad de la muestra.

PRINCIPALES CLASES DE MUESTREO PROBABILSTICO


Muestreo aleatorio simple: se trata de aquella muestra estadstica estad representativa, en la cual las unidades o individuos van siendo sorteados al azar hasta lograr el nmero deseado de unidades, sin tener en cuenta otras n circunstancias excepto el hecho de pertenecer a la poblacin previamente poblaci definida. Todos los elementos tiene la misma probabilidad de ser elegidos ser El procedimiento sera el siguiente: ser Se asigna un nmero a cada individuo de la poblacin. n poblaci La seleccin se realiza mediante algn sistema mecnico: selecci alg mec La tmbola: consiste en numerar todos los elementos muestrales del 1 al n, t n, hacer fichas, una por cada elemento, revolverlas en una caja, e ir sacando n fichas, segn el tamao de la muestra. Los nmeros elegidos al azar seg tama n conformarn la muestra. conformar Seleccin sistemtica de elementos muestrales: implica seleccionar dentro Selecci sistem muestrales: de una poblacin N un nmero n de elementos a partir de un intervalo K=N/n poblaci n (algunos autores denominan a este sistema de seleccin como muestreo selecci aleatorio sistemtico). sistem tico). El uso de subprogramas de nmeros aleatorios de programas informticos n inform y otro procedimiento similar.

25

Muestreo aleatorio estratificado: es aquel en el cual se divide previamente a los individuos de la poblacin en grupos o poblaci categoras significativas y luego se seleccionan muestras de cada categor grupo (estrato). La muestra estratificada exige que determinada proporcin de la muestra total pertenezca a cada uno de los proporci estratos. Dentro de cada estrato se realiza un muestreo a travs de algunos trav de los procedimientos del muestreo aleatorio simple. El nmero de n individuos de cada estrato se decide por: a) Afijacin simple: la muestra total se divide en partes iguales. Afijaci b) Afijacin proporcional: se tiene en consideracin la proporcin de Afijaci consideraci proporci individuos de cada estrato en la poblacin. Este ltimo es el ms poblaci m recomendable. c) Afijacin ptima : depende del tamao del estrato y de la Afijaci tama heterogeneidad del estrato.

Organizacin de la informacin
Forma de agrupar y ordenar los datos de una investigacin.
Frecuencia absoluta (ni) de una variable estadstica Xi, es el nmero de veces que aparece en el estudio este valor . A mayor tamao de la muestra, aumentar el tamao de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N). Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es decir,

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de frecuencias Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi) que presentan esta caracterstica respecto al total de N, es decir el 100% del conjunto.

26

Frecuencia absoluta acumulada (Ni), es el nmero de veces ni en la muestra N con un valor igual o menor al de la variable. La ltima frecuencia absoluta acumulada deber ser igual a N. Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el nmero total de datos, N. Es decir,

Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)), que al igual que Fi deber de resultar al final el 100% de N.

Ejemplo: Se ha recogido una muestra de 42 PROFESORES segn indica Cuadro 1. Tabla Datos original a los cuales se les ha preguntado el salario que perciben mensualmente y se ha obtenido la siguiente tabla indicando, adems si el entrevistado era Hombre (M) o Mujer (F).
2560M 1470F 870F 3210M 2230M 4890M 2120F 2670F 3240M 3450M 2780M 3210M 2450F 850F 1650F 4200M 3400M 1100F 2200M 1650M 3240M 3210M 2400F 3600F 2400M 2700F 2150F 950M 1780F 2690F 1670F 1250M 2780M 3240M 1140F 1950F 2380M 2730M 3210M 4120F 1250F 850F

Cuadro 1. Datos originales

27

Se hace necesario ordenar y clasificar esta informacin para responder a un mnimo de cuestiones que el investigador desea saber.

sueldos Frequency 2 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 2 4 3 1 1 1 1 1 1 42 Percent 4,8 2,4 2,4 2,4 2,4 4,8 2,4 4,8 2,4 2,4 2,4 2,4 2,4 2,4 2,4 2,4 4,8 2,4 2,4 2,4 2,4 2,4 2,4 4,8 9,5 7,1 2,4 2,4 2,4 2,4 2,4 2,4 100,0 Valid Percent 4,8 2,4 2,4 2,4 2,4 4,8 2,4 4,8 2,4 2,4 2,4 2,4 2,4 2,4 2,4 2,4 4,8 2,4 2,4 2,4 2,4 2,4 2,4 4,8 9,5 7,1 2,4 2,4 2,4 2,4 2,4 2,4 100,0 Cumulative Percent 4,8 7,1 9,5 11,9 14,3 19,0 21,4 26,2 28,6 31,0 33,3 35,7 38,1 40,5 42,9 45,2 50,0 52,4 54,8 57,1 59,5 61,9 64,3 69,0 78,6 85,7 88,1 90,5 92,9 95,2 97,6 100,0

Tabla de frecuencias

Valid

Esta tabla da una idea de la distribucin de frecuencias relativas y acumuladas para todos los datos respecto al salario percibido por los entrevistados, sin mayores especificaciones.

850,00 870,00 950,00 1100,00 1140,00 1250,00 1470,00 1650,00 1670,00 1780,00 1950,00 2120,00 2150,00 2200,00 2230,00 2380,00 2400,00 2450,00 2560,00 2670,00 2690,00 2700,00 2730,00 2780,00 3210,00 3240,00 3400,00 3450,00 3600,00 4120,00 4200,00 4890,00 Total

28

Es necesario, sin embargo realizar un ordenamiento de los datos, pues se desea establecer un criterio de orden, en este caso interesa saber primero las frecuencias de salarios entre hombres y mujeres

sexo Frequency 20 22 42 Percent 47,6 52,4 100,0 Valid Percent 47,6 52,4 100,0 Cumulative Percent 47,6 100,0

Valid

femenino masculino Total

Esta tabla nos aporta mayor visualizacin de los datos pues sabemos a ciencia cierta, que ms de la mitad de los entrevistados fueron hombres.

Una manera de obtener una rpida visualizacin de los datos sera la representacin grafica a travs de histogramas de frecuencias. En este caso al analizar la variable salario el resultado sera el siguiente.

29

Esta representacin grfica parecera ms adecuada para responder a la frecuencia de salarios entre hombres y mujeres (en cuanto a nmero).

Un representacin grfica que respondera a un orden de criterio implcito en el cuadro 1 sera la siguiente.

30

El criterio implcito que indicaba los datos del Cuadro 1. era saber, entre otras cosas, si exista alguna diferencia entre los sueldos asignados a hombres y mujeres dentro de esta empresa. Para ellos era necesario primero realizar un orden de la informacin entregada.

Datos agrupados
Cuando el nmero de valores distintos que toma una variable discreta es grande o cuando sta sea continua, conviene agruparlos en clases. En general cuando la muestra consta de 30 o ms datos, es aconsejable agruparlos en clases. Cuando existen las frecuencias.

Decidir el nmero de clases entre 5 y 20. El nmero de clases es el entero ms prximo a

n
siendo n el nmero de datos. Es conveniente probar con varios y seleccionar la representacin ms clara. Su construccin requiere, en primer lugar, la seleccin de los lmites de los intervalos de clase.

31

Contar el nmero de observaciones de cada clase para obtener la frecuencia absoluta de la clase. Rango de datos =mximo mnimo. Rango / n clases = valor mnimo de amplitud para cubrir el rango. Para asegurarnos de que ningn valor cae en el lmite comenzaremos la primera clase ligeramente inferior al mnimo. Entonces la amplitud deber ser un poco mayor que el cociente obtenido. El lmite inferior se puede escoger por debajo del mnimo. En cada intervalo [a i , a i+1 ] se escoge un valor representativo de dicha clase, que denominamos marca de clase y que es m i = (a i + a i+1 )/2.

Para datos cuantitativos agrupados en clases, comnmente se utilizan tres grficos: Histogramas. Polgono de frecuencias. Ojiva o Polgono acumuladas. de frecuencias

32

HISTOGRAMA

Histograma

POLGONO DE FRECUENCIAS

33

OJIVAS

En consecuencia para agrupar datos y crear variables en intervalos: Indicar la amplitud de los intervalos: el recorrido de la variable dividido por el nmero de intervalos. Determinar la posicin del primer punto de corte ,sera el limite superior del primer intervalo Determinar el nmero de punto de cortes internos sera el nmero de intervalos menos 1.

34

La tabla 2 indica los salarios obtenidos por 26 profesores, edad, sexo, y especializacin en medio ambiente en una escuela bsica. Estos corresponde a crditos entregados en moneda extranjera (dlares).
1500(36)M si 800(25)H no 950(28)M no 1325(35)H si 1600(37)M si 1450(27)H si 1600(34)M no 1325(38)H no 1500(35)M si 950(24)M si 1450(34)M no 1450(37)H no 1450(31)M no 800(24)M no 800(22)H no 850(24)H no 925(25)H no 850(21) M no 800(25)M no 1250(29) H si 1325(31)M no 1600(31) M si 925(30)M no 1125(34) H si 1450(39) H no 850(22) H no

Para determinar la amplitud se obtendra los siguiente: Amplitud= 1600-800 =400 2 Posicin 1 en el punto de corte: 800+400=1200 Nmero de intervalos:4-1=3

35

Grficamente se obtendra lo siguiente:


Crditos

Crditos

La tabla de frecuencias resultantes sera entonces:


salarios (Banded) Frequency 11 1 4 10 26

Crditos
Percent 42,3 3,8 15,4 38,5 100,0 Valid Percent 42,3 3,8 15,4 38,5 100,0 Cumulative Percent 42,3 46,2 61,5 100,0

Valid

<= 1000,00 1001,00 - 1200,00 1201,00 - 1400,00 1401,00+ Total

Intervalos creados

36

Grficamente los intervalos indicaran esta situacin

Grfico boxplot para cada intervalos

dlares

Intervalo

MEDIDAS CARACTERSTICAS DE UNA DISTRIBUCIN

Cuando disponemos de un conjunto de datos homogneo de una variable cuantitativa, resulta conveniente completar la distribucin de frecuencias con ciertas medidas resumen. Medidas de tendencia central o posicin. Indican el valor medio de los datos. Medidas de dispersin. Miden su variabilidad. Medidas de forma. Miden el grado de simetra y concentracin de la distribucin.

37

MEDIDAS DE CENTRALIZACIN
Media aritmtica
Se define como la suma de todos los valores de la distribucin dividida por el nmero total de datos.
i

Para datos no agrupados:

X=
Para datos agrupados:

x
i =1

n
k

X =

i =1

m i fi n

Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i

Media aritmtica ponderada

Caso particular de la media aritmtica que aparece cuando se le otorga a cada valor de la variable xi una ponderacin de valor o peso wi distinto de la frecuencia o repeticin ni Si la distribucin de frecuencias es xi, ni, wi siendo wi los pesos o ponderaciones entonces se define de la siguiente manera:
k

x n w
W=
i =1 k i i

n w
i =1 i

38

Mediana
Se define como mediana el valor de la distribucin puesta esta ordenada de menor a mayor que deja a su izquierda y a su derecha la misma frecuencia de observaciones, es decir , el valor de la variable que ocupa el lugar central, supuesto u numero impar de datos. Si el nmero de datos fuese par puede decirse que hay dos valores medianos y se toma como mediana la media aritmtica entre ellas.

Para datos no agrupados:

Si n es impar: posicin donde se ubica la mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, por lo tanto la mediana ser igual al promedio de las dos posiciones centrales.

39

Datos agrupados: clase mediana es la que contiene a la observacin que ocupa la posicin n/2.
n +1 F ( xm 1 ) Md = Lm + 2 Cm f ( xm )
Donde: Lm: lmite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.

Moda
Es el valor de la variable que ms se repite, y en consecuencia en una distribucin de frecuencias es el valor de la variable que viene afectada por la mxima frecuencia de la distribucin. Cabe sealar que la moda es la medida mas representativa en caso de distribuciones de variables en escala nominal. Un conjunto de datos puede ser unimodal, bimodal, multimodal.

40

Para datos no agrupados: es simplemente la observacin que ms se repite. Para datos agrupados:

Mo = Lim +

1 Cm 1 + 2

Donde: Lim: lmite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).

Cuartiles

Se definen los cuartiles de orden k como los valores de la distribucin, supuesta esta ordenada de menor a mayor que la dividen en k partes con la misma frecuencia de observaciones. Por los tanto existirn r=k-1 cuartiles de orden k. El primer cuartil de orden k deja a su izquierda la fraccin 1/k de frecuencia de observaciones. El segundo cuartil de orden k deja a su izquierda la fraccin 2/k d frecuencia de observaciones. El r-simo cuartil de orden k deja a su izquierda la fraccin r/k (100 r/k por ciento) de frecuencias de observaciones, y a su derecha deja la fracccin 1-r/k(100(k-r/k por ciento) de distribucin de observaciones. El r-simo cuartil de orden k suele denominare por Qr,k.

41

Cuartiles: Hay tres cuartiles que dividen a una distribucin en 4 partes iguales , es decir entre cuatro intervalos dentro de cada cual esta incluido el 25% de los valores de la distribucin.

Deciles: son los 9 puntos que dividen la distribucin en 10 partes, tales que dentro de cada uno esta incluido el 10% de los valores de la distribucin.

Percentiles: son 99 puntos que dividen al distribucin en 100 partes, tales que dentro de cada uno esta incluido el 1% de los valores de la distribucin.

75% 50% 25% 25%


Mnimo Cuartil 1

25% 75% 25%


Mediana Cuartil 2

25%
Cuartil 3

25%
Mximo

Q1

Q2

Q3

42

Representacin grfica a travs de boxplot

CONSIDERACIONES RESPECTO DE LOS VALORES DE TENDENCIA CENTRAL Ventajas MEDIA: Emplea en su clculo toda la informacin disponible. Se expresa en las mismas unidades que la variable en estudio. Es el centro de gravedad de toda la distribucin, representando a todos los valores observados. Es una valor nico.

43

Desventajas: Se ve adversamente afectada por valores extremos, perdiendo representatividad. Si el conjunto de datos es muy grande puede ser tedioso su clculo manual. No se puede calcular para datos cualitativos. No se puede calcular para datos que tengan clases de extremo abierto, tanto superior como inferior.

Ventajas MEDIANA: Fcil de calcular si el nmero de observaciones no es muy grande. No se ve influenciada por valores extremos, ya que solo influyen los valores centrales. Fcil de entender. Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto. Es la medida de tendencia central ms representativa en el caso de variables que solo admiten la escala ordinal.

44

Desventajas: No utiliza en su clculo toda la informacin disponible. No pondera cada valor por el nmero de veces que se ha repetido. Hay que ordenar los datos antes de determinarla.

Ventajas MODA: No requiere clculos. Puede usarse para datos tanto cuantitativos como cualitativos. Fcil de interpretar. No se ve influenciada por valores extremos. Se puede calcular en clases de extremo abierto.

45

Desventajas: Para conjuntos pequeos de datos su valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos. No utiliza toda la informacin disponible. No siempre existe, si los datos no se repiten.

MEDIDAS DE DISPERSIN

Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta. MENOR
VARIABILIDAD

MAYOR VARIABILIDAD

46

Rango

Est determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observacin. Es una medida de dispersin absoluta, ya que depende solamente de los datos y permite conocer la mxima dispersin.

Casi no se emplea debido a que depende nicamente de dos valores. No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribucin. Notacin: R

47

Varianza
Es el promedio al cuadrado de las desviaciones de cada observacin y la media aritmtica. Un valor grande de la varianza indica que el conjunto de datos esta muy disperso alrededor de su media, mientras que un valor pequeo indica agrupamiento del conjunto de datos alrededor de su media.

Desviacin estndar

Es una medida de dispersin respecto de las media. Tiene las mismas medidas de la variable utilizada.

s = s2
En su aceptacin ms corriente corresponde a la raz cuadrada de la varianza.

48

Coeficiente de variacin

Corresponde a la razn entre la desviacin tpica y la media. Intenta indicar la desviacin tpica en trminos de que tamao tiene respecto a la media.

Tambin se le denomina variabilidad relativa, es frecuente representarla en porcentajes, es una cantidad adimensional.

CONSIDERACIONES RESPECTO DE LAS MEDIDAS DE DISPERSIN

Propiedades Varianza: Siempre es mayor o igual a cero y menor que infinito. La varianza de una constante es cero. Si a una variable X la sometemos a Y=a+bX, la varianza de Y ser: Var (Y) = b2 Var(X)

49

Ventajas: Es til cuando se compara la variabilidad de dos o ms conjuntos de datos. Utiliza toda la informacin disponible. Desventajas: No proporciona ayuda inmediata cuando se estudia la dispersin de un solo conjunto de datos. Difcil de interpretar por tener sus unidades elevadas al cuadrado.

Ventajas Desviacin tpica: Esta expresada en las mismas unidades que la variable en estudio. Utiliza todas las observaciones en su clculo. Fcil de interpretar. Desventajas: No tiene.

50

Ventajas Coeficiente de Variacin: Es la nica MD que permite comparar el nivel de dispersin de dos muestras de variables diferentes. Emplea toda la informacin disponible en su clculo. Fcil de calcular.

Desventaja: No es una MD con respecto al centro de la distribucin de los datos.

51

Medidas de forma
Son medidas numricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los grficos muestran.

Medidas de forma

-Asimetra

Coeficiente de Skewness Coeficiente de Pearson Coeficiente de Fisher

-Kurtosis o apuntamiento

Permiten estudiar la forma de la curva, dependiendo de cmo se agrupan los datos.

52

Coeficiente de Asimetra de Pearson: Fcil de calcular e interpretar. Clculo:

ASP=
o Interpretacin:
ASP

3 X Md s

= 0, X=Md Simtrica > 0, X>Md Asimtrica Positiva < 0, X<Md Asimtrica Negativa

Coeficiente de Asimetra de Fisher: No es de fcil clculo, pero si su interpretacin.


ASF =

(x X )
n i=1 i

ns3

Datos NO agrupados
3

ASF =

(M x) f
k i=1 i

Datos Agrupados

ns3

53

Coeficiente de Asimetra de Skewness:

Este indicador nos dice si la cola esta mas desviada a la derecha, centrada o desviada a la izquierda de la distribucin.

o Interpretacin:
= 0, Simtrica ASF > 0, Asimtrica Positiva < 0, Asimtrica Negativa

o Interpretacin:
= 0, Simtrica ASS > 0, Asimtrica Positiva < 0, Asimtrica Negativa

54

Kurtosis
Mide si los valores de la distribucin estn ms o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribucin). Se definen tres tipos de distribucin segn su grado de Kurtosis:

Mesocrtica: grado de concentracin medio alrededor de los valores centrales de la variable. Leptocrtica: elevado. Platicrtica: reducido. grado de concentracin

grado

de

concentracin

55

CK =

(x X )
n i =1 i

ns4

Datos No Agrupados

CK =

(M
k i =1

X fi ns4

Datos Agrupados

Interpretacin : CK

=0 Mesocrtica >0 Leptocrtica <0 Platicrtica

56

Distribucin Binomial

Es una distribucin de probabilidad discreta que mide el nmero de xitos en una secuencia de n ensayos independientes de Bernoulli, con una probabilidad fija p de ocurrencia del xito entre los ensayos. Es una opcin dicotmica esto es, solo dos posibles sucesos ,xito y una probabilidad de p y fracaso con probabilidad q=1-p Para representar que una variable aleatoria X sigue una distribucin binomial de parmetros n y p, se escribe:

Su funcin de probabilidad est dada por:

donde

, siendo combinaciones de tomados de en

en )

las elementos

57

Cul es la probabilidad de obtener 4 veces el N 3 al lanzar el dado 8 veces?

El nmero de a ciertos es K=4 esto es X=4 El nmero de experimentos es 8, n=8 La probabilidad de xito de obtener 3 es 1/6 (p=0,166) La formula queda as: P(x=4)= 8! 4!*(8-4)! P (k=4)=0.026 La probabilidad de obtener 4 veces el N3 al tirar un dado 8 veces es 2.6% *0,1664 * (1-0,166)8-4

Distribucin geomtrica

La distribucin geomtrica es cualquiera de distribuciones de probabilidad discretas siguientes:

las

dos

la distribucin de probabilidad del nmero X del ensayo de Bernoulli necesaria para obtener un xito, contenido en el conjunto { 1, 2, 3,...} o la distribucin de probabilidad del nmero Y = X 1 de fallos antes del primer xito, contenido en el conjunto { 0, 1, 2, 3,... }. Cual de stas es la que uno llama "la" distribucin geomtrica, es una cuestin de convencin y conveniencia.

58

Si la probabilidad de xito en cada ensayo es p, entonces la probabilidad de que n ensayos sean necesarios para obtener un xito es:

para n = 1, 2, 3,.... Equivalentemente, la probabilidad de que haya n fallos antes del primer xito es:

para n = 0,1, 2, 3,.... En ambos casos, la secuencia de probabilidades es una secuencia geomtrica

Una campaa publicitaria entregar un premio a la persona que complete la palabra GRATIS por cada da de compra, estas letras se disponen en sobres que contienen una letra que es regalada de forma aleatoria en este sobre cerrado. El cliente que complete primero la palabra GRATIS ser el ganador, Cul es el nmero esperado de visitas de compra que debe hacer un cliente para ganar?. Xi i=1,2,.6 Nmero de visitas que se efectan hasta que se logra la i-sima letra no repetida de la palabra GRATIS X1 =el nmero de visitas que se efectan hasta que se recibe la primera letra no repetida es 1. Con probabilidad igual a 1. Quedan 5 letras que no se tiene, por lo que la probabilidad de que se reciba una de las letras en una prxima visita es 5/6, recibiendo otra vez la letra que ya se tiene con probabilidad 1/6. Probabilidad de xito es 5/6 y la probabilidad de que haya que efectuar un numero de visitas de x para recibir la segunda letra es: P(x2=x)= (1/6)
x-1

5/6 x=1,2,3

Por teorema el nmero esperado de visitas es igual al inverso de p, es decir E(X2)=6/5=1,2. Para la cuarta letra la probabilidad de xito en las visitas siguientes ser 4/6, y el nmero esperado de visitas hasta obtener la tercera letra ser E(X3)=6/4

59

Siguiendo con el argumento anterior, entonces hasta completar la palabra GRATIS el nmero esperado de visitas ser 14.7

E(x)=E(x1)+E(x2)+E(x3)..E(x6)=1+6/5+6/4+.6/1=14.7

Distribucin de Poisson

La distribucin de Poisson es una distribucin de probabilidad discreta. Expresa la probabilidad de un nmero k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y son independientes del tiempo desde el ltimo evento.

60

Si el nmero esperado de ocurrencias en este intervalo es , entonces la probabilidad de que haya exactamente k ocurrencias (siendo k un entero no negativo, k = 0, 1, 2, ...) es igual a:

Dnde: e es el base del logaritmo natural (e = 2.71828...), k! es el factorial de k, k es el nmero de ocurrencias de un evento, es un nmero real positivo, equivalente al nmero esperado de ocurrencias durante un intervalo dado. Por ejemplo, si los eventos ocurren de media cada 4 minutos, y se est interesado en el nmero de eventos ocurriendo en un intervalo de 10 minutos, se usara como modelo una distribucin de Poisson con = 2.5.

La probabilidad de que un producto salga defectuoso es de 0.012 Cul es la probabilidad de que entre 800 productos ya fabricados hayan 5 defectuosos.

Probabilidad p menor que 0.1 Producto n*p menor que 10 al aplicar modelo Poisson

P(x=5)=e -9,6 * 9,6 5 5!


Entonces: P (X=5)=0.04602 esto probabilidad de encontrar 5 defectuosos es de 4,6% es , la productos

61

Distribucin Normal
Se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales. Se dice que una variable aleatoria continua X sigue una distribucin normal de parmetros y y se denota X ~ N(, ) si su funcin de densidad est dada por:

donde (mu) es la media y (sigma) es la desviacin tpica (2 es la varianza). Se llama distribucin normal "estndar" a aquella en la que sus parmetros toman los valores = 0 y = 1. En este caso la funcin de densidad tiene la siguiente expresin:

Su grfica se muestra a la derecha y con frecuencia se usan tablas para el clculo de los valores de su distribucin

62

Curva Normal o campana de Gauss

Caractersticas

Una de las principales caractersticas de la distribucin normal es que permite modelizar numerosos fenmenos naturales, sociales y sicolgicos QUE SE DAN CON UNA FRECUENCIA MUY ALTA EN ACTIVIDADES DE LA VIDA COTIDIANA Y QUE SON OBJETO DE ESTUDIO EN DIVERSAS AREAS.

63

En el intervalo [ - , + ] se encuentra 68% de la distribucin

En el intervalo [ - 2, + 2] Se encuentran el 95% de la distribucin

Simtrico respecto de su media

Es simtrica respecto de su media, ; Distribucin de probabilidad alrededor de la media en una distribucin N(, ). La moda y la mediana son ambas iguales a la media, ; Los puntos de inflexin de la curva se dan para x = y x = + . Distribucin de probabilidad en un entorno de la media: 1.en el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el 68,26% de la distribucin; 2.en el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la distribucin; 3.por su parte, en el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prcticamente la totalidad de la distribucin se encuentre a tres desviaciones tpicas de la media justifica los lmites de las tablas empleadas habitualmente en la normal estndar.

64

Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son: caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos; caracteres psicolgicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc. La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, incluso si la distribucin de la poblacin de la cual se extrae la muestra no es normal.

Siguiendo con el ejemplo base: Vamos obtener los estadsticos de posicin, dispersin y de forma.

Case Processing Summary Cases Missing N Percent 0 ,0%

salario

Valid N Percent 42 100,0%

Total Percent 42 100,0%

N total de datos

N datos perdidos

65

Media aritmtica eliminado el 5% de las observaciones mas bajas y el 5% de las observaciones ms altas

Descriptives salario Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 2425,9524 2118,8567 2733,0481 2396,8519 2425,0000 971161,3 985,47515 850,00 4890,00 4040,00 1560,00 ,202 -,343 Std. Error 152,06212

Lower Bound Upper Bound

Valores mximos y mnimos

Intervalos de confianza para la media

Asimtrica positiva, achatada en su forma.


,365 ,717

Gran parte de los datos estn agrupados bajo la curva

66

ERROR?

Grfico de tortas para la variable salario

Indica los 5 valores mas altos salario de la variable

Extreme Values Highest 1 2 3 4 5 1 2 3 4 5 Case Number 6 16 40 24 10 42 14 3 28 18 Value 4890,00 4200,00 4120,00 3600,00 3450,00 850,00 850,00 870,00 950,00 1100,00

Lowest

Indica los 5 valores mas bajos de la variable

67

Statistics salario N Percentiles Valid Missing 25 50 75

42 0 1650,0000 2425,0000 3210,0000

Indica los cuartiles de la variable salario

Limita al valor ms grande que no llega a ser atpico

Percentil 75

Percentil 25

Estn incluidos el 50% de los casos

Limita al valor ms pequeo que no llega a ser atpico

Mediana

68

Case Processing Summary Cases Missing N Percent 0 ,0% 0 ,0%

sexo salario f m

Valid N Percent 20 100,0% 22 100,0%

Total Percent 20 100,0% 22 100,0%

La variable salario separada por sexo

Descriptives salario sexo f Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 1992,5000 1537,3027 2447,6973 1937,7778 1865,0000 945977,6 972,61381 850,00 4120,00 3270,00 1575,00 ,600 -,464 2820,0000 2449,4194 3190,5806 2793,6869 2780,0000 698590,5 835,81725 1250,00 4890,00 3640,00 1017,50 ,396 ,761 Std. Error 217,48306

Lower Bound Upper Bound

,512 ,992 178,19684

Lower Bound Upper Bound

,491 ,953

69

Extreme Values salario sexo f Highest 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Case Number 40 24 34 26 30 42 14 3 28 18 6 16 10 17 9 32 20 31 27 19 Value 4120,00 3600,00 3240,00 2700,00 2690,00 850,00 850,00 870,00 950,00 1100,00 4890,00 4200,00 3450,00 3400,00 3240,00a 1250,00 1650,00 1670,00 2150,00 2200,00

Lowest

Highest

Lowest

a. Only a partial list of cases with the value 3240,00 are shown in the table of upper extremes.

Caso atpico alejado ms de1.5 longitudes caja percentil 75

70

Grfico de tortas con la distribucin de salario segn sexos

Bibliografa
Novales, A. (1997). Estadstica y Economa. Mc GrawHill, 638 p. Snchez-Crespo, G; Manzan (2002). "Sobre la definicin de Estadstica." Boletn de la International Association of Statiscal Education para Amrica Latina (5 pp). Statistical Package for the Social Sciences, SPSS. (2002). Anlisis estadstico con SPSS para Windows. Edit. Mc Graw Hill. 332p. Triola, Mario F. (2004). Probabilidad y estadstica. Novena edicin. Mxico: Pearson & Addison Wesley. Walpole y Myers(1995) Probabilidad y Estadstica. Mc Graw-Hill.

71

72

Вам также может понравиться