Вы находитесь на странице: 1из 13

ANLISIS DE LOS DATOS DE INVESTIGACIN

Contenido
Primera Parte

1.- Anlisis de los datos


Fase 1.- Operaciones preliminares Fase 2.- Seleccionar un programa de anlisis Fase 3.- Ejecutar el programa SPSS Fase 4.- Explorar los datos

2.- Estadstica descriptiva para cada variable

Objetivo
Comprender los principales mtodos estadsticos desarrollados para el anlisis de los datos, as como como la forma de interpretar sus resultados.
Recopilado de: Metodologa de la Investigacin. Hernandez Sampieri, Fernandez Collado y Baptista Lucio. 5. Edicin.
ltima modificacin: 20 de agosto de 2011
www.coimbraweb.com

Tema 10 de:

METODOLOGA DE LA INVESTIGACIN

Edison Coimbra G.

1.- Anlisis de los datos


Proceso de anlisis estadstico
Los datos se codifican, se transfieren a una matriz, se guardan en un archivo y se limpian de errores; luego se procede a analizarlos por computador.
Fase 4

Fase 2
Fase 1
Operaciones preliminares. Seleccionar un programa estadstico para analizar los datos.

Fase 3
Ejecutar el programa: SPSS, Minitab, STATS, SAS u otro equivalente.

Explorar los datos: a) Analizar descriptivamente los datos por variable. b) Visualizar los datos por variable.

Fase 8
Preparar los resultados para presentarlos (tablas, grficas, cuadros, etc.).

Fase 6 Fase 7
Realizar anlisis adicionales. Analizar mediante pruebas estadsticas las hiptesis planteadas (anlisis estadstico inferencial).

Fase 5
Evaluar la confiabilidad y validez logradas por el instrumento de medicin.

En la actualidad, el anlisis de los datos se realiza por computador. Ya casi nadie lo hace de forma manual ni aplicando frmulas, en especial si hay un volumen considerable de datos.

El anlisis de los datos se efecta sobre la matriz de datos.


2

www.coimbraweb.com

Fase 1.- Operaciones preliminares


Qu operaciones preliminares se realizan antes del anlisis?

1
Fase 1
Operaciones preliminares.

Separar datos errneos o irrelevantes. No borrar los "anmalos" que no armonizan con la hiptesis. Pueden demostrar que la hiptesis es defectuosa. Reducir datos eliminando la influencia de factores conocidos pero sin inters. Por ejemplo: eliminar el efecto de la inflacin dividiendo todos los precios por el ndice de precios de la fecha de la compra.

Modelo matemtico preliminar


Es habitual, al inicio del proyecto, que se tenga un modelo matemtico preliminar que se aplicar a los datos.

Primero, se decide qu tipo de patrn se busca en los datos. As, la primera pregunta a la hora de elegir el mtodo de anlisis matemtico es: se quieren usar las variables medidas para clasificar casos o individuos? o se desean analizar variables inconexas, o bien las relaciones entre diversas variables?
Otra decisin importante se refiere al propsito final del proyecto. Se desea describir cmo es el actual estado del objeto, o desea descubrir cmo deber ser el objeto: qu grado de las cualidades medidas sera ptimo?

www.coimbraweb.com

Se debe tener un modelo matemtico preliminar

Fase 2: seleccionar un programa de anlisis


Cmo funcionan los programas para analizar datos?
Fase 2
Seleccionar un programa estadstico para analizar los datos.

Incluyen 2 partes: 1
La definicin de las variables. Las efecta el Investigador. Explica los valores de la codificacin tem por tem.

Ejemplo 1 2

4 casos o personas y 3 variables

Codificacin (valores) Gnero (1 = masculino y 2 = femenino) Color de pelo (1 = negro, 2 = castao, 3 = pelirrojo, 4 = rubio). Edad (dato bruto o crudo en aos)

La matriz de datos. Donde se introducen los datos. Es una hoja de clculo.


Columna 1 (gnero) 1 1 2 2 Columna 2 (color de pelo) 1 1 1 4 Columna 3 (edad) 35 29 28 33

Caso 1 2 3 4

Se lee en la fila 1 el caso 1: un hombre (1) de cabello negro (1) de 35 aos (35).

El programa SPSS es el ms difundido.


4

www.coimbraweb.com

Fase 3: ejecutar el programa SPSS


Qu es el SPSS?
Fase 3
Ejecutar el programa: SPSS, Minitab, STATS, SAS u otro equivalente.

El SPSS (Statistical Package for the Social Sciences) es un programa computacional de anlisis estadstico. El 2008 cambi su nombre a PASW Statistics Base, las nuevas siglas significan Predictive Analitic Software. Sirve para el acceso, gestin, preparacin y anlisis de datos. Tambin para informes de resultados mediante grficas y tablas. En pocas palabras para llevar a cabo anlisis estadstico descriptivo y predictivo.

Cmo se consigue?

Por medio de su pgina http://www.spss.com/es/ para cualquier parte de Iberoamrica.

Ejecutado el programa se abre la matriz de datos

www.coimbraweb.com

Fase 4: explorar los datos


En qu consiste la exploracin de los datos?
En analizar descriptivamente y en visualizar los datos por variable.
Fase 4
Explorar los datos: a) Analizar descriptivamente los datos por variable. b) Visualizar los datos por variable.

Cmo se exploran los datos?


En caso de una variable
En SPSS En Analizar / Estadsticos descriptivos / Frecuencias, se solicitan para la variable un anlisis de frecuencias con estadsticos (tablas) y grficas.

En caso de ms de una variable

En SPSS En Transformar y Calcular variable se indica al programa cmo agrupar los tems en la variable de la investigacin.

www.coimbraweb.com

La variable de la investigacin se compone de variables de la matriz de datos.

2.- Estadstica descriptiva para cada variable


Cmo se pueden describir los datos?
La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. Se logra al describir la distribucin de las frecuencias de cada variable.

Qu es una distribucin de frecuencias?


Es un conjunto de puntuaciones ordenadas en sus respectivas categoras y generalmente se presenta como una tabla.

Ejemplo 2

Frecuencia

En un estudio entre 200 personas que viven en California se les pregunt cmo prefiere que se refieran a usted en cuanto a su origen tnico?

Variable: Preferencias al referir el origen tnico Categora


Hispano Latino

Cdigo (valor)
1 2

Frecuencia
52 88

Latinoamericano
Americano Otros Total
www.coimbraweb.com

3
4 5

12
28 20 200

Resumen de categoras
A veces las categoras son tantas que se resumen Ejemplo 3 Resumen de categoras Variable: calificacin en el examen de
matemticas

Qu otros elementos contiene una distribucin de frecuencias?


Las columnas Porcentaje y Porcentaje vlido son iguales si no hay valores perdidos; si los hubiera, el Porcentaje vlido presenta los clculos sobre el total menos tales valores. Puede completarse agregando los % de casos en cada categora, los % vlidos y los acumulados.

Categora
55 menos 56 a 65 66 a 75 76 a 85 86 a 95 96 a 100 Total

Frecuencia
3 25 10 13 8 4 63

Ejemplo 4 Porcentajes

Variable: cooperacin del personal en el proyecto de calidad de la empresa Categora


S se ha obtenido la cooperacin No se ha obtenido la cooperacin No respondieron Total

Cdigo
1 2 3

Frecuencia
91 5 26 122

Porcentaje vlido
74.6 4.1 21.3 100

Porcentaje acumulado
74.6 78.7 100

www.coimbraweb.com

Grficos
De qu otra manera pueden presentarse las distribuciones de frecuencia?
Especialmente cuando se utilizan porcentajes, pueden presentarse en forma de grficos de barras, de sectores o histogramas.

Ejemplo 5

Opinin acerca del Alcalde de Santa Cruz de la Sierra.

Ejemplo 6

Personal comprometido con el proyecto de calidad (122 = 100%).

Solo 1/3 de los ciudadanos expresa una opinin positiva respecto al alcalde (favorable o muy favorable)
www.coimbraweb.com

3/4 partes del personal est comprometido con el proyecto de calidad de la empresa. Llama la atencin que ms de 1/5 parte no quiso comprometerse con su respuesta. Los 5 motivos de no compromiso fueron: ausentismo, falta de inters, rechazo al cambio, falta de concientizacin y conformismo. 9

Medidas de tendencia central


Qu son las medidas de tendencia central?
Son los valores medios o centrales de una distribucin que sirven para ubicarla dentro de la escala de medicin. Las principales son: moda, mediana y media.

Ejemplo 7

La edad de los trabajadores de un sector de una empresa.


24 31 35 35 38 39 43 45 47 48 51

Moda

Categora o puntuacin que se presenta con mayor frecuencia.

En el ejemplo la moda es 35 aos.

Mediana

Es el valor que divide la distribucin por la mitad. Refleja la posicin intermedia de la distribucin. En el ejemplo la mediana es 39 aos.

La mediana es una medida propia de niveles de medicin ordinal, por intervalos y de razn. No tiene sentido con variables nominales, porque en este nivel no hay jerarquas.

Media

Es el promedio aritmtico de una distribucin y es la medida de tendencia central ms utilizada. Es una medida sensible a valores extremos. En el ejemplo la media es 39,6 aos.

www.coimbraweb.com

10

Medidas de variabilidad
Qu son las medidas de la variabilidad?
Son intervalos que indican la dispersin de los datos en la escala de medicin. Responden a las pregunta: dnde estn diseminadas las puntuaciones o los valores obtenidos? Las ms utilizadas son rango y desviacin estndar:

Rango Ejemplo 8

Indica la extensin total de los datos en la escala. Tambin se llama recorrido, es la diferencia entre la puntuacin mayor y la menor.
La edad de los trabajadores de un sector de una empresa.
24 31 35 35 38 39 43 45 47 48 51

El rango es 51 24 = 27. Mientras mayor el rango, mayor ser la dispersin de datos de una distribucin.

Desviacin estndar o tpica

Promedio de desviacin de las puntuaciones con respecto a la media que se expresa en las unidades originales de medicin de la distribucin.

La desviacin estndar se interpreta como cunto se desva, en promedio, de la media un conjunto de puntuaciones

Ejemplo 9

Un Investigador obtuvo para su muestra una media de ingresos familiares de Bs 6.000 y una desviacin estndar de Bs 1.000. La interpretacin es que los ingresos familiares de la muestra se desvan, en promedio, 1.000 unidades respecto a la media.

www.coimbraweb.com

11

Varianza
Qu es la varianza?
Es la desviacin estndar al cuadrado. Es un concepto estadstico muy importante, ya que muchas de la pruebas cuantitativas se fundamentan en ella. Diversos mtodos estadsticos parten de la descomposicin de la varianza. Se utiliza en anlisis inferenciales.

Exploracin de medidas en SPSS


Cmo explorar?
En Frecuencias: Estadsticos se seleccionan las medidas de tendencia central o de dispersin, la distribucin y/o los valores porcentuales segn interesen. Luego de elegir las medidas, se contina con la eleccin del tipo de grfico con el que se las quiere mostrar.

www.coimbraweb.com

Los grficos pueden ser de barras, de sectores o histogramas,

12

Interpretacin descriptiva de medidas


Cmo se interpretan las medidas de tendencia central y de la variabilidad? Ejemplo 10
Aplicacin de una escala Likert para medir la actitud hacia el presidente. Los valores de las variables de matriz se promedian en una variable de investigacin.

Variable: actitud hacia el Presidente Categora


Totalmente favorable Favorable Ni favorable ni desfavorable Desfavorable Totalmente desfavorable

Resultados con SPSS


Variable: actitud hacia el Presidente
Moda: 4.0

Interpretacin
La actitud hacia el Presidente es favorable. La categora que ms se repiti (Moda) fue 4. El 50% opin por encima de 3.9 y el restante por debajo (Mediana). En promedio (Media), las opiniones se ubican en 4.2. Se desvan de 4.2, en promedio 0.7 unidades (Desviacin estndar). Nadie opin en forma totalmente desfavorable. Las puntuaciones tienden a ubicarse en valores medios o elevados.

Cdigo
5 4 3

Mediana: 3.9 Media: 4.2 Desviacin estndar: 0.7 Puntuacin ms alta observada: 5.0 Puntuacin ms baja observada: 2.0 Rango: 3

2 1

FIN
www.coimbraweb.com

13

Вам также может понравиться