Вы находитесь на странице: 1из 10

Investigacin de Mercado

Tema.- tcnica de anlisis de datos:


univariable, bivariable multivariable.

Grupo #2
Aguilera Lilibeth
Bejar Sara
Merchn geanella
Denisse Daz
Nils varrezueta
Cesar soto
Tcnica de Anlisis de datos
Una vez concluidas las etapas de coleccin y procesamiento de datos
se inicia con una de las ms importantes fases de una investigacin: el
anlisis de datos. En esta etapa se determina como analizar los datos y
que herramientas de anlisis estadstico son adecuadas para ste
propsito. El tipo de anlisis de los datos depende al menos de los
siguientes factores.
a) El nivel de medicin de las variables
b) El tipo de hiptesis formulada
c) El diseo de investigacin utilizado indica el tipo de anlisis requerido
para la comprobacin de hiptesis.
El anlisis de datos es el precedente para la actividad de interpretacin.
La interpretacin se realiza en trminos de los resultados de la
investigacin. Esta actividad consiste en establecer inferencias sobre
las relaciones entre las variables estudiadas para extraer conclusiones
y recomendaciones (Kerlinger, 1982). La interpretacin se realiza en
dos etapas:
a) Interpretacin de las relaciones entre las variables y los datos que las
sustentan con fundamento en algn nivel de significancia estadstica.
b) Establecer un significado ms amplio de la investigacin, es decir,
determinar el grado de generalizacin de los resultados de la
investigacin.
Las dos anteriores etapas se sustentan en el grado de validez y
confiabilidad de la investigacin. Ello implica la capacidad de
generalizacin de los resultados obtenidos.
Analizar significa establecer categoras, ordenar, manipular y resumir
los datos, (Kerlinger, 1982, p. 96). En esta etapa del proceso de
investigacin se procede a racionalizar los datos colectados a fin de
explicar e interpretar las posibles relaciones que expresan las variables
estudiadas.
El diseo de tablas estadsticas permite aplicar tcnicas de anlisis
complejas facilitando este proceso. El anlisis debe expresarse de
manera clara y simple utilizando lgica tanto inductiva como deductiva.
Los resultados de una investigacin basados en datos muestrales
requieren de una aproximacin al verdadero valor de la poblacin
(Zorrilla, 1994). Para lograr lo anterior se requiere de una serie de
tcnicas estadsticas. Estas tcnicas se derivan tanto de la estadstica
paramtrica como de la estadstica no paramtrica. La primera tiene
como supuestos que la poblacin estudiada posee una distribucin
normal y que los datos obtenidos se midieron en una escala de intervalo
y de razn. La segunda no establece supuestos acerca de la distribucin
de la poblacin sin embargo requiere que las variables estudiadas se
midan a nivel nominal u ordinal (ver Weiers, 1993).
Las tablas diseadas para el anlisis de datos se incluyen en el reporte
final y pueden ser tiles para analizar una o ms variables. En virtud de
ste ltimo criterio el anlisis de datos puede ser univariado, bivariado
o trivariado

Anlisis univariables
Analiza una sola variable. Es ms sencillo, ms fcil de entender y de
interpretar. En cambio, la sencillez puede comportar una simplificacin
excesiva de la realidad. Por ejemplo, un investigador quiere hacer un
estudio del rendimiento acadmico universitario, para lo cual recoge las
calificaciones de los estudiantes en los exmenes finales. Es claro que
una caracterizacin del rendimiento basada exclusivamente en las
calificaciones acadmicas es incompleta y que, si queremos conocer
los condicionantes del rendimiento deberamos incluir otros variables
(como actitud, preparacin previa, etc.) y estudiar cmo interactan para
dar cuenta de las variables de inters.
Los tipos de medidas que se utilizan en los anlisis univariados son :
Distribucin de frecuencias
La distribucin de frecuencias nos indica el nmero de casos que hay
en cada categora de la variable. A partir de dichos valores, en una
tabla de frecuencias, se calcula el porcentaje (respecto del total de
observaciones), porcentaje vlido (excluido los valores perdidos) y
el porcentaje acumulado (porcentaje de la primera categora, luego
ste ms el de la segunda categora y as sucesivamente). Se aplica
para variables nominales, ordinales y en cierto tipo de variables
intervalares (por ejemplo, en escalas Likert).
Adems de la tabla de frecuencias tambin es posible hacer
representaciones grficas tales como: grfico de barras, grfico circular
o un polgono de frecuencias.
Medidas de tendencia central: media, mediana y moda
Las medidas de tendencia central dan cuenta del tipo de distribucin
que tienen los valores de
la variable respecto de un valor tpico, o puntuacin central, a
partir del cual se agrupan. Se calculan para variables medidas a
nivel nominal, ordinal y en algunas intervalares (por
La media
El promedio corresponde a la suma de todas las puntuaciones de la
variable dividida por el nmero total de casos.
La mediana
Es el valor que divide por la mitad a las puntuaciones de la variable: los
que estn por debajo de ste y los que estn por encima. Es decir,es el
valor que divide en dos mitades a las observaciones.
La moda
Es el valor que ms que ms se repite del conjunto de observaciones,
pudiendo haber ms de una moda (bimodal o multimodal).

Medidas de dispersin: desviacin estndar y varianza


Las medidas de dispersin indican el grado variabilidad de de los datos
respecto de la media
(Promedio). Se debe tener presente que una propiedad de la
media es que la suma de las diferencias de todos los valores de la
variable respecto de la media es siempre 0. Es por ello que para el
clculo de la varianza y la desviacin estndar la se procede a elevar la
sumatoria de las diferencias al cuadrado.
La varianza
es el valor promedio del cuadrado de las puntuaciones respecto de la
media. Se utiliza mucho en pruebas de inferencia estadstica (de la
muestra al universo), pero su unidad de medida no es directamente
interpretable
(ya que est al cuadrado), razn por la cual se recurre a la
desviacin estndar.
La desviacin estndar
es el promedio de desviacin de los valores de las observaciones
respecto de la media, expresada en los valores originalesde la medicin
de la variable.
Esto no es otra cosa que la raz cuadrada de la varianza.
Cuanto ms se aleje el valor respecto de la media, mayor ser la
desviacin estndar.

Ejemplo:
Anlisis bivariable
El anlisis de dos conjuntos de datos que determina si los datos estn
relacionados y se describe la mejor relacin entre ellos. Los mtodos de
regresin con frecuencia ayudan a determinar la mejor ecuacin de
ajuste a los datos y la bondad del ajuste.Aquellos que provienen de dos
variables medidas al mismo tiempo sobre cada individuo.
Ejemplo: Edad, Gnero, Escolaridad, Ingreso, Peso, Estatura, etc.
Dependiendo de la naturaleza de cada variable se da el tratamiento de
los datos.
COEFICIENTE DE CORRELACIN LINEAL PEARSON.

Es un ndice que mide el grado de variacin entre distintas variables


relacionadas linealmente.
Es un ndice de fcil ejecucin e igualmente, de fcil interpretacin. En
primera instancia, que sus valores absolutos oscilan entre 0 y 1. Esto es
si tenemos dos variables X, Y, y definimos el coeficiente de correlacin
de Pearson entre estas dos variables como.

REGRESIN LINEAL.
Permite hallar el valor esperado de una variable aleatoria A cuando B
toma un valor especfico. Determina la intensidad entre las variables a
travs de coeficientes de correlacin y determinacin.

COMBINACIONES.
Son eventos similares a las permutaciones, pero el orden ya no importa
y es necesario eliminar de las permutaciones aquellas donde los
elementos se repiten aunque con distinto orden. Es una seleccin de
objetos sin importar el orden en que se escojan.
Tipos:
- Combinaciones con repeticin. Ejemplo: Monedas de tu bolsillo.

- Combinaciones sin repeticin. Ejemplo: Nmeros de lotera.

PERMUTACIN.
Son eventos de tipo multiplicativo, donde el nmero de posibilidades va
disminuyendo y si importa el nmero. Es un arreglo de un conjunto de
objetos en un orden definido. Una combinacin ordenada.
-Entran todos los elementos.
-Importa el orden.
-No se repiten los elementos.
ORDENACIN.
Se realiza en orden alfabtico y numrico. Importa el orden.
Determinacin de todos los posibles resultados de un experimento.
Anlisis multivariado:
Analiza los datos teniendo en cuenta las relaciones entre las variables.
Es ms complejo y de comprensin ms dificultosa, pero proporciona
informacin ms completa del objeto estudiado.
Se trata de un conjunto de procedimientos de anlisis estadstico donde
se suele considerar un nmero elevado de variables, de hecho, como
venimos diciendo, cuando hay ms de dos variables en el anlisis se
identifica como multivariable. Esta es una definicin que en primera
instancia nos orienta sobre una caracterstica importante de estas
tcnicas. Sin embargo, podemos ser ms precisos y contemplar otros
rasgos importantes. A esta tarea de definicin nos dedicaremos en este
apartado y se completar con la especificacin de varios criterios
clasificatorios de las diversas tcnicas que nos conducirn a proponer
una clasificacin de las mismas. En la investigacin social emprica que
se realiza en la actualidad es habitual encontrar el tratamiento
multivariable de los datos estadsticos. La complejidad que conlleva el
tratamiento conjunto de un nmero elevado de variables y las
dificultades de asimilacin de los conceptos y del lenguaje propio de las
tcnicas que las tratan ha sido una de las razones por las que el
investigador/a en sociologa, y en las ciencias sociales en general, no
haya hecho un uso generalizado de este tipo de anlisis hasta hace
relativamente poco. La introduccin y generalizacin del uso de los
softwares estadsticos marca un punto de inflexin (Alvira, 1990) en el
camino hacia normalidad de estos instrumentos en la investigacin
social aplicada para dar cuenta de la complejidad de los modelos de
anlisis que intentan reflejar una visin multidimensional de la realidad
social .
Existen diferentes modelos y mtodos, cada uno con su tipo de anlisis:
Mtodos de Dependencia:
Un estudio de la regresin nos permite averiguar hasta que punto una
variable puede ser prevista conociendo otra. Se utiliza para intentar
predecir el comportamiento de ciertas variables a partir de otras, como
por ejemplo los beneficios de una pelcula a partir del gasto en
mrketing y del gasto en produccin.
El anlisis de la correlacin cannica intenta analizar la posible
existencia de relacin entre dos grupos de variables
Un anlisis discriminante nos puede dar una funcin discriminante que
puede ser utilizada para distinguir entre dos o ms grupos, y de este
modo tomar decisiones.
Un anlisis multivariante de la varianza (MANOVA), extendiendo el
anlisis de la varianza (ANOVA), cubre los casos en los que se conozca
la existencia de ms de una variable dependiente sin poderse simplificar
ms el modelo.
La regresin logstica permite la elaboracin de un anlisis de
regresin para estimar y probar la influencia de una variable sobre otra,
cuando la variable dependiente o de respuesta es de tipo dicotmico.
Mtodos de Interdependencia:
El anlisis de los componentes principales procura determinar un
sistema ms pequeo de variables que sinteticen el sistema original.
El anlisis clster clasifica una muestra de entidades (individuos o
variables) en un nmero pequeo de grupos de forma que las
observaciones pertenecientes a un grupo sean muy similares entre s y
muy disimilares del resto. A diferencia del Anlisis discriminante se
desconoce el nmero y la composicin de dichos grupos.
La Iconografa de las correlaciones.
Mtodos Estructurales:
Los modelos de ecuaciones estructurales analizan las relaciones
existentes entre un grupo de variables representadas por sistemas de
ecuaciones simultneas en las que se suponen que algunas de ellas
(denominadas constructos) se miden con error a partir de otras variables
observables denominadas indicadores. Los modelos utilizados constan,
por lo tanto, de dos partes: un modelo estructural que especifica las
relaciones de dependencia existente entre las constructos latentes y un
modelo de medida que especifica como los indicadores se relacionan
con sus correspondientes constructos.