Вы находитесь на странице: 1из 46

CLASE TALLER DE INVESTIGACIN 28 AGOSTO 2014

La clase pasada se uso el problema de investigacion: onda una pregunta:

Cual es el grado de comprensin lectora en estudiantes de 4 basico de la


comuna de via del mar? Es descriptiva, porque tiene solo una variable, e
interesa saber como se comporta una variable. Todo estudio que trabaje con
variable independiente es descriptivo.

Tambin puede haber estudio correlacional:

Cual es la relacion entre el grado de comprension lectora y el grado de


fluidez verbal evaluado en estud. de 4 bsico de via del mar?.
Cporrelacional: implica almenos dos variables que se ponen en relacion. No
hay grado de causalidad clara. Se uede enunciar teoricamente, pero en la
redaccion de la pregunta no se define cual puede ser cual. (No se puede poner
tan claramente que una variable es dependiente e independiente)

Si se utiliza un conector "influye, causa, genera..." se relaciona en estudios


explicativos, donde hay causa y efecto. Por ej: La aplicacin de MBA influye
en la mejora de la comprensin lectora de estud. de 4 basico de via del mar?
Ahi se explicita una relacin causal. Hay una causa reconocida y una variable
dependiente e independiente.

Hya un tipo de pregunta que tiene relacin con algo que es como ambiguo,
pregunta de diferencia de grupos: Los nias tienen mayor grado de
comprensin lectora que los nios? Por qu se dice que es diferencia de
grupos? Hay dos variables: sexo y comprensin lectora. Una variable no esta
explicitada: "sexo". Esos grupos no son constructos. Se pueden vincular con
los correlacionales: (variable grupo es el pariente modesto de correlacin)

Eso es repaso. Ahora los tipos de estudios condicionan los tipos de hipotesis y
analisis que se llevan a cabo.

(se hace la pregunta y se plantean los objetivos)

1 - PREGUNTA INVESTIGACIN

2 - OBJETIVOS DE INVESTIGACIN

3 - MARCO TERICO (se hace la defensa de la pregunta y la dsefensa de la


respuesta.Por medio de revisar toda la bibliografa. Hay que elegior la teora
que mas se adeca a la temtica) Tambien se puede redactar su marco teorico
como una propuesta nueva. Hay que revisar literatuira (buscar fuentes de info
mas recientes, en particular, significa articulos de investigacion - olvidar los
libros - por tema de actualidad) desde 2014 hacia 5 aos ms atrs.Idealmente
autores conocidos. De publicaciones prestigiosas - indexada - en Chile hay 2 o
3 super valoradas: isi, scielo, scopus. En la revista por algun lado debe
decir : factor de impacto. Que ya lo tenga, es valioso, y es un indice que dice
que tan citado es un articulo de una revista. El siguiente paso, es el acopio del
material, se escoge toeria o se arma un modelo propio. Debe estar presente el
sentido crtico del trabajo.

En el marco teorico, hay que definir las variables, y eso nos puede dar el pie
para hablar de teorias de eso. No puede quedar ambiguo. Tiene que ser
coincidente con el instrumento para medir autoestima, si es que ese fuese la
variable a medir.

Se debe tomar la variable y definirlo, y presentar la teoria alrededor de ellos.


al hacer eso, se relacionan con otros constructos. Algo de eso. Lo que se hace,
entonces, es construir una red de constructos. Y algo que tb es obligado en
marco terico, en algun momento del marco terico, se va adefinir una
relacin, definirla y defendera, y las razn de por qu creen que paso eso. ES
#OBLIGADO. Esa afirmacin que se plantea es::...................... HIPTESIS.

OBLIGADO MARCO TERICO: justificacin pregunta, definicioon de variable,


por que problema es relevante, la definicion de los constructos y contiene
ademas la argumentancion de la fundamentacion de la repsuesta priopuesta a
la pregunta. y AS: se tiene la hiptesis. Ese se inscribe en la forma de metodo
deductivo tal como se conoce, son preguntas y respuestas a nivel terico. Yo
tomar datos para ver si lo que yo me pregunto en realidad, es verdad o no. O
si los datos me permiten apoyar la hiptesis o refutarla. la cual puede ser
desechada o modificada.

4- hay apartado de hiptesis

5- metodologa: particpantes, poblacin y muestra, se define el proyecto, el


diseo de investigacin, instrumentos que medirn variable, procedimiento
(que cuentan como se hace paso a paso), contar que tipo de anlisis se va
ahacer

6- resultados: va producto de analisis

---- TODO LO ANTERIOR ES LA BASE CONCEPTUAL DEL PROYECTO ----

la parte emprica es ir a terreno, recoger info, etc.

LAS HIPOTESIOS SON IMPORTANTES PQ SON EL VINCULO ENTRE EL


PRYECTO INTELCTUAL Y CONCEPTUAL Y EL TRABAJO. las hipotesis tienen
doble dimension: conceptual y estadistica. Si las hipotesis son las respuestas
tentativas a la pregunta de investigacion.Es necesario tener presente, esa
repsuesta es de caracter conceptual (dimension conceptual de la hipotesis)

La hipotesis tiene dimension estadistica, transforma la hipotesis conceptual a


expresion estadistica o matematica. De modo que la HIP. estadistica estar
vinculada a los tipos de hipostsis que podemos tener, y por lo tanto,
relacionada a la pregunta. (correlacional, descriptiva, etc.)

Hipotesis descriptiva: El grado de autoestima en la poblacin de adultos


mayores de la regin es bajo. SOLO TIENE UNA VARIABLE. La propuesta es:
la autoiestima en adultos mayores es baja. Se defiende con teora. La
redaccin es ambigua estadisticamente, que signiofica autoestima baja? se
debe transformar eso en algo estadisticia que permita clarificar eso.
Historicamente, la autoestima se ha medido con la escala de cooperson: nos
basamos en el para describir la hipotesis estadistica. Nos afirmamos de un
dato matematico en la escala: menos de 16 puntos podria significar
autoestima baja. "Mi hipotesis estadistica de investigacin: H1 : autoestima <
16 pts = bajo" Se puede tomar una muestra de adultos mayores -- H1 : el
promedio de autoestima de los adultos es menos a 16

Toda hiptesis de investigacin, tiene la


hiptesis nula. Dice lo contrario a la
hiptesis de investigacin: la media de mi
autoestima es mayor o igual a 16:

Ambas hiptesis conforman el SITEMA DE HIPTESIS. Y en ese sistema est


contenido la esencia de uno de los principios de investigacin: FALSACIN. El
investigador va a tratar de probar la hiptesis nula y demostrar que hiptesis
es mayor o = a 16 y se rechaza la H1. El investigador toma hiptesis nula para
ver, y se rechaza, se puede tomar la H1.

Va a tomar un ejemplo, de un modelo de hiptesis.

--- 2 modulo

Cuando uno se frenta a preguntas de investigacin, se configura un tipo de


investigacin. El nivel mps bsico es el descriptivo, y por lo tanto, su anlisis
tb es el mas bsico, y estn agrupados como Estadstica Descriptiva: describir
variables. SE pueden describir separadamente o establecer comparaciones.
Que se puede hacer en la descripcin de variable estadisiticamente?

Distribucin de frecuencias
Medidas de tendencia central
Medidas de dispersin
Grficos

La distribucin de frecuencia es la ms usada para caracterizar una variable.


Es una tabla de informacin resumida de una variable.

PARA VARIABLES CUALITATIVAS

N i : muestra la frecuencia de los datos

Fr (frecuencia relativa) : frecuencia del caso, dividido por el total. Y si se


multiplica por 100, se obtiene el porcentaje de esa variable dentro de la
totalidad de casos.

PARA VARIABLES CUANTITATIVAS

Hay que resumir esa info en intervalos o clases.

Edad ni fi %fi N i (f F i
adultos absoluta (frecuenc
acumulada) ia
relativa
acumulad
a)
50 - 55 5 5/30 = 0.16 16% 5 0.16
55 60 10 10/30 = 0.3 30% 15 0.46
60 65 8 8/30 = 0.26 26% 23 0.72
65 - 70 7 7/30 = 0.23 23% 30 0.95
30 Aprox. 1 Aprox. Aprox. 1
100

Esa es la tabla de distribucin de frecuencias, puede contener toda esa


informacin. Y la cualitativas Qu informacin pueden tener?

La cualitativas ordinales pueden tenerla, pero las nominales no, (la primera
tabla) (amarillo)

La curva se inclina hacia nivel moderados bajos. Histograma de frecuencias.

Medidas de tendencia central: MEDIA, MEDIANA, MODA.

Media: suma de todo divido por total

Mediana: el valor medio, que deja al 50% de datos por debajo y por arriba,
siempre y cuando se hayan ordenado las variables.

Moda: valor que ms se repite. Puede no haber moda y hay casos en donde
puede haber mas de una moda. Bimodalidad

Medidas de dispersin: desviacin tpica, varianza, rango.

Rango: simplemente del conjunto de datos, establecer el mximo y el minimo


y hacer la resta. Rango = valor max valor mnimo

Desviacin estndar o tpica: la mejor reprsentacion de la dispersin, es una


medida para ver como se desparraman los datos, pero en RELACIN A LA
MEDIA. Por lo tanto, se debe calcular antes la media.

58
60
61
72
55
X = 61,2 aos

La media de edad de los abuelos es 61,2 aos. Es una medida de tendencia


central, pero Cmo se comportan los valores alrededor de esa media? Para
calcular la desviacin estndar. Esta quiere decir la desviacin de cada valor
respecto a un punto en particular, la media. El promedio en que esos valores
se desvan de la media. La edad de los adultos en promedio 61.2 y se desvia en
promedio se desvia 6.45 aos en promedio hacia arriba y hacia abajo. Y la
edad de los adultos mayores flucta (54.75 67.65) Pero con DS no hay
criterios para decir cuando es grande o pequea. Pudiese ser grande, y por lo
tanto se dice que la dispersin es grande.

La varianza se eleva al cuadrado, es la magnitud de variabilidad de los datos.

Clase 4
Hiptesis de investigacin.

Si hay marco terico para fundamentar pregunta de investigacin:

Cul es el grado de

Hiptesis: respuesta tentativa a pregunta de investigacin. Las hiptesis


tambin se organzian por tipos:

Descriptiva
Correlacional
Explicativa
Diferencia de Grupos

Cmo se formulan esas Hiptesis? Las hiptesis son importante, son el nexo
entre anlisis de datos y toda la parte terica. Es el ltimo eslabn conceptual
del proyecto. Porque la hiptesis tiene como propsito orientar el anlisis.

Tambin tiene componente estadstica, formulando Hip. Expresando


matemticamente la expresin conceptual.

Ej.

Cmo se traduce hiptesis descriptiva? Si se dice que es bajo, es relativo.


Como es subjetivo debe interpretarse matemticamente. Hiptesis del
investigador: la media de la puntuaciones de autoestima evaluado en una
pobl. De adultos mayores va a ser menor de lo que se ha credo toda la vida
menor a 16 ptos. Esa puntuacin sale de estudio test. Se debe utilizar
criterio de informacin. Eso va a ser la media. La media viene, de una muestra
de adultos mayores. A cada adulto mayor le aplicar una prueba o una escala
de autoestima, la misma escala de Cooper bla, de ah obtengo puntuaciones, y
de ah saco el promedio final. Cuando se hace hiptesis de investigacin no
usa x y rayita arriba, sino, letra griega: mu. Por cada hiptesis que
investigador formula, hay hiptesis nula. La hiptesis nula dice todo lo
contrario a la hiptesis de investigacin: La media de autoestima ser igual o
mayor a 16. Segn principio de falsacin.

Hay una relacin positiva entre redes de apoyo y

Las hiptesis relacioneles, slo relaciones Al margen


variables. Cmo se evala? Se utiliza Si hay correlacin:
pba estadstica : coeficiente de
correlacin de Gibson, es un clculo Apoyo redes Autoestima
matemtico.El coeficiente e relacin de a adultos (1 -30)
Pearson da un valor, y ese valo puede ir mayores (1
de -1 a +1, pasando por 0. Qu significa? 10)
9 27
Cuando una variable aumenta y la otra
3 14
tb, el valor de R, va a estar entre 0 y +1.
7 20
Si en cambio, una variable aumenta y la 2 11
otra disminuye, el valor estar entre -1 y 10 29
0. Hay covaracin o correlacin:
ver que los datos covaran
A mayor apoyo de redes, mayor
autoestima.

Si un sujeto, obtena 9 redes, obtena 27 en autoestima y hace un grfico de


puntos relacionando.

Se puede trazar una recta, para que quede tendencia ms clara. Cuando hay
situacin hacia arriba, la correlacin es entre 0 y 1. Si es tn claro, sera casi
1, por ej: 0,89. Si la lnea fuese perfecta, el R sera 1.

En cambio si hay algo como:


La relacin sera difusa. Vaga.

Con ese grfico la correlacin sera


negativo

El coeficiente entonces da dos informaciones, El sentido (positivo o negativo)y


la intensidad (el valor del nmero)

Estadsticamente se representara: La relacin entre una variable X e Y, va a


ser distinto a cero. Eso quiere decir que hay una relacin:

En cambio la nula sera H0 R XY = O: ausencia de relacin

En vez de R se puede usar la letra griega RO que es como una P


grficamente hablando.

Qu pasa entonces si hay hiptesis de diferencia de grupos?

La h1 va a decir lo siguiente: la media o promedio del grupo que vive con la


familia, va a as er mayor que la media de los adultos que vive sin familia o
institucionalizado.

H1 X (con familia) > X (con nadie) [Segn escala de autoestima]


En hiptesis se usa letra griega mu EN VEZ DE EL SIGNO PROMEDIO, ac
escrito como X. Qu formular hiptesis nula?

H0 X ( no inst con nadie ) ^MENOR O IGUAL^ X(Institucionalizado :


fam)

Una hiptesis explicativa. Cmo se formula? Un mayor grado de apoyo de


redes de adulto mayor genera un mayor grado de autoestima. La nica
diferencia es que una es causa de otra. Si se dice es porque hay argumentos
(teora) que apoya lo anterior.

Esa recta se denomina recta de regresin y representa ese conjunto de datos


(muestra para donde van), la recta se puede definir fcilmente con clculos
estadsticos. Para dibujar recta se necesita:

-el origen: DADO POR ALFA

- La pendiente: DADO POR BETA

Lo habitual es tener informacin sobre la pendiente. Que tanta pendiente


tiene. Eso lleva a formulacin estaditica, una ecuacin: modelo de regresin
lneal simple. Eso dice que un valor de autoestima (Y) (un puintito), va a ser
igual, al origen de la recta (a), ms la pendiente (b), multiplicada, por un valor
de X.

Y=a+bX

a= 6.460 ; b = 2.201 ------ME PERDI.

Y = 6.460 + (2.201) 8

Y = 24.08
SI UN SUJETO, OBTUVIESE UN 8, segn clculo de prediccin, debiese
obtener un 24.08. lO que yo hago es predecir valores, Para donde voy con
todo? El b (la pendiente) es ms importante para predecir que el origen. Pero
que es lo que dice que hay relacin entre las variables? Lo dice la pendiente!!!
Aunque use el mismo origen, la pendiente va a responder asi.

La relacin de prediccin entre valor de redes y autoestima es 0. La pendiente


dice mucho ms m cuan relacionados estn. Mayor valor de pendiente es
mayor, hay ms relacin entre las variables.

Como se formula hiptesis causal o explicativa? Usaria la representacin de la


pendiente, porque pendiente distinta de 0, significara una relacin (porque
hay una pendiente! ) Traducir a hiptesis

La hiptesis debera decir que la pendiente entre X e Y debe ser distinta de 0


(para que haya relacin):

Y la hiptesis nula quedara asi, diciendo que la pendiente es 0 (por lo tanto,


no hay relacin):

Como en los casos anteriores, la hiptesis no se usa la B, sino beta= la


pendiente (coeficiente de regresin)

Si el universo es 50.000, se usa una muestra, por ejemplo de 500. Por lo tanto,
yo quiero representar en la muestra clculos que yo quiero calcular en la
poblacin, pero no puedo, porque son incalculables! Entonces yo hago una
representacin Para una media de la muestra, tengo una media de la
poblacin, pero se que ese valor la representa y se respresta como mu.
Todo valor, de la muestra es un estadstico por ejemplo B o , y el de la
poblacin es un parmetro, por ejemplo . Y yo escribo mis hiptesis con
parmetros porque quiero que los resultados se generalicen a la poblacin.
(pero nunca estar seguro de eso)

Actividad.

1. Hay relacin entre el grado de ansiedad y la actividad deportiva que


realizan los individuos?
2. Ambas variables son constructos?

Variable nominal: no deportista Deportista : SUJETOS


Variable ordinal (intervalo): Grado de ansiedad : VARIABLE
CONSTRUCTO
3. Redacte el objetivo general de investigacin.
4. Hiptesis dif. De grupos
5. Redacte el sistema de hiptesis
H1 R (Grado de ansiedad = Y) (Acvtividad Deportiva) = X) (DISTINTO)
A0
H0 R (Grado de ansiedad = Y) (Acvtividad Deportiva) = X) (IGUAL) A 0
6. Dado el resultado obtenido, Cul es la decisin que debera tomar el
investigador entre las opciones del sistema de hiptesis?
Investigador crea: Drase cuenta e las variables en juego y construir pregunta
de investigacin. Una de diferencia de grupos, en consecuencia de la
pregunta.

DESDE EL PROFE

Pregunta de investigacin:

- Ideas: los deportistas tienen menor ansiedad que los no deportistas?

Ambas variables son constructos? El grado de ansiedad, s. Deportista y no


deportista, no. Los problemas de diferencia de grupos, suele incluir grupos
que vienen de constructos y otros que no vienen de constructos.

Para plantear sistema de hiptesis, hay que ver el grfico.

Sistemad e hiptesis, si era de diferencia de grupos:

La media de ansiedad de los no deportistas es mayor que la media de


ansiedad de los deportistas.

Luego de grfico, la distribucin de valores de grado de ansiedad


(dispersin) de no deportista no es tan distinta de los deportista, sin
embargo, si hay diferencia.

A la sexta pregunta, no se rechaza hiptesis nula. Porque la situacin es


confusa, solo lego de una gran diferencia, se podra rechazar la hiptesis nula.
Si se hubiese rechazado hiptesis nula, provisionalmente se podra haber
quedado con hiptesis de investigacin. A qu prueba se somete, en este caso
a grfico.

CLASE 23 DE SEPTIEMBRE Prueba emprica de hiptesis

Que se hace con la info anterior? Obtener datos.

En la Hiptesis descriptiva: H1:u <16


H0:u mayor o igual a 16
Si partimos de la base de obtener datos., nos da como promedio 14,5. Y es
menor a 16, se acab el problema. Se rechaza hiptesis nula y nos quedamos
con hiptesis de investigacin. PERO. Hay un problema. Las hiptesis no las
establecemos para las muestras EN PARTICULAR. Tomamos muestras para
que representen poblaciones de abuelitos, tomamos una muestra, que
pretende ser ms representativa que una sola. GRAN PROBLEMA. Entonces,
si la muestra es la representacin de una muestra ms grande, surge un
problema: CUAL?

En mi muestra en particular, se calcula algo, por ej. : la media de autoestima


de abuelitos (estadstico), como representacin de eso est el parmetro.
Usualmente el parmetro era desconocido, porque no podemos acceder a
TODOS los abuelitos, asi que la muestra es solo una inferencia. PROBLEMA:
dado que tengo slo una muestra no pueden contener a todos los abuelitos.
Ser esa muestra precisa? NO. Contiene error. Y si tomo otra muestra? Y
calculo sumedia? Y LUEGO OTRA MUESTRA?...

Cul es la correcta?

No se sabe. Hay necesidad de establecer un criterio de decisin que nos diga


con que probabilidad tendramos una muestra que se acerca ms al
parmetro.

-ACTIVIDAD 5-

POBLACION

Media: 4.41

Desviacin: 1.55

N: 27

MUESTRAS

M1 - EJ 1: 5 -5 -2 MEDIA=4 ds: 1.73205

M2 - EJ2: 6 4 -4 Media = 4.66 ds:


1.1547

M3 EJ3: 5 4 -2 Media = 3 ds: 1.5275

M4 - EJ3: 5,6,3,2,4,6,6,3,6,5,3,4,2,2,5,3 Media: 4.06 ds:


1.52616

El propsito es comparar muestra y poblacin y los resultados de ambos.


CONCLUSION

- Todas las muestras contienen error


- Una muestra me da una referencia estimada del valor de la media de
lka poblacin
- Con muestras mas grandes , mi mustra, mi media y mi desviacin tpica
suelen ser mas cercanas a mis valores de poblacin.

Criterio:

-elegir muestras grandes, y aun asi, dan estimacin imprecisas.

Cul de todas las muestras me dar mejor resultado?

Depende de los sujetos que elija para componer la muestra (o,87) Se relaciona
un poco con el enfoque de grupos.

Necesito un modelo probabilstico para calcular..

De dnde viene la probabilidad?

Montaa de muestras: distribucin de probabilidad

Proporcin, probabilidad de posibilidad es lo mismo

El centro de la poblacin estar en el centro de distribucin muestral de


medias se construye con muestras

Mientras mas muestras tome mas simtrica se ve la curva

Se asume que la curva: (caract.)

La media est en el centro (siempre)

La cola son iguales para los dos lados

- Se pasa al tipo de ANLISIS (luego de haber visto la descripcin)

Lo descriptivo tiene que ver con el estudio de una variable. Cuando se


caracteriza. Pero y si queremos relacionar variables? Y se utiliza el anlisis
de correlacin.

CORRELACIN: hace fundamental fundamentalmente del coef. De


correlacion, y es para relaciones entre 2 o ms variables. Permite
establecer el sentido y la intensidad de la relacin.
Ambas variables son categricas: cualitativas

Pero si quiero

La covariacion se hace persona a persona.

Necesitan que la corelacion sea lineal. Solo relaciona variables, pero no


puede decir si uno es causa o uno es efecto. La motivacin y la
productividad debera verse distribuida de la misma forma.

SENTIDO

Si da entre 0 y 1 la correlacion es DIRECTA. Si uno aumenta, la otra


aumenta

Si da entre 0 y -1 es INVERSA si una variable aumenta su valor, la otra


disminuye

Si es 0 o cercano a 0 no hay relacin entre las variables

INTENSIDAD

La intensidad est dada por el valor del nmero.

Intensidad dbil: si correlacion es de 0 a 0,4 0 a -0,4

Intensidad moderada si correlacin es 0,4 a 0,7 -0,4 a -0,7

Intensidad fuerte si correlacin es 0,7 y 1 -0,7 y -1 si es casi 1 ambas


variables estn fuertemente aspociadas

Si se eleva al 2 el coef de perason se obtiene el coef. De determinacin, (se


piensa como causal)y eso es un porcentaje.

0.95 al cuadr. 0,90. El 90% de productividad es explicado por la


motivacin.
80

70

60

50

40

30

20

10

0
100 150 200 250 300 350 400 450 500 550 600

Dato atpico. Perjudica y se debe eliminar de la base.

80

70

60

50

40

30

20

10

0
100 150 200 250 300 350 400 450 500 550 600

Cuidado con los datos atpico, hay que tener ojo!.

Hay que calcular el coeficiente de corelacin. Para hacerlo


JUEVES 2 DE OCTUBRE

Cul es la relacin entre grado de motivacin y grado de productividad en los


ervicios de la quinta regin? PROBLEMA DE CARCTER RELACIONAL Y
ADEMS CUANTITATIVO (PORQUE HABLA DE GRADO)

Con dos variables cuantitativas. Y se puede relacionar con Pearson. SENTIDO.


Pudiendo ser directa o positiva. (valor de 0 y 1). Y si el valor es entre -1 y 0 es
inverso o negativo. Y otras cosa es la MAGNITUD:
- 0,4 a 0 -0,4: dbil// - 0,7 - -0,4 moderada // 0,7 1 : alta. Y zona frontera por
ejemplo: moderado alto

En ciencias sociales no se estila correlaciones TAN fuertes.

MATRIZ DE CORRELACIONES

EL PRIMER CRUCE, es 1 a 1 Eso implica la correlacion uno, cuando se repite


la variable (esconat con esconat) Pero luego cuando se relaciona cs natur con
cs sociales es 0.87

Es positiva y alta. Aparentemente tener buenas notas en cs naturales implica


tener buenas notas en cs sociales, hay un factor comn que hace que los
estudiantes tengan buena snotas en ambos ramos. NO ES CAUSA, pq la
correlacion no muestra causa, slo relacin.

Ms abajo aparece un nmero que se explicar ms adelante. El 1326 es


el n de sujetos que se usaron para hacer la correlacin.
ACTIVIDAD 6

Matriz de correlaciones ms extensa. Lon que aparece es una estructura una


diagonal que siempre tiene el valor 1. Porque se cruzan las variables consigo
misma. Lo que si tiene sentido mirar sobre y bajo la diagonal. Pero pueden
mirar el triangulo superior o inferior, da lo mismo, es lo mismo.

Raven= capacidad de educcin, o capacidad de hacer inferencias

Cs natur con matem : 0,75 = hay una relacin alta y positiva

Raven con mat: 0,16

Raven con natur: 0,13

Entre matemtica y raven hay una correlacion dbil. Y cs naturales y Raven


hay coprrelacin dbil. (0,16 y 0,13) es dbil, matemtica y naturales no
correlacionan con grado de inteligencia. Raven no tiene relacin con tener
aptitudes con matemtica y naturales, pero alguna pequea relacin hay.

Cuanto de la variabilidad de la inteligencia est explicada por matemtica o


naturales?

Se eleva el 2, el 0,16 y el 0,13 = coeficiente de determinacin. Se hace y


respectivamente da, (0,0256 = 0,03) y (0,0169 = 0,02). La variabilidad de
inteligencia en los nios est siendo explicada apenas un 3% producton de su
conocimiento en matemtica. Y lo mismo, si inteligencia est siendo explicada
apenas un 2% producto de su conocimiento en ciencias naturales.

Entre matemtica y ciencias naturales si hay correlacin fuerte, y pareciera


que las afectara una habilidad comn. Y pudiesen estar algo cercano en
habilidades. Lo que pertence a un dominio de conocimiento. Y Raven evala
otro dominio. Un cabro bueno para las matemticas o cs. Natur. no
necesariamente va a ser inteligente

AHORA.
Se separa el archivo por curso, entre 5 bsico y 1medio, con las mismas
variables:

La primera tabla es primero medio y la segunda es 5 bsico. Las tablas se


ordenan como aparecen en la base de datos.

Es mayor la relacin en primero medio que en quinto bsico. Son buenas


relaciones para ciencias sociales. En cambio en bsica la correlacin es ms
baja. Las tareas de primero medio son ms abstractas, y el Raven se adapta
mejor a ese tipo de tareas. Mayor nivel de uso de operaciones cognitivas que
el Raven ve. No basta con ver las correlaciones, hay que ver con las muestras.

AHORA

La divisin por sexo (primero aparecen hombres y luego, la segunda matriz, es


de mujeres)
Alguna mayor correlacin hay en hombres que en mujeres. Pero OJO! Por cada
subgrupo puede haber diferencias. Hay que tener en cuenta eso.

Segundo ejercicio

Alta relacin entre lenguaje y cs. Sociales. Puede ser medio lgico, pero en
motivacinSi la motivacin no se relaciona en notas, hay un problema. No
deja de ser llamativo eso.

Segunda parte de anlisis descriptivo.


No es solo describir, es inferir. Qu cosa?De una muestra se podra clacular
el grado de autoestima de una persona y luego hacer una inferencia, y
suponer, que la media de la muestra representa a la media de la poblacin.

La mayora de las muestras caer en el medio, y las otras (menos) en los


costados.

Toda la probabilidad que aparezca una de la muestras, est en el rea bajo la


curva.

Porcentaje (0-100)= proporcin (0 -1) y ambos significan probabilidad. Toda el


rea bajo la curva vale 100% o 1. La media cae justo en el centro.

Mientras ms largas las colas, mayor dispersin hay.

Error de muestreo. La distancia entre una muestra respecto del centro. Otro
nombre que recibe (EM) desviacin estndar de la distribucin muestral.

A cada muestra se le puede calcular su error muestral. Desviacin estndar


pero de medias.

Para calcular error de muestreo:

Sigma es: desviacin estndar de la poblacin.

Sio tuviera distribucin de muestra, una muestra en particular de n = 1000,


va a tener u error de 0,06, es decir estar muy cerquita de la media de la
poblacin, porque error muy pequeito
Con muestras pequeas hay ms error.

La desviacin estndar de la poblacin NO SE SABE, es inventado. Pero en la


prctica no se puede saber de antemano. A qu se puede meter mano? Al
tamao de la muestra, y cuando se quiere disminuir el error, se aumenta la
muestra. El mximo error tolerado es 3%

Si no se sabe cual es sigma. A un estadstica se le ocurri que una estimacin


de la desviacin estndar muestra. = S y a se cambia sigma por S.

Sepuede transformar distribucin normal a una estndar.

Puntuacin Z : toman la puntuacin de un sujeto en una prueba l restan la


media y lo dividen por desviacin estndar.

Juan est por sobre la media (al estar en Z = 1) es alta. Con que probabilidad
los abuelitos podran tener uno o menos. El 84% de los abuelitos mayores,
tiene autoestima 1 o menos. Porque se ve el rea bajo la curva.

Despus de ver la tabla gigante

La probabilidad es acumulada, se junta desde abajo hacia arriba. 0.668 Su


valor en porcentaje es 6.68% Cual es el porcentaje que obtendra 22? ---
6,68%
Cul es el probabilidad de obtener a lo menos 2.27 en z . 1 0.9884 =
0.0116 = 1.16%

CLASE 16 OCTUBRE

Estadstica descriptiva:

- Media, mediana, moda


- Desviacin estndar, el rango, la varianza
- Grficos Preguntas
- Tablas de frecuencia
descriptivas

Estadstica Inferencial:
Diferencia de
-Hacer Inferencias
grupos
desde una muestra a una poblacin
Correlacionales
Explicativas

Mientras ms grande la muestra, ms prximo al centro de la distribucin. Pero


con muestras de tamao ms pequeo, es ms difcil. Las muestras ms
grandes debieran agruparse ms hacia el centro de la distribucin.

Se puede calcular la diferencia entre la media que podra estar al centro y la


media calculada de cada una de las muestras: ERROR MUESTRAL, y ser ms
grande cuando la muestra sea ms chica.
La distribucin normal tiene media 0 y DS estndar 1. Cmo puedo convertir
cualquier valor en PUNTUACIN Z. Para poder sacarla. Tomo el valor y le
resto la media d ela poblacin y lo divido por la desviacin estndar de la
poblacin.

POR EJ.

SUJETO 1 = 108

POBLACIN = 100
Z=
DS = 10
0.8
Y LUEGO VAMOS A LA TABLA DE DISTRICUON NORMAL SEGN z Y CON Z =
0.8 EST SOBRE EL 78,81%

H1: El grado de comprensin lectora en nios de 4


bsico es menor a 15 puntos (puntuaciones de una
prueba de comprensin)

H0: El grado de comprensin NO es menor

Tomo una muestra para hacer una estimacin en referencia a la poblacin. Y la


media de la poblacin la saco segn otros estudios, porque no se conoce.

De la muestra tomar a cada sujeto que la compone, y aplicarle una muestra de


comprensin lectora, tomamos todas las pruebas de comprensin lectora y
calculamos la media para esa muestra. Y por ejemplo da 12 puntos. Pero
siempre se ha creido que han tenido como mnimo 15 puntos.

PRIMER PASO. Se restan! Y se ve que hay diferencia. CHAN 3 y se ve el


error de muestreo, que al ser una muestra pequea es mayor que exista.

Pero tambin se necesita considerar el tamao de muestra con que se hizo.


Onda y la muestra fueron 15, pero la poblacin son 1000.

El error de muestreo se define como


Mientras ms grande la muestra, menos error de muestreo.

Calcula una puntuacin Z, pero lo que calcula es una diferencia de las dos
medias.

Falta un criterio que me diga, si la Z de la formula difiere de 0. La prueba


estadstica ayuda a evaluar cual es el criterio de decisin.
Ya, est la diferencia de 1.4 y con qu criterio veo la diferencia???????

CUANDO UNA DIFERENCIA VA A SER RELEVANTE? Se toma el rea de


probabilidad para tomar la decisin.

Si z = 1.4 --- deja 8% hacia arriba. En cambio z = 1.645 deja 5% hacia arriba.
POR CONVENCION, se deja ms chico = Z = 1.65
Si ya puntuacin Z = 2 , queda dentro del 5% y FUERAAAA

SI z QUEDA DENTRO DEL 5% SUPERIOR, SE DICE QUE.

La diferencia entre la media de la


muestra y la media de la poblacin es
estadsticamente significativa.
El rea del 5% se llama nivel de significacin (regin de rechazo). El 95%
(parte amarilla en dibujo) se llama nivel de confianza (regin de
aceptacin).

Rechazo o aceptacin de que? De la hiptesis. De cul? De la NULA. Lo que se


dice es verdad. Si cae en la regin de acpetacin, no hay diferencias. Se
acepta hiptesis Nula.

Pero si la hiptesis hubiese sido:


ACTIVIDAD 7:

En la clase se ofreci un ejemplo de contraste con slo una muestra. Repita el ejemplo
con la siguiente hiptesis guas:

H1: El nivel de yoduria en la poblacin de escolares de 9 a 11 aos es mayor a 300


ug/L(microgramos por decilitro)
H0: El nivel de yoduria en la poblacin de escolares de 9 a 11 aos NO es mayor a 300 ug/L
(microgramos por decilitro)

Para probarlo con la misma prueba estadstica anterior, considere que se evalu a una
muestra de 21 estudiantes, obteniendo una media de yoduria de 376 ug/L, mientras
que estudios previos indican que la media de la poblacin es efectivamente de 300
ug/L. Tambin tiene el dato de la desviacin tpica, que es de 24 ug/L. Como
investigador se fija un nivel de significacin de 0.05.

Pregunta: Rechaza o no la hiptesis nula?


14,179. El valor cae dentro de
la regin de rechazo. Asi que se
rechaza o no la hiptesis nula?
SI. Con un nivel de significacin
de 5% contraste unilateral
derecho, se rechaza la hiptesis
nula de igualdad entre la media
de la muestra y la media de la
El nivel de yoduria en nios de 9 a 11 aos no es distinto a lo que se ha sabido
previamente o en estudios anteriores an cuando se observa una diferencia
esta no es estadsticamente significativa.

EJERCICIO

H1: EL GRADO DE SATISFACCION CON LA


CARRERA ES > A 17 PTOS

H0: EL GRADO E SATISFACCIN CON LA


CARRERA ES MENOR O IGUAL A 17
Resultado:
Muestra la desviacin estndar y la tabla de abajo es el resultado final. Donde
sale t = 1.04, es el valor Z = 1.04. Luego
sale significacin, por qu sale dos colas?
Porque, cuando tena dos colas, el valor
era 1.96. Ese valor es ms arriba, ms
exigente, implica que est siendo ms
exigente. LO UNICO QUE DEB
PREOCUPARSE de la tabla, es que el valor
1.04 est lejano de 1.64, y ms lejano an de 1.96. Y no llega al rea, no hay
diferencia estadsticamente significativa entre muestra y poblacin. Pero
OJO!!!! Abajo, sale 0.30 qu es eso? Es el rea que deja el Z obtenido hacia
arriba, entonces 30%.

Si el valor que aparece en crculo, es mayor a 5% no se puede rechazar

NO SE RECHAZA
hiptesis nula. Por lo tanto:

HIPTESIS NULA.

H1: El grado percibido por los estudiantes de la


carrera de pedagoga en las competencias
profesionales es mayor a 16

El valor 0.00 es mucho ms pequeo que 0.05, se rechaza hiptesis nula. Con
un nivel de significacion de 95% en contraste unilateral derecho se rechaza la
hiptesis nula. Por lo tanto la satisfacion de los estudiantes con respecto a las
competencias profesionales es mayor a 16.
CLASE 23 DE OCTUBRE

La semana pasada vimos la prueba estadstica, estimacin de una sola media,


la prueba T de una muestra, o bien, una media. Es una prueba de estimacin.
Tomar la media de una muestra, clacular la media en ella, y ver si esa, est
prxima o no, a la media de la poblacin. Cuando quiero saber la diferencia de
una sola muestra y la poblacin, esta prueba viene bien. Pero si quiero saber la
diferencia de grupos, necesito ver el rea de diferencia de grupos o
comparacin de grupos.

El primer grupo sera el experimental, el segundo control, con placebo, en vez


de intervencin.

1.- La aplicacin de terapia breve de tipo sistmica da ms efectividad que las


terapias tradicionales para reducir el grado de ansiedad en pacientes adultos
en la quinta regin?

VARIABLE 1: tipo de terapia, vendra a ser la variable independiente, la causa


del cambio, y puede ser de 2 tipos: la tradicional y la breve. Variable
EXPERIMENTAL, porque yo decido cual aplicar.

VARIABLE 2: el grado de ansiedad, variable dependiente, la que recibe el


efecto.

Existe otro tipo de pregunta, donde no se manipula la variable.

Los hombres y la mujeres difieren en el grado de ansiedad ante situaciones


estresantes?

VARIABLE 1: SEXO, hombre o mujer. Aqu la diferencia, esta variable no se


manipula como la anterior, este tipo de variable se llama VARIABLE NO
EXPERIMENTAL, ATRIBUTIVA

VARIABLE 2: grado de ansiedad.

Cul es la prueba de estadstica con la cual vamos a trabajar?

Viene a importar tambin lo probabilstico. La prueba estadstica para el


calculo, va a ayudar a tomar decisin. PRUEBA T PARA DOS MUESTRAS
INDEPENDIENTES (2 medias independientes)

Se usa prueba T, tengo que esperar que los datos se comporten de cierta
manera. Pero primero debo cumplir criterios.

Se toma la variable cuantitativa y esa variable tiene que distribuirse como


normal.

Se ve el grado de ansiedad en la distribucin normal


Pero todo fue en una muestra de 20 personas, es muy poco. La diferencia
observada (entre la media de hombres y media de mujeres) es igual a 5.7
puntos de diferencia. PERO NOS PODEMOS QUEDAR TRANQUILOS CON ESA
DIFERENCIA?

2 problemas

Para decirlo con propiedad debe aplicarse prueba que vea el tamao de la
muestra, y que , por lo tanto, vea el error de muestreo: PRUEBA T DE 2
MUESTRAS INDEPENDIENTES

Y ESA PRUEBA UTILIZA LA PRUEBA Y LA DISTRIBUCIN T, Y ASUMIR CIERTOS


SUPUESTOS:

SUPUESTOS ESTADSTICOS:

- Si yo tengo media de hombres, alrededor de toda media hay una


desviacin estndar, se tiene que ver.
- homogeneidad de varianzas u homosedasticidad: a l mejor no hay
distribucion de formal normal, pero si es importante que la dispersion de
los datos se vea ms o menos igual en los grupos. Se puede entender
pensndolo grficamente.

Es ms importante cumplir con la homogeneidad de varianza.


Se toman 2 muestras, idealmente de = tamao, que provengan e poblaciones
normales, en ambas muestras tengo que calulcar:

-medias

- poblacin tpicas desviacin estndar?

HAY QUE TENER EN CUENTA LOS SUPUESTOS !

CALCULO DEL ERROR (LAS X ARRIBA SE


REEMPLAZAN POR Y)
Con una diferencia de 9.5, el criterio que asumamos si esa diferencia era
distinta de 0, que a partir de un 5% superior, entonces ese valor
significativamente distinto de una diferencia 0.

Recordar que en una curva normal, sobre z = 1.65 era sobre 5%, pero esta
curva no es tan normal, entonces hay que tener en consideracin el tamao de
la muestra, y por lo tanto definir T.

Ver el porcentaje
bajo el 5% del error
tolerado

Valor Crtico. T=
Cundo podr asumir que 1.734
Valor t calculado sea mayor que el valor t tabulado, est por sobre el valor
crtico. La diferencia de medias es estadsticamente significativa.

Actividad 10, en archivo aparte

Actividad con PSPP

Se propone problema:
Difieren los estudiantes que ingresaron
en la promocin 2010 de aquellos que lo
hicieron el 2011 respecto del grado de
satisfaccin con la carrera?
Variable 1: ao de ingreso: dos grupos 2010 2011

Variable 2: Grado de satisfaccin con la carrera


MEJOR POR SEXO

En este caso debera ser mayor a 0.05


HAY MUCHA DIFERENCIA ENTRE MUJERES Y HOMBRES:

T muestra una table de descriptivos, la media, la desviacin estndar,

En hombres es = 16.13

En mujeres:= 17,68

Abajo aparecen 2 pruebas, primero aparece, es la denominada prueba deleven.


Y esta hace un cponstraste de hiptesis:

H1: LAS VARIANZAS DE AMBOS GRUPOS NO SON HOMOGNEAS

H0: LAS VARIANZAS DON HOMOGNEAS

EN ESTE CASO, NO SE PUEDE RECHAZAR LA HIP. NULA SI QUEREMOS QUE


SEAN HOMOGNEAS. Aparece valor F y la significacin (valor que deba ser
menor 0.05 para rechazar hiptesis nula), por lo tanto debe ser MAYOR A 0.05
para que no se rechace. Si es mayor a 0.05, no pueden rechazar la hiptesis
nula de igualdad de varianza

Si se cumple me quedo con la primera fila. T da negativo, pusieron primero a


hombres

Luego miro la significacin es 0.360 qu


significa? Significa que de 0.92 hacia abajo
queda 0.36 o 36%, o sea, ese 0.92 corta el
rea en un 36% hacia abajo. Se podra
dejar hacia arriba tambin y dejara 36%
hacia arriba, y yo necesito un 5%, se
puede comparar reas.
Si el rea obtenido con el t calculado, es mayor que 0.05, entonces, NO SE
RECHAZA H0

Interpretacin:

con un nivel de significacin del 5%


contraste bilateral no se rechaza la
hiptesis nula de igualdad de medias
Al final de esa frase se podra escribir lo siguiente en un informe

T = 0.92 , p = 0.360 (lo ultimo es significacin)

As se dice coloquialmente

Los hombres y las mujeres no


difieren en su grado
CLASE 6 DE NOVIEMBRE

Anlisis de Regresin Lineal Simple

Y eso genera un grfico, de una lnea. a es el intercepto y se calcula con una


frmula. Y la pendiente era b que era ms importante que el intercepto para
ver si las variables estaban relacionadas.

Todo el asunto tiene que ver con calcular lo anterior. Primero se calcula b. Y
luego a. Y se formula las hiptesis.

Ejemplo.

Mi problema es el siguiente. Cul es el grado de influencia entre efectividad


de la enseanza percibida por los estudiantes de la carrera de pedagoga y la
satisfaccin con la carrera?

Hiptesis conceptual: La efectividad de la enseanza influye sobre el grado de


satisfaccin con la carrera en estudiantes.

Hiptesis Nula: No influye

Hiptesis estadstica es como la de arriba.

Ambas variables deberan ser medidas con valores como puntuaciones

Ahora viene anlisis, para ver todo


Es un contraste de hiptesis.

Hay unos que son ms fciles de interpretar:

Primera tabla: de todo esa tabla lo que importa es el R y R2. R significa


correlacin: por lo tanto el primer resultado implica el grado de correlacin
entre dos variables. Ambas variables estn relacionadas positivamente y alta
correlacin fuerte.

El siguiente valor 0,50 (es el R elevado al cuadrado) El porcentaje de


variabilia d se satisfaccin de la carrera que es explicado por la efectividad de
la enseanza. Se podra pensar que no es poco.

La otra tabla ANOVA NO SE PESCA

La tercera si. En la tabla (hay que recordar ecuacin y = a + bX.

Constante: es el intercepto, el origen, el parmetro a. Y se podra


reemplazar directo en esa frmula = 5.16

Efectividad de la enseanza en el cruce con la letra B: ese es el valor del


parmetro b y se reemplza en la frmula = 0.74, significa la porcin que va a
cambiar de satisfaccin con la carrera por cada unidad de cambio que haya en
efectividad de la enseanza.

Ahora lo complicado

El BETA 0,7=Se refiere a la correlacin de Pearson, y les repite la intensidad


de la variable. A mayor correlacin ms intensidad hay. El origen no
correlaciona con nada y por lo tanto su valor es 0. BETA igual me indica la
relacin.
Y luego me da otra ayuda

Ese valor t que dice 8.76 es el cociente entre beta y el error estndar. Es
decir ( 0.74 / 0.09 ) se obtiene aproximadamente 8.7

Qu significa t?

Lo mismo que para otras cosas. En las desviaciones estndar: Si beta

8.7 SE ALEJA 8.7 unidades de desviacin desde una pendiente 0. Eso es


bastante distancia, el 99% est entre -3 y 3. Hay un resultado que se
escapa bastante de eso.

Hay que tener criterio de decisin, dado por el rea. Cundo el valor t va a
ser lo suficientemente distinto, como para decir que pendiente es distinta de 0.
Hay que ver el rea bajo la curva, 5%. El cual podra partir en 2 o cualquiera.

Cunta rea dejar 8.7 hacia la derecha? Cuanto vale ese pedacito, tiene que
ser ms chico que 0.05 para rechazar la hiptesis nula. Si el valor t calculado
es mayor que valor t de una tabla, pero es ms fcil verlo en el PC. Valor t y
luego dice SIGNIFICACIN, si ese valor es ms chico que 0.05, uno se rechaza
hiptesis nula y se queda con la hiptesis1. Si da 0.05 justo no se puede
rechazar hiptesis nula.

EJERCICIO

CUL ES el GRADO DE INFLUENCIA que la percepcin del recurso humano


tiene sobre el grado de satisfaccin con LA CARRERA en estudiantes de
pedagoga?
Hiptesis1 : La percepcin que se tiene del Recurso
humano influye sobre la satisfaccin con la carrera

H0: No influye

R = 0.76 = correlacin alta

R2 = 58% = alto

Constant = 4.08 a

b = 1.03 =
pendiente

t = 10.44

Significacin = es menor a 0.05, por lo tanto se rechaza hiptesis nula. Porque


hay una relacin de prediccin.

Вам также может понравиться