Вы находитесь на странице: 1из 15

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA VICE RECTORADO ACADMICO SEDE, EL CALLAO II SEMESTRE SECCIN 1 CARRERA CIENCIAS FISCALES

PROFESORA:

INTEGRANTES:

ROSANA ORONOZ

STEPHANY GUEVARA NAIRELYN LOZANO AURIMAR POMA EMIBET DELBARRIO

JULIO; 2013

NDICE

PG. Introduccin. Regresin Correlacin. Diagrama De Dispersin Conclusin.. Referencias Bibliogrficas. 03 04 06 09 14 15

INTRODUCCIN

La Correlacin y la Regresin son de suma importancia ya que la correlacin entre dos variables tan solo significa que ambas variables comparten informacin, que comparten variabilidad y Los modelos de regresin se usan cuando tenemos dos o ms variables relacionadas en un conjunto de datos y queremos explorar como el comportamiento de una de ellas (que se denominan la variable respuesta o dependiente) se ve influenciada por las otras variables (que se denominan variables explicativas o independientes).

Por todo lo anteriormente mencionado esta investigacin tiene como objetivo general indagar y conocer todo lo relacionado con Correlacin y Regresin a fin de lograr un anlisis de lo entendido; por ello la investigacin se estructura de la siguiente manera:

Correlacin: Diagrama de Dispersin, Coeficiente de Correlacin lineal de Pearson, Causalidad y Correlacin, Coeficiente de Correlacin por Rangos de Spearman, Coeficiente Biseral Puntual y Correlacin Parcial y Multiple.

Regresin: Ecuacin de la Funcin Lineal, Ecuacin de Regresin, Mtodos Mnimos Cuadrados, Error de Estimacin e Intervalo de Confianza de una Estimacin.

Por ltimo se deja en conocimiento las conclusiones donde se explica en forma clara y precisa los objetivos alcanzados y lo entendido de la investigacin con sus respectivas referencias.

REGRESIN El trmino regresin fue introducido por Francis Galton en su libro Natural inheritance (1889) y fue confirmada por su amigo Karl Pearson. Su trabajo se centr en la descripcin de los rasgos fsicos de los descendientes (variable A) a partir de los de sus padres (variable B). Estudiando la altura de padres e hijos a partir de ms de mil registros de grupos familiares, se lleg a la conclusin de que los padres muy altos tenan una tendencia a tener hijos que heredaban parte de esta altura, pero que revelaban tambin una tendencia a regresar a la media. Galton generaliz esta tendencia bajo la "ley de la regresin universal": Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.

La regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

Cundo existe regresin? De una forma general, lo primero que suele hacerse para ver si dos variables aleatorias estn relacionadas o no (de ahora en adelante las llamaremos X e Y, denotando con Y a la variable dependiente, y X a la variable independiente o regresora), consiste en tomar una muestra aleatoria. Sobre cada individuo de la muestra se analizan las dos caractersticas en estudio, de modo que para cada individuo tenemos un par de valores (xi, yi) (i=1,...,n). Seguidamente, representamos dichos valores en unos ejes cartesianos, dando lugar al diagrama conocido como diagrama de dispersin o nube de puntos. As, cada individuo vendr representado por un punto en el grfico, de coordenadas, xi, yi. De esa forma, podremos obtener una primera idea acerca de la forma y de la dispersin de la nube de puntos.

Al dibujar la nube de puntos, podemos encontrarnos, entre otros, los casos a los que hace referencia la figura 6.1.

En primer lugar deberemos distinguir entre dependencia funcional y dependencia estocstica. En el primer caso la relacin es perfecta: Y=f(X) (ver figura 6.1 d y e); es decir, los puntos del diagrama de dispersin correspondiente, aparecen sobre la funcin Y=f(X). Por ejemplo, el caso de la figura 6.1d sera Y=a+bX.

Sin embargo, lo que suele ocurrir es que no existe una dependencia funcional perfecta, sino otra dependencia o relacin menos rigurosa que se denomina dependencia estocstica (figura 6.1b y c); entonces, la relacin entre X e Y, podramos escribirla (en el caso de la figura 6.1.b) de la forma Y=a+bX+e, donde e es un error o un residual, debido por ejemplo, a no incluir variables en el modelo que sean importantes a la hora de explicar el comportamiento de Y, y cuyos efectos sean diferentes a los de X; errores

aleatorios o de medida, o simplemente a que estamos especificando mal el modelo (por ejemplo, que en lugar de ser una recta, sea una parbola).

CORRELACIN La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables estadsticas distintas, con el fin de ver si existe alguna relacin entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables estn correlacionadas o bien que hay correlacin entre ellas.

El trmino correlacin se utiliza generalmente para indicar la correspondencia o la relacin recproca que se da entre dos o ms cosas, ideas, personas, entre otras.

En tanto, en probabilidad y estadstica, la correlacin es aquello que indicar la fuerza y la direccin lineal que se establece entre dos variables aleatorias.

Se considera que dos variables de tipo cuantitativo presentan correlacin la una respecto de la otra cuando los valores de una ellas varen sistemticamente con respecto a los valores homnimos de la otra.

Por ejemplo, si tenemos dos variables que se llaman A y B, existir el mencionado fenmeno de correlacin si al aumentar los valores de A lo hacen tambin los valores correspondientes a B y viceversa.

De todas maneras, vale aclarar que la correlacin que pueda darse entre dos variables no implicar por si misma ningn tipo de relacin de causalidad. Los principales elementos componentes de una correlacin de este tipo sern: la fuerza, el sentido y la forma.

MEDIDA DE LA CORRELACIN La apreciacin visual de la existencia de correlacin no es suficiente. Usaremos un parmetro, llamado coeficiente de correlacin que

denotaremos con la letra r, que nos permite valorar si sta es fuerte o dbil, positiva o negativa.

El clculo es una tarea mecnica, que podemos realizar con una calculadora o un programa informtico. Nuestro inters est en saber interpretarlo destacaremos una de sus propiedades -1 < r < 1

CORRELACIN LINEAL Y RECTA DE REGRESIN Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aqu nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as ocurre diremos que hay correlacin lineal. La recta se denomina recta de regresin.

Hablaremos de correlacin lineal fuerte cuando la nube se parezca mucho a una recta y ser cada vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta.

En el grfico observamos que en nuestro ejemplo la correlacin es bastante fuerte, ya que la recta que hemos dibujado est prxima a los puntos de la nube.

Cuando la recta es creciente la correlacin es positiva o directa: al aumentar una variable, la otra tiene tambin tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlacin es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

Ejemplo 2:

Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la grfica se describen el n de errores que corresponden a los intentos realizados.

Observa que hay una correlacin muy fuerte (los puntos estn "casi" alineados) y negativa (la recta es decreciente).

DIAGRAMA DE DISPERSIN La primera forma de describir una distribucin bivariante es representar los pares de valores en el plano cartesiano. El grfico obtenido recibe el nombre de nube de puntos o diagrama de dispersin.

Un diagrama de dispersin es una representacin grfica de la relacin entre dos variables, muy utilizada en las fases de Comprobacin de teoras e identificacin de causas raz y en el Diseo de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la resolucin eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es ms

fcil ver la relacin en un diagrama de dispersin que en una simple tabla de nmeros.

Caractersticas principales

Impacto visual Un Diagrama de Dispersin muestra la posibilidad de la existencia de correlacin entre dos variables de un vistazo.

Comunicacin Simplifica el anlisis de situaciones numricas complejas

Gua en la investigacin El anlisis de datos mediante esta herramienta proporciona mayor informacin que el simple anlisis matemtico de correlacin, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en su utilizacin.

Utilidad Los diagramas de dispersin pueden utilizarse para examinar: Relaciones causa-efecto Relaciones entre dos efectos Posibilidad de utilizar un efecto como sustituto de otro Relaciones entre dos posibles causas En las distribuciones bidimensionales a cada individuo le

corresponden los valores de dos variables, las representamos por el par (xi, yi).

Si representamos cada par de valores como las coordenadas de un

punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin.

EJEMPLOS Con referencia a las variables Peso y Est (estatura) del archivo Encinf. sav comprobar grfica y analticamente la existencia de una relacin lineal entre ellas.

1. La representacin grfica que permite comprobar la existencia de relacin lineal entre dos variables es el diagrama de dispersin y la medida analtica adecuada es el coeficiente de correlacin lineal.

Con la secuencia Grficos > Dispersin > Simple > Definir se abre el cuadro de dilogo Diagrama de dispersin simple.

Se seleccionan en el Eje Y la variable Peso y en el Eje X la variable Est, y se obtiene el siguiente grfico:

Como se observa en el grfico ambas variables presentan una relacin lineal positiva; es decir, a medida que aumenta el valor de la variable Est aumenta tambin el valor de la variable Peso.

Si se desea ver la nube de puntos con la lnea de mejor ajuste superpuesta, y que los casos iguales o muy prximos entre si queden representados por un slo punto, se edita el grfico haciendo doble clic sobre el mismo.

En el editor de grficos se selecciona Diseo > Opciones y en el cuadro Opciones del diagrama de dispersin se activa Mostrar girasoles y Ajustar lnea > Total.

Para cuantificar el grado de asociacin lineal entre las variables la medida adecuada es el coeficiente de correlacin lineal de Pearson. Con la secuencia Analizar > Correlaciones > Bivariadas se abre un cuadro de dilogo donde se seleccionan las variables Peso y Est, y con las opciones Coeficiente de correlacin > Pearson se obtiene la siguiente matriz de correlaciones.

El valor de r=0,883 es positivo y elevado, as como significativo para cualquier nivel, con lo cual se confirma la impresin

proporcionada por el grfico acerca de la existencia de asociacin lineal entre las variables.

CONCLUSIN

Las terminologas antes reseadas, nos permiten tener una visin de cmo estn entrelazadas unas de las otras y que cada una forma un valor indispensable al momento de establecer las diferentes variables aplicadas estadsticamente a los diferentes estudios que ser puedan generar para satisfacer la necesidad de saber el cmo se est haciendo y los posibles resultados que estos puedan dar y de esta manera mejorar o cambiar las tcticas aplicadas en el estudio para mejorar la calidad del servicio o en su defecto mejorar el estudio que se est realizando.

La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias.

Todo trabajo necesita un estudio estadstico que nos permita relacionar, correlacionar y estudiar las variables que se puedan aplicar para mejorar las decisiones aplicadas o por aplicar.

REFERENCIAS BIBLIOGRFICAS

http://www.monografias.com/trabajos14/estadistica/estadistica.shtml

http://www.ditutor.com/estadistica_2/correlacion_estadistica.html

http://es.scribd.com/doc/76973719/122/Tipos-de-regresion

http://es.wikipedia.org/wiki/Diagrama_de_dispersi%C3%B3n

http://www.buenastareas.com/ensayos/Coeficiente-De-Determinaci