Вы находитесь на странице: 1из 22

Año del dialogo y reconciliación nacional “

UNIVERSIDAD NACIONAL DEL

ALTIPLANO PUNO

ÁREA: GEOESTADISTICA

“MONOGRAFIA”

TEMA: Medidas De Tendencias Central, Regresión Y Medidas De Variabilidad

DOCENTE: George Llerena Peredo

ALUMNA: Chavez Tohala, Thania Mariluz

ESCUELA PROFESIONAL: Ingeniería Geológica

SEMESTRE: I

PUNO – 2018
1
MONOGRAFIA

UNIVERCIDAD NACIONAL DEL ALTIPLANO PUNO

MEDIDAS DE TENDENCIAS CENTRAL, REGRESIÓN Y MEDIDAS DE VARIA

BILIDAD

DOCENTE: George Llerena Peredo

FECHA: 15 de mayo del 2018 PUNO – PERU

AREA: GEO ESTADÍSTICA

2
DEDICATORIA

El presente trabajo va dedicado en especial a mi docente

Y con todo cariño a mis padres quienes supieron darme concejos oportunos en

cuanto a mis estudios para que seamos profesionales con éxito

Como también a mis compañeros (os) que se esfuerzan día a día para poder

superarse a pesar de los obstáculos que se presentan así poder cumplir sus sueños

como profesionales con ética y moral

3
INDICE

INTRODUCCION…………………………………………………………………….5

DESARROLLO………..……………………………………………………..6

Moda……………………………………………………………………………...6

Mediana………………………………………………………………………..7

Media aritmética ………………………………………………………………..8

Media geométrica …………………………………………………………………………….10

Media armónica ………………………………………………………………………11

MEDIDAS DE VARIABILIDAD…………………………………………………..13

Desviación media……………………………………………………………………13

Desviación típica…………………………………………………………………….14

REGRESIONES………………………………………………….……………………17

CONCLUCION………………………….…………………..…………………..20

4
I .- INTRODUCCIÓN

Son medidas estadísticas que se usan para describir como se puede resumir la localización de

los datos. Ubican e identifican el punto alrededor del cual se centran los datos. Las medidas de

tendencia central nos indican hacia donde se inclinan o se agrupan más los datos. Las más

utilizadas son: la media, la mediana y la moda.

El propósito de las medidas de tendencia central son:

1. Mostrar en qué lugar se ubica el elemento promedio o típica del grupo.

2. Sirve como un método para comparar o interpretar cualquier valor en relación con el

puntaje central o típico.

3. Sirve como un método para comparar el valor adquirido por una misma variable en dos

diferentes ocasiones.

4. Sirve como un método para comparar los resultados medios obtenidos por dos o más

grupos.

Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de

puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están

próximas entre sí o si por el contrario están o muy dispersas.

Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene

restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de

calcular y sus unidades son las mismas que las de la variable, aunque posee varios

inconvenientes:

5
DESARROLLO

LA MODA

De lo anterior se infiere que en una muestra para que haya moda, tiene que existir por lo menos

un dato que se repita una cantidad de veces mayor que la que aparecen los demás. Por tanto, en

una muestra la moda puede o no existir, y si existe puede ser única o no. Se puede calcular para

cualquier escala de medición de la variable que se estudia.

Para denotar la moda de una variable X, se usará la notación Mo.

En ocasiones una lista de datos puede tener más de una moda, cuando son varios los datos que

más se repiten (y se repiten la misma cantidad de veces).

Esta medida de tendencia central es también usualmente empleada para estudiar situaciones de la

vida práctica. Es muy útil cuando los datos son cualitativos, pues no depende de cálculos con

ellos.

Puede ser usada para cualquier tipo de datos, es fácil de determinar.

Se señala que puede no existir y que no es una función algebraica de los valores individuales de

la serie, por lo que puede oscilar mucho de una muestra a otra.

Ejemplo, la moda se utiliza para indicar el número más frecuente de veces que un árbitro muestra

tarjeta amarilla a un jugador en un partido de voleibol para penalizar sus faltas, para indicar la

nota más frecuente que un grupo de alumnos obtuvo en la prueba de Matemática, para identificar

el horario preferido por los pobladores de una ciudad en una encuesta sobre el tránsito de una

línea de ómnibus.

6
LA MEDIANA.

La mediana de una muestra de tamaño N, cuyos datos han sido ordenados ascendente o

descendentemente, es el valor (único) que ocupa el propio centro de dichos datos.

Por tanto, si el elemento de la muestra cuyo valor es el de la mediana se excluye, los datos

primarios podrán redistribuirse en dos subgrupos, los cuales quedarán integrados por cantidades

iguales de datos.

Solo tiene validez práctica cuando se le aplica a variables que estén medidas en escala métrica u

ordinal.

Para calcular la mediana de una muestra de tamaño N, se deberán seguir los siguientes pasos:

 Ordenar los datos de modo ascendente o descendente.

 Calcular la posición que ocupa la mediana: si N es impar, la mediana ocupa la posición

(N +1) / 2 de los datos; en cambio sí N es par, entonces la mediana se encuentra entre los

datos que ocupan las posiciones N/ 2 y (N /2) +1.

 Dentro de la muestra ordenada localizar el dato o los datos que ocupan la posición o

posiciones calculadas en el paso 3.

En el momento de realizar la interpretación de la mediana se deberá tener mucho cuidado, ya que

en ocasiones esta coincide con algunos de los datos primarios y en otras no. Puede señalarse que:

La mediana siempre existe y puede ser determinada para cualquier grupo de datos, sean ordinales

o numéricos (no para datos nominales).

Siempre es única.

Puede ser hallada con un mínimo de cálculos siendo apropiada para muestras pequeñas.

7
No es fácilmente afectada por valores extremos.

En la práctica se puede utilizar por ejemplo para determinar el valor central de las notas de

Matemática de los 30 alumnos de un grupo o el valor central de la cantidad de pasajeros

transportados por un ómnibus en los recorridos que hizo en un día.

Ejemplo 1:

Conocidos los datos 3; 2; 5; 8; 7; 13; 11 calcule la mediana.

Después de ordenarlos queda: 2 3 5 7 8 11 13. El número de datos es impar: n = 7, = 4, por

tanto la mediana es el dato que ocupa el cuarto lugar; en éste caso el número 7.

MEDIA ARITMÉTICA

La media aritmética es el valor alrededor del cual se encuentran los datos de una lista.

Se calcula sumando todos los datos y dividiendo el resultado por el número de datos.

Se denota por el símbolo y la fórmula para calcularla es:

Esta expresión Xi representa a cada dato o valor de la variable, el signo S significa la suma de

todos los datos y n es la cantidad de datos.

A esta media aritmética se le llamara simple para diferenciarla de la media aritmética ponderada

que se analizará posteriormente. También, se le suele decir promedio, aunque este último nombre

8
se puede prestar a confusión. Constituye el punto de " equilibrio o centro de gravedad" de los

datos.

Es muy utilizada al analizar situaciones de la vida como por ejemplo al calcular el promedio de

notas de un alumno y el promedio del gasto de electricidad o de agua de una familia.

Puede señalarse que:

Siempre existe.

Siempre es única y fácil de calcular.

 Toma en cuenta cada dato de manera individual. Es una función algebraica de los valores

individuales de la serie de datos.

 Puede o no coincidir con uno o más de los datos y no depende de su cantidad. Para su

cálculo no requiere que los datos sean ordenados, ni tabulados y puede o no ser igual a la

moda.

 Se puede utilizar cuando la muestra no es extremadamente pequeña pero no en el caso de

datos nominales (que son atributos o valores dados por propiedades) ni ordinales.

 Si en una muestra todos los datos son iguales (constantes), entonces la media aritmética

de esa muestra es esa misma constante.

La media aritmética está influida por valores extremos, lo que constituye una limitante en su

utilización, o sea, está "afectada" por cada dato y principalmente, por aquellos que se alejan

mucho de los demás. Quizás sea esta la gran deficiencia o limitación de esta medida lo que hace

que, en ocasiones, la media no sea una "buena representación" de los datos.

9
Ejemplo 1:

Dada las notas (sobre 10 puntos) de 30 alumnos

6,9 9,7 3,2 6,8 8,8 5,3 4,5 2,8 8,7 9,8

6,8 7,6 9,2 8,3 8,3 6,3 6,9 7,6 6,8 9,3

7,7 7,6 9,8 5,7 1,3 7,2 9,7 4,9 6,9 1,7

a) Calcular la moda: Mo = 6,8 ; 6,9 ; 7,6

b) Calcular la mediana: Después de ordenadas las notas medias (pues 30 es par) son la 15 (6,9) y

la 16

(7,2), luego la mediana es:

En este caso la mediana no es un dato pues hay un número par de datos.

MEDIA GEOMÉTRICA

La media geométrica de una muestra de tamaño N es la raíz n - ésima del producto de los N

datos de esa muestra. Se denota esta medida por G. En símbolos:

10
Cuando los datos vienen dados por razones es más recomendable utilizar la geométrica en lugar

de la aritmética. La media geométrica se utiliza en los casos en que los datos de la variable que

se investiga, presenta una "razón de crecimiento". Tiene, entre otros campos, gran uso dentro de

la Biología.

Si la cantidad de observaciones es muy grande para simplificar los cálculos se hace uso de las

propiedades de los logaritmos decimales y se obtiene una nueva expresión para esta fórmula, que

en realidad es la que se utiliza:

En definitiva, para calcular la media geométrica de una muestra de tamaño N, se procede del

siguiente modo.

 Calcular el logaritmo decimal de cada dato de la muestra.

 Calcular la media aritmética de esos nuevos datos.

 Calcular el antilogaritmo de esa media.

MEDIA ARMÓNICA

La media armónica de una muestra de tamaño N es el cociente que se establece entre el

tamaño de la muestra y la suma de los recíprocos de los datos de esa muestra.

Denotando por MA esta medida y su fórmula para el cálculo es:

11
En resumen, para calcular la media armónica de una muestra de tamaño N, se procede del

siguiente modo:

 Calcular el recíproco de cada dato de la muestra.

 Calcular la suma de esos nuevos datos.

 Dividir el valor de N por la suma anterior.

La media geométrica de un conjunto de valores positivos es menor o igual a su aritmética pero

mayor o igual que la armónica.

Ejemplo 1:

La tabla de frecuencias que se presenta a continuación corresponde a los resultados

del control que realizó la directora de una escuela- durante 19 días - a los alumnos que llegaron

tarde a clases. Calcule la media, la moda y la mediana.

Para calcular la media, como los datos están recogidos en la tabla donde están reflejadas las

frecuencias absolutas se puede reducir el número de sumandos haciendo uso del cálculo de

los productos que se obtienen al multiplicar la cantidad de alumnos que llegaron tarde por la

12
frecuencia. La suma de estos productos se divide por el número total de datos y de esta forma se

obtiene la media aritmética.

Si se observa la tabla de frecuencias se puede notar directamente de que el valor que más se

repite en este conjunto de datos es el 5. De manera que la cantidad de alumnos que con más

frecuencia llegaron tarde al matutino fue de 5, que es la moda de estos datos En este caso para

determinar la mediana se deberá ordenar en forma creciente o decreciente el conjunto de datos:

0; 0; 1 ;1 ;2 ;2 ;2 ;3 ;3 ;4 ;4; 5 ;5; 5; 5; 5; 5; 6; 7 . Como el número de datos es impar bastaría

tomar su valor central que en este caso es 4. Luego la mediana del número de alumnos que

llegaron tarde al matutino es 4.

MEDIDAS DE VARIABILIDAD

DESVIACIÓN MEDIA, DM

Se define la desviación media como la media de las diferencias en valor absoluto de los valores

de la variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces

Si los datos están agrupados en una tabla estadística es más sencillo usar la relación

13
Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La

suma de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un

inconveniente, esto hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a

la población.

Varianza y desviación típica

Como forma de medir la dispersión de los datos hemos descartado:

 , pues sabemos que esa suma vale 0, ya que las desviaciones con respecto a la

media se compensan al haber términos en esa suma que son de signos distintos.

 Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos

realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero como hemos

mencionado, tiene poco interés por las dificultades que presenta.

Si las desviaciones con respecto a la media las consideramos al cuadrado, , de nuevo

obtenemos que todos los sumandos tienen el mismo signo (positivo). Esta es además la forma de

medir la dispersión de los datos de forma que sus propiedades matemáticas son más fáciles de

utilizar.

Vamos a definir entonces dos estadísticos que serán fundamentales en el resto del curso:

LA VARIANZA Y LA DESVIACIÓN TÍPICA.

La varianza, , se define como la media de las diferencias cuadráticas de n puntuaciones con

respecto a su media aritmética, es decir

14
Para datos agrupados en tablas, usando las notaciones establcidas en los capítulos anteriores, la

varianza se puede escibir como

Una fórmula equivalente para el cálculo de la varianza es

Si los datos están agrupados en tablas, es evidente que

La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden

en metros, la varianza lo hace en ). Si queremos que la medida de dispersión sea de la

15
misma dimensionalidad que las observaciones bastará con tomar su raíz cuadrada. Por ello se

define la desviación típica, , como

Ejemplo

Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros:

3,3,4,4,5

Solución: Para calcular dichas medidas de dispersión es necesario calcular previamente el valor

con respecto al cual vamos a medir las diferencias. Éste es la media:

La varianza es:

siendo la desviación típica su raíz cuadrada:

16
REGRESIONES

La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más

variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el

comportamiento de una variable dada.

La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de

mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a

construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la

práctica, nos arrojará un modelo carente de sentido, es decir ilógico.

Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna

de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. Las

ecuaciones de cada relación se presentan en la siguiente tabla.

Tabla 1. Ecuaciones de regresión

REGRESIÓN ECUACIÓN

Lineal y = A + Bx

Logarítmica y = A + BLn(x)

Exponencial y = Ae(Bx)

Cuadrática y = A + Bx +Cx2

Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya que

es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace uso

17
del coeficiente de correlación R, el cual mide el grado de relación existente entre las variables.

El valor de R varia entre -1 y 1, pero en la práctica se trabaja con el valor absoluto de R,

entonces, a medida que R se aproxime a 1, más grande es el grado de correlación entre los datos,

de acuerdo con esto el coeficiente de correlación se puede clasificar de varias formas, como se

observa en la Tabla 2.

Tabla 1. Ecuaciones de regresión

REGRESIÓN ECUACIÓN

Lineal y = A + Bx

Logarítmica y = A + BLn(x)

Exponencial y = Ae(Bx)

Cuadrática y = A + Bx +Cx2

Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya que

es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace uso

del coeficiente de correlación R, el cual mide el grado de relación existente entre las variables.

El valor de R varia entre -1 y 1, pero en la práctica se trabaja con el valor absoluto de R,

entonces, a medida que R se aproxime a 1, más grande es el grado de correlación entre los datos,

de acuerdo con esto el coeficiente de correlación se puede clasificar de varias formas, como se

observa en la Tabla 2.

18
Tabla 2. Clasificación del grado de correlación.

CORRELACIÓN VALOR O RANGO

Perfecta |R| = 1

Excelente 0.9 <= |R| < 1

Buena 0.8 <= |R| < 0.9

Regular 0.5 <= |R| <0.8

Mala |R|< 0.5

Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y predecir

o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una

herramienta útil para la planeación.

Ejemplo 1:

Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:

MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9

LENGUA 2 2 5 6 5 7 5 8 7 10

Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bivariante.

19
CONCLUSIÓN

Puede establecer como conclusión sobre el tema de tendencia central, que es el conjunto de

mecanismos que se tiene para el estudio de los métodos y procedimientos donde se dan los datos

tabulados que ayudan a dar inferencias científicas partiendo de tales datos. Estos datos sirven

para que todas las ramas de la ciencia donde se necesita llegar a dar conclusiones sobre

situaciones; por medio de los datos se forman grupos describiéndolos con solo un número. Para

tal fin no se utilizan los extremos sino que un valor más típico, el cual se encuentra en el centro.

Este centro sirve para poder llegar a un punto medio donde se ubicaría el promedio o punto

central de los datos descritos para poder establecer resultados como se puede ver a lo largo dela

historia como es el caso de Mendel

BIBLIOGRAFÍA

 https://www.emagister.com/uploads_courses/Comunidad_Emagister_66885_66885.p

df

 http://www.monografias.com/trabajos109/moda-media-y-mediana/moda-media-y-

mediana.shtml

 https://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_regresi%C3%B3n

 http://www.fao.org/docrep/003/x6845s/x6845s02.htm

20
21
22