Вы находитесь на странице: 1из 48

GUA DIDACTICA DEL MODULO

APLICACIONES ESTADISTICAS

PRESENTACIN

El propsito de esta gua es facilitar su aprendizaje en el mdulo de


APLICACIONES ESTADISTICAS. A lo largo de las siguientes pginas encontrar
informacin til del mdulo, de cmo contactar conmigo, de la plataforma informtica
que vamos a utilizar, de los objetivos didcticos de la asignatura y de las competencias
que va a adquirir tras el seguimiento, del temario, de la metodologa que seguiremos
durante el curso, de la bibliografa, de los criterios de evaluacin y de dnde consultar el
calendario de exmenes y mecanismo de tutora. Adems encontrar las Gua de Trabajo
independiente que deber realizar antes o despus de cada semana, segn le indique.
Favor lea esta Gua con atencin e inters y que si tiene cualquier problema para su
interpretacin me lo haga saber.
EL MODULO
El mdulo de Aplicaciones Estadsticas se ha desarrollado con el fin de brindar los
conocimientos cientficos necesarios para el futuro desarrollo del ejercicio profesional de
los estudiantes. Las necesidades de nuestra sociedad tecnificada requieren de los
profesionales de hoy la capacidad de recopilar, organizar, analizar, presentar y argumentar
sus decisiones con base en la informacin disponible por ellos. Adems, los invita a que
asuman posturas crticas que construyan sociedad con base en los conocimientos
aprendidos de manera autnoma y responsable.
De esta manera, el estudio de la Estadstica se caracteriza por formar a los futuros
profesionales en el campo cientfico y tico, al permitirles acceder a los elementos tericos
que constituyen la ciencia y al exigirles asumir actitudes de construccin social.
As, desde la unidad UNO se trata el tema de la representacin de los datos a travs de
tablas y diagramas, interpretacin de los resultados presentados por medio de las medidas
de tendencia central y medidas de dispersin, regresin y correlacin de variables.
El estudio de la Estadstica se ha convertido en uno de los pilares de las carreras
profesionales, tecnolgicas y tcnicas actualmente, al ofrecer a los futuros profesionales
elementos para la toma de decisiones en diversos contextos y situaciones. Sin embargo, el
estudio de esta ciencia en el siglo XX se ha caracterizado por la incorporacin de la

probabilidad como herramienta que sustenta y fundamenta los anlisis y conclusiones de la


Estadstica.

EL PROFESOR
Mi nombre es Alexis Sierra Barrera y durante el modulo ser su profesor,
tanto de los grupos virtuales y presenciales. Profesor de La Escuela de Estudios
Tcnicos y Tecnolgicos de la Universidad Tecnolgica de Bolvar. Soy Ingeniero
Industrial y Especialista en Gestin de Produccin y Calidad. Es parte de mi tarea
docente facilitarle su labor universitaria por lo que puede contactar conmigo para
cualquier cuestin acadmica, a travs de mi correo electrnico
(T00001028@utbvirtual.edu.co).

PLATAFORMA DEL MODULO

Durante el curso utilizaremos como plataforma informtica SAVIO. Usted es


miembro de la misma de forma automtica, por estar matriculado en mi modulo. Su uso
es muy sencillo, pero si todava no lo ha usado nunca puede aprender a hacerlo
siguiendo las indicaciones del manual que puede descargarse en esta direccin:
http://www.unitecnologica.edu.co/educacionadistancia/descargas
Ingreso al portal de SAVIO:
http://www.unitecnologica.edu.co/educacionadistancia/
Permtame hacerle unas recomendaciones, asegrese de usar el correo
institucional (ejemplo@utbvirtual.edu.co) para comunicarse dentro de la comunidad
universitaria. Por otro lado asegure de cambiar la clave frecuentemente y no compartirla.

INTENCIONES EDUCATIVAS

El curso aporta a la formacin integral del estudiante en los dominios cognitivos y socio afectivos.
En lo cognitivo el estudiante a travs de la solucin de problemas adquiere los conocimientos que le
permiten la aplicacin y la comunicacin de los saberes relacionados con su carrera tecnolgica.
En lo socio afectivo se generan los intereses y necesidades que le permitirn desenvolverse como
profesionales competentes en su vida laboral

OBJETIVOS Y COMPETENCIAS A DESARROLLAR

Al concluir el modulo, deber haber cumplido los siguientes objetivos:


Aplicar los conceptos de la estadstica en el planteamiento, organizacin,
anlisis, resolucin y presentacin de situaciones problema de manera
responsable y eficaz, que aporte a la construccin social desde su mbito
laboral.
Por otro lado, tendr oportunidad de poner en prctica y mejorar sus
competencias genricas relacionadas con: la capacidad de organizar datos, de analizar
comportamientos de fenmenos fisicos, as como las capacidades de aplicacin de la
teora a la prctica, de adaptacin ante nuevas situaciones y de anlisis crtico.

TEMARIO DEL MODULO


Unidad 1:
HISTORIA E IMPORTANCIA DE LA ESTADSTICA.
La estadstica y su importancia en las decisiones del hombre

RECOLECCIN DE DATOS Y GRAFICAS

Tabla de Frecuencias

Grficas Estadsticas

Unidad 2:
MEDIDAS DE TENDENCIA CENTRAL

Media, Mediana y Moda para Datos Sueltos

Media, Mediana y Moda para Datos Agrupados

Unidad 3:
MEDIDAS DE DISPERSIN.

Rango de Variacin, Desviacin Media, Desviacin Tpica y Varianza Para Datos


Sueltos

Rango de Variacin, Desviacin Media, Desviacin Tpica y Varianza para Datos


Agrupados

Unidad 4:
MEDIDAS DE DISTRIBUCIN: FRACTILES.

Cuartiles, Deciles y Percentiles para datos sueltos

Cuartiles, Deciles y Percentiles para datos Agrupados

Unidad 5:
REGRESIN Y CORRELACIN LINEAL

Modelacin de los datos estadsticos por medio de funciones

PLAN DE CURSO

METODOLOGA

La metodologa de esta asignatura tiene una doble vertiente: terica y prctica.


Enseanza terica independiente: Comprendern lecturas diarias del material asignado
en la plataforma SAVIO y las cuales tendrn actividades independientes para entregar
y hacer seguimiento de apropiacin.
Enseanza prctica: Los conocimientos tericos adquiridos durante las lecturas y
foros y actividades independientes se harn mediante la interaccin de los alumnos y bajo
la orientacin del profesor en las sesiones presenciales.

EVALUACIN

La evaluacin en el curso est concebida como un proceso que permitir ir


revisando paso a paso el desempeo del estudiante en trminos de desarrollo de
competencias y ganancia de habilidades, se evaluara en una escala de 0 a 5.
Los conocimientos tericos del mdulo se evaluarn en una prueba final escrita
a realizar en las fechas asignadas posteriormente.
Los conocimientos prcticos se evaluarn mediante casos prcticos y las Guias
de Trabajo independientes relacionados con el tema correspondiente

De acuerdo a las polticas de la Universidad Tecnolgica de Bolvar, la nota


final ser el promedio de notas parciales, cada una de ellas con una ponderacin igual.
Cada evaluacin se valorar de acuerdo con las actividades realizadas, as:
60% Talleres, quices, Investigaciones, foros de la plataforma SAVIO
40% Actividades en la etapa presencial y examen

BIBLIOGRAFIA

RPS-Qualitas Consultora de Calidad y Laboratorio S.L. Regresin Lineal en Excel


Medidas de Tendencia Central En Excel. www. monografa.com
Matos Navas Rodolfo Enrique. Modulo Introductorio, Excel Bsico: Una aplicacin a la
estadstica.2007
LLINAS SOLANO, Humberto; ROJAS LVAREZ, Carlos. Estadstica descriptiva y distribuciones de
probabilidad; ediciones Uninorte, 2005.
MARTNEZ BENCARDINO, Ciro. Estadstica y muestreo; Ecoe ediciones, dcimo segunda edicin,
2005.
PAGANO R, Roberto. Estadstica para las ciencias del comportamiento; Thompson editorial, sptima
edicin, 2006
Salinas O., Jos. Anlisis Estadstico para la Toma de Decisiones en Administracin y Economa.
1998. Universidad del Pacfico. Lima-Per. Nmeros ndices .pg. 361-376

GUIAS DE TRABAJO
UNIDAD 1:
HISTORIA E IMPORTANCIA DE LA ESTADSTICA.
La estadstica es una ciencia tan antigua como la escritura; sus orgenes se remontan a los
recuentos de personas, animales y bienes representados en pieles, rocas, maderos y cuevas.
Para encontrar su primer desarrollo es preciso indagar entre las ms antiguas
civilizaciones. Se sabe que antes de la invencin de los nmeros, en el antiguo Oriente
Medio se utilizaban guijarros para contar diferentes objetos con fines mercantiles, lo cual
ha permitido identificar dos pasos en la evolucin de la contabilidad; el inicial,
hacia 8000 a. C., cuando se utilizaban cuentas de diversas formas para contar diferentes
mercancas en una correspondencia de uno a uno. Luego, una vez aparecida la escritura,
los signos impresos que mostraban unidades de medida de granos pasaron a indicar
() nmeros abstractos
La invencin de los nmeros revolucion la contabilidad y la comunicacin porque
proporcion un sistema aplicable a todos los objetos existentes. De ah la importancia de
estos conocimientos para la supervivencia de las sociedades, algunas de las cuales lograron
un elevado refinamiento, como China y Roma.
El trmino estadstica es de origen latino, pero sus funciones han sido necesarias en los
Estados de prcticamente todas las pocas. Cabe recordar que los historiadores distinguen
tres grados de desarrollo en esta ciencia, segn produjera datos protoestadsticos,
provenientes de fuentes arqueolgicas; preestadsticos, de fuentes concebidas para otros
objetivos, como registros de nacimientos y defunciones, aduanas, etctera; y estadsticos
propiamente dichos, derivados de fuentes elaboradas especficamente para registro de
la poblacin.
La estadstica cumpla funciones vitales para la existencia de las grandes ciudades. Los
gobernantes deban conocer el nmero de personas capaces de trabajar o de tomar las
armas, la cantidad de alimentos necesarios para sostenerlas, la produccin en granos,
cabezas de ganado y otros bienes existentes en un momento y lugar determinados. Este
conocimiento se basaba en la realizacin peridica de conteos y estaba destinada al cobro
de tributos, indispensables para sostener los aparatos burocrtico, militar y religioso. No
obstante, carecemos de informacin sobre las bases para los conteos, que podan ser de
riqueza material y no de gente, o de ciudadanos libres, omitiendo esclavos, mujeres y nios1.

Instituto Nacional de Estadsticas y Geografa (Mxico)

Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da
referencias, en el libro de los Nmeros, de los datos estadsticos obtenidos en dos recuentos de la
poblacin hebrea. El rey David por otra parte, orden a Joab, general del ejrcito hacer un censo de
Israel con la finalidad de conocer el nmero de la poblacin. Tambin los chinos efectuaron censos
hace ms de cuarenta siglos. Los griegos efectuaron censos peridicamente con fines tributarios,
sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La
investigacin histrica revela que se realizaron 69 censos para calcular los impuestos, determinar
los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la
organizacin poltica, quienes mejor supieron emplear los recursos de la estadstica. Cada cinco
aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar
nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las
riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos
empadronamientos de la poblacin bajo la autoridad del imperio. Durante los mil aos siguientes a
la cada del imperio Romano se realizaron muy pocas operaciones Estadsticas, con la notable
excepcin de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en
el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos
parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro
del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras
de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra. Aunque Carlomagno, en
Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los
mtodos estadsticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV,
XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey,
Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma
que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional
exista ya un mtodo capaz de aplicarse a los datos econmicos. Para el ao 1532 empezaron a
registrarse en Inglaterra las defunciones debido al temor que Enrique VII tena por la peste. Ms o
menos por la misma poca, en Francia la ley exigi a los clrigos registrar los bautismos,
fallecimientos y matrimonios. Durante un brote de peste que apareci a fines de la dcada de 1500,
el gobierno ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre
continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenan los
nacimientos y fallecimientos por sexo. En 1662, el capitn John Graunt us documentos que
abarcaban treinta aos y efectu predicciones sobre el nmero de personas que moriran de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabra esperar. El
trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills
of Mortality (Observaciones Polticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad),

fue un esfuerzo innovador en el anlisis estadstico. Por el ao 1540 el alemn Sebastin Muster
realiz una compilacin estadstica de los recursos nacionales, comprensiva de datos sobre
organizacin poltica, instrucciones sociales, comercio y podero militar. Durante el siglo XVII
aport indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y ampli los
campos de la inferencia y la teora Estadstica. Los eruditos del siglo XVII demostraron especial
inters por la Estadstica Demogrfica como resultado de la especulacin sobre si la poblacin
aumentaba, decreca o permaneca esttica. En los tiempos modernos tales mtodos fueron
resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial
humano de sus respectivos pases. El primer empleo de los datos estadsticos para fines ajenos a la
poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en
Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los aos
terminados en siete mora ms gente que en los restantes, y para lograrlo hurg pacientemente en
los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de defuncin pudo
demostrar que en tales aos no fallecan ms personas que en los dems. Los procedimientos de
Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su
nombre, quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas
de mortalidad que hoy utilizan todas las compaas de seguros. Durante el siglo XVII y principios
del XVIII, matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la
teora de probabilidades. No obstante durante cierto tiempo, la teora
de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no comenz a
aplicarse a los grandes problemas cientficos. Godofredo Achenwall, profesor de la Universidad de
Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista).
Crea, y con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del
gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el trmino latino
status, que significa estado o situacin; Esta etimologa aumenta el valor intrnseco de la palabra,
cuanto la estadstica revela el sentido cuantitativo de las ms variadas situaciones. Jacques
Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora de la
probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de promedios
y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la aplicacin
prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia.
Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos
fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por
Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y Legendre.
A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin, que tena por
objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el desarrollo
del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la ciencia biomtrica
como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la
medida de las relaciones. Los progresos ms recientes en el campo de la Estadstica se refieren al
ulterior desarrollo del clculo de probabilidades, particularmente en la rama denominada

indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Fsica


como resultado de las investigaciones atmicas y que este principio se juzga aplicable tanto a las
ciencias sociales como a las fsicas

Etapas de Desarrollo de la Estadstica


La historia de la estadstica est resumida en tres grandes etapas o fases.
1.- Primera Fase: Los Censos: Desde el momento en que se constituye una autoridad poltica, la
idea de inventariar de una forma ms o menos regular la poblacin y las riquezas existentes en el
territorio est ligada a la conciencia de soberana y a los primeros esfuerzos administrativos.
2.- Segunda Fase: De la Descripcin de los Conjuntos a la Aritmtica Poltica: Las ideas
mercantilistas extraan una intensificacin de este tipo de investigacin. Colbert multiplica las
encuestas sobre artculos manufacturados, el comercio y la poblacin: los intendentes del Reino
envan a Pars sus memorias. Vauban, ms conocido por sus fortificaciones o su Dime Royale, que
es la primera propuesta de un impuesto sobre los ingresos, se seala como el verdadero precursor
de los sondeos. Ms tarde, Bufn se preocupa de esos problemas antes de dedicarse a la historia
natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva.
Sus tres principales representantes son Graunt, Petty y Halley. El penltimo es autor de la famosa
Aritmtica Poltica. Chaptal, ministro del interior francs, publica en 1801 el primer censo general
de poblacin, desarrolla los estudios industriales, de las producciones y los cambios, hacindose
sistemticos durante las dos terceras partes del siglo XIX
3.- Tercera Fase: Estadstica y Clculo de Probabilidades: El clculo de probabilidades se
incorpora rpidamente como un instrumento de anlisis extremadamente poderoso para el estudio
de los fenmenos econmicos y sociales y en general para el estudio de fenmenos cuyas causas
son demasiados complejas para conocerlos totalmente y hacer posible su anlisis.

Divisin de la Estadstica
La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica Descriptiva
y la Inferencial.
Estadstica Descriptiva: consiste sobre todo en la presentacin de datos en forma de tablas y
grficas. Esta comprende cualquier actividad relacionada con los datos y est diseada para
resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada
que vaya ms all de los datos, como tales.
Estadstica Inferencial: se deriva de muestras, de observaciones hechas slo acerca de una parte de
un conjunto numeroso de elementos y esto implica que su anlisis requiere de generalizaciones que
van ms all de los datos. Como consecuencia, la caracterstica ms importante del reciente
crecimiento de la estadstica ha sido un cambio en el nfasis de los mtodos que describen a mtodos
que sirven para hacer generalizaciones. La Estadstica Inferencial investiga o analiza una poblacin
partiendo de una muestra tomada.2

22

Manual de Estadstica de David Ruiz , Editado por eumednet 2004 ISBN: 84-688-6153-7

RECOLECCIN DE DATOS Y GRAFICAS

Tabla de Frecuencias : Las Tablas de frecuencias son herramientas de


Estadstica donde se colocan los datos en columnas representando los distintos
valores recogidos en la muestra y las frecuencias (las veces) en que ocurren.

Frecuencia absoluta

La frecuencia absoluta (ni) es el nmero de veces que aparece un determinado


valor en un estudio estadstico. Nmero de veces que se repite el -esimo valor de
la variable. La suma de las frecuencias absolutas es igual al nmero total de datos,
que se representa por n

Frecuencia absoluta acumulada

La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de


todos los valores inferiores o iguales al valor considerado.

N1 = n1

N2 = n1 + n2 = N1 + n2

N3 = n1 + n2 + n3 = N2 + n3

Nk = n

Frecuencia relativa:

La frecuencia relativa (fi) es la proporcin de veces que se repite un determinado


dato.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado


valor y el nmero total de datos.

fi = ni/n

La suma de las frecuencias relativas es igual a 1..

Frecuencia relativa acumulada

La frecuencia relativa acumulada (Fi) es el nmero de observaciones menores o iguales al


-esimo valor de la variable pero en forma relativa.

F1 = f l

F2 = f1+ f2 = F1 + f2

F3 = f1+ f2 + f3 = F2 + f3

Fk = 1

Ejemplo:
Supongamos que se tiene una poblacin de 2000 cajas y se desea examinarlas,
con el fin de determinar el nmero de piezas defectuosas que contiene cada caja.
No existe presupuesto para realizar la investigacin detallada, por lo tanto se
selecciona una muestra de tamao 20.

Tabla de frecuencias:

Grficos:
Diagrama de Frecuencias:

Diagrama de frecuencia acumulada:

TABLA DE FRECUENCIA DE DATOS AGRUPADOS


Cuando los datos contienen una gran cantidad de elementos, para facilitar los
clculos es necesario agruparlos, a estos grupos se los llama intervalos o clases.
Un intervalo es una serie de nmeros incluidos entre dos extremos, as por ejemplo,
el intervalo 40 45 est formado por 40, 41, 42, 43, 44 y 45, siendo 40 el lmite
inferior, 45 el lmite superior, 39,5 lmite real inferior (lmite inferior disminuido en 5
dcimas) y 40,5 el lmite real superior (lmite superior aumentado en 5 dcimas)3.

http://www.monografias.com/trabajos87/distribucion-frecuencias-datos-agrupados-intervalos/distribucionfrecuencias-datos-agrupados-intervalos.shtml#ixzz3shpjPUel

Reglas:

1-Determinar el valor mximo y mnimo de los datos.


Xmin
Xmax
2-Calcular el recorrido R:
R = Xmax Xmin
3-Calcule el nmero de intervalos (m) :
Se usa la regla de sturges:
m = 1 +3,3 log n
Se aproxima hacia el entero superior o inferior.
n= tamao de la muestra
4- Calcular la ancho del intervalo (C) :

=( ())/
Cuando el valor de C no es exacto, se debe redondear al valor superior ms cercano. Esto
altera el valor de rango por lo que es necesario efectuar un ajuste as:

Nuevo R = m * C

Grafica de datos:

Grafico deFrecuencias

60
50
40
30
20

Frec

10
0
243,1

246,1

249,1

252,1

255,1

258,1

261,1

264,0

240

243,1

246,1

249,1

252,1

255,1

258,1

261,1

UNIDAD 2:

MEDIDAS DE TENDENCIA CENTRAL

Media, Mediana y Moda para Datos Sueltos

Definiciones:
UNIDAD: es el objeto que observamos, cuando es una persona nos referimos a l como
sujeto.
OBSERVACIN: es la actividad, informacin o caracterstica que registramos de la unidad.
Una caracterstica que vara de unidad en unidad se llama VARIABLE y una coleccin de
variables la llamamos Base de Datos.

Variable Cualitativa: Las variables cualitativas son aquellas que permiten la expresin de
una caracterstica, una categora, un atributo o una cualidad.
Ej: una persona puede estar viva o muerta, no hay una tercera opcin.
Variable Cualitativa nominal: Una variable cualitativa nominal presenta modalidades no
numricas que no admiten un criterio de orden.Ej: El estado civil, con las siguientes
modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal: Una variable cualitativa ordinal presenta modalidades no
nmericas, en las que existe un orden. Ej: Medallas de una prueba deportiva: oro, plata,
bronce.
Variable Cuantitativa: Una variable cuantitativa es la que se expresa mediante un nmero,
por tanto se pueden realizar operaciones aritmticas con ella.
Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no
admite valores intermedios entre dos valores especficos. Ej: El nmero de hermanos de 4
amigos: 2, 1, 0, 1

Variable continua: Una variable continua es aquella que puede tomar valores comprendidos
entre dos nmeros. Ej: La altura de los 4 amigos: 1.73, 1.82, 1.77, 1.69

LA MEDIA:
Es la medida de posicin ms utilizada, se define como la suma de los valores observados
dividido entre el nmero de observaciones.
Se representa: M(x), ,
Para Datos no agrupados :

Ejemplo:
Se tienen 6 observaciones: 6,2,8,4,5,7

6+2+8+4+5+7
6

= 5,3

Para datos agrupados:


Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:

Ejemplo:

LA MEDIANA
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de
menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para
variables cuantitativas.

Clculo de la mediana para datos agrupados:

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta


la mitad de la suma de las frecuencias absolutas.

T en em o s qu e bu s c a r el in t e rv al o e n el q u e s e en cu en t r e

Li= es el lmite inferior de la clase donde se encuentra la mediana


F i - 1 = f r ec ue n c i a a c um u l ad a an t e ri o r a l a cl as e m edi an a .
a i =l a ampl i tu d d e l a cl as e .

Ejemplo:

Clculo de la mediana para datos no agrupados:


1- Ordenamos los datos de menor a mayor.

2 -Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la


misma.

2, 3, 4, 4, 5, 5, 5, 6, 6

Me= 5

3 -Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.

7, 8, 9, 10, 11, 12

Me= 9.5

LA MODA:
La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Clculo de la moda para datos no agrupados:

Hallar la moda de la distribucin:

2, 3, 3, 4, 4, 4, 5, 5

Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio


de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8

Mo = 4

Clculo de la moda para datos agrupados


Todos los in terva lo s tie nen la misma amplitud.

Li-1 = l lmite inferior de la clase modal.


fi = la frecuencia absoluta de la clase modal.
fi1 = la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 = la frecuencia absoluta inmediatamente posterior a la clase modal.
ai = la amplitud de la clase.
Ejemplo:

UNIDAD 3:
UNIDADES DE DISPERSION
En el caso de las variables con valores que pueden definirse en trminos de alguna escala
de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el
grado de dispersin o variabilidad existente en el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersin, por cuanto que estn referidos a la
variabilidad que exhiben los valores de las observaciones
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de
tendencia central son representativas como sntesis de la informacin. Las medidas de
dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la
distribucin respecto al valor central.

LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo
nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de los
datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir
tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es
menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersin antes de abordar esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una
amplia dispersin de valores con respecto al centro de distribucin o esto presenta riesgos
inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones
que tengan las dispersiones ms grandes.
Las principales medidas de dispersin son tres: El rango, la desviacin media y la
desviacin estndar. De manera semejante a las medidas de tendencia central, las medidas
de dispersin deben considerarse en sus dos opciones: cuando no estn agrupados los datos
y cuando estn por intervalos.

EL RANGO:
El rango es la diferencia entre los datos mayor y menor del conjunto. Tambin se le suele
llamar recorrido . En un conjunto de datos, mientras mayor sea el rango, mayor ser su
dispersin y, a la inversa, mientras menor sea su rango, menor su dispersin.
En los casos de las temperaturas del ejemplo anterior, el rango de A es R = 22 - 19.3 =
2.7, en cambio, el de B es B = 39 - (-3) = 42.

Rango para datos no agrupados;

R = Xmx.-Xmn = Xn-X1

Rango para datos agrupados:

Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de
clases abiertos podemos aproximar el rango mediante el uso de los lmites de clases. Se
aproxima el rango tomando el lmite superior de la ltima clase menos el lmite inferior de
la primera clase.

R= (lim. Sup. de la clase n lim. Inf. De la clase 1)

Propiedades del Rango o Recorrido:

El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que


simplemente es la distancia entre los valores extremos (mximo y mnimo) en una
distribucin

Puesto que el recorrido se basa en los valores extremos ste tiende s ser errtico. No es
extrao que en una distribucin de datos econmicos o comerciales incluya a unos pocos
valores en extremo pequeos o grandes. Cuando tal cosa sucede, entonces el recorrido
solamente mide la dispersin con respecto a esos valores anormales, ignorando a los dems
valores de la variable.

La principal desventaja del recorrido es que slo esta influenciado por los valores
extremos,, puesto que no cuenta con los dems valores de la variable. Por tal razn, siempre
existe el peligro de que el recorrido ofrezca una descripcin distorsionada de la dispersin.

En el control de la calidad se hace un uso extenso del recorrido cuando la distribucin a


utilizarse no la distorsionan y cuando el ahorro del tiempo al hacer los clculos es un factor
de importancia.

DESVIACION MEDIA:
Se define como la media de los valores absolutos de las diferencias entre los valores que
toma la variable y su mediana.
Dado un conjunto de datos cuya media aritmtica o promedio es, la diferencia o la distancia
x de cada valor nominal x a la media aritmtica se llama desviacin del dato x con respecto
a la media. Es decir, es una medicin de cunto se alej cada valor nominal x x de la media.

La media de los datos anteriores es:

La desviacin del dato x = 50 con respecto de la media x es d == 50 75 25


La desviacin del dato x = 60 con respecto de la media x es d = 60 75 15 =
y as sucesivamente

LA DESVIACIN MEDIA PARA FRECUENCIAS SIMPLES (No agrupados)


Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, es
decir, sin agrupar, la desviacin media DM se calcula por medio de la frmula:

Ejemplo:

LA DESVIACIN MEDIA CON TABLAS POR INTERVALOS ( agrupados)

INTERVALO
4-9
10-15
16-21
22-27
28-33
34-39
40-45
TOTALES

f
12
11
13
19
21
16
8
100

x
6,5
12,5
18,5
24,5
30,5
36,5
42,5

f*x
78
137,5
240,5
465,5
640,5
584
340
2486

| _|

f * | _|

18,36
12,36
6,36
0,36
5,64
11,64
17,64

220,32
135,96
82,68
6,84
118,44
186,24
141,12
891,6

Lo que quiere decir que el promedio de alejamiento de todos los valores respecto a la media
es de 8,916

DESVIACION TIPICA o ESTANDAR:


La siguiente medida de dispersin se llama desviacin estndar, porque con ella se pueden
estandarizar en todos los casos, todas las desviaciones de datos recolectados.
La desviacin estndar se simboliza con la letra griega si se trata de una poblacin y con
la letra s si se trata de una muestra.
Aqu el truco para quitar los valores negativos de la resta de x x es, aproximadamente,
elevar al cuadrado y luego regresar con una raz cuadrada.

LA DESVIACIN ESTNDAR PARA FRECUENCIAS SIMPLES ( no ordenados)


Cuando los datos estn ordenados en una distribucin de frecuencias simples, la desviacin
estndar para una poblacin se calcula mediante la frmula:

en donde = desviacin estndar de la poblacin


f = frecuencia
x = valor nominal
= media aritmtica

Cuando los datos estn ordenados en una distribucin de frecuencias simples, la desviacin
estndar para una muestra se calcula mediante la frmula

LA DESVIACIN ESTNDAR PARA FRECUENCIAS POR INTERVALOS(agrupados)


Cuando los datos han sido organizados en clases o intervalos, la desviacin estndar se
obtiene de manera similar a los procesos anteriores, es decir, con la misma frmula
aplicada a la organizacin de frecuencias simples, solamente que x debe ser el punto medio
del intervalo

VARIANZA:
Se define como la media aritmtica de los cuadrados de las desviaciones respecto a la
media.
Propiedades de la varianza

2 La varianza es un valor positivo, como ya se ha comentado anteriormente, la


igualdad slo se da en el caso de que todas las muestras sean iguales.

Si a todos los datos se les suma una constante, la varianza sigue siendo la misma.

Si todos los datos se multiplican por una constante, la varianza queda multiplicada
por el cuadrado de la constante.

Si se disponen de varias distribuciones con la misma media y se calculan las


distintas varianzas, se puede hallar la varianza total aplicando la frmula

Varianza para datos no agrupados:

Ms especficamente, la varianza es una medida de que tan cerca, o que tan lejos estn los
diferentes valores de su propia media aritmtica. Cuando ms lejos estn las Xi de su propia
media aritmtica, mayor es la varianza; cuando ms cerca estn las Xi a su media menos es
la varianza.

Ejemplo:
En un partido de baloncesto, se tiene la siguiente anotacin en los jugadores de un equipo:
0,2,4,5,8,10,10,15,38. Calcular la varianza de las puntuaciones de los jugadores del equipo.

Clculo de la varianza para datos agrupados:

En el caso de N muestras agrupadas en n clases se aplica la frmula:

Ejemplo:
La altura en cm de los jugadores de un equipo est en la siguiente tabla. Calcular la
varianza.
Intervalos
Inf
160
170
180
190
200

Sup
170
180
190
200
210

Xi
165
175
185
195
205

fi
1
2
4
3
2

Adicionar a la tabla las siguientes columnas:

UNIDAD 4:
MEDIDAS DE DISTRIBUCIN: FRACTILES.

Las Medidas de Posicin, tambin conocidas como Otras Medidas de Dispersin, son otras
medidas que resultan ser ms prcticos para precisar ciertas situaciones en las que se busca
describir la variacin o dispersin en un conjunto de datos.
Tanto las medidas de tendencia central como de dispersin en ocasiones son insuficientes
sobre todo cuando en ocasiones deseamos presentar el anlisis con respecto a la posicin
que ocupa la informacin que para nosotros resulta relevante, as por ejemplo, podemos
hablar de dividir la informacin a la mitad, realizado por la mediana, en cuatro partes, en
cinco, en diez o quiz en otro tipo de divisiones.

Cuartiles para datos no agrupados:


Son medidas de posicin que dividen en cuatro partes porcentuales iguales a una
distribucin ordenada de datos.

La forma de calcular los cuartiles cuando los datos no estn agrupados se da a travs del
siguiente concepto.

Para un nmero de n observaciones en el que los datos no son representados en clases, una
vez ordenados los datos la posicin de los cuartiles se pueden localizar de la siguiente
forma:

En el caso en que la posicin no corresponda exactamente con la posicin la interpolacin


se realiza de la siguiente forma:

Ejemplo. Consideremos la siguiente tabla de temperaturas reportadas en un experimento:

Cuartiles para datos agrupados:


Para datos agrupados los cuartiles debe e primer lugar buscar la clase donde se encuentra

En la tabla de frecuencias acumuladas

L i e s el l mi te i n f e ri o r d e l a cl a s e do n d e s e en cu en t ra l a
me di an a.

N e s l a su m a d e l as f r ecu en ci as ab sol u ta s.

F i - 1 e s l a f r ec u en ci a ac um u l a d a an t e ri o r a l a cl a s e
me di an a.

a i e s l a a mpl i tu d d e l a cl as e .

Ej em pl o:

C al c ul a r lo s c u a rt i le s d e l a di st ri bu ci n d e l a ta bl a:

Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

Deciles para datos no agrupados:


Paso1: Ordenamos los datos de menor a mayor

Paso2: Dividir las observaciones en 10 partes iguales cada parte representa el 10% del
total

Paso3: Buscamos el lugar que ocupa cada decil mediante la expresin

Cuando es par :

Cuando es impar:
. ( + 1)
10
Di= Li + (Ls- Li)* excedente posicin k

Ejemplo:

Calcular los deciles de los datos ordenados:

Deciles para datos agrupados:

En primer lugar buscamos la clase donde se encuentra

en la tabla de las frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra la mediana.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

Ejemplo:

Percentiles.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

P50 coincide con la mediana.

En primer lugar buscamos la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.


Luego usamos la frmula:

Li es el lmite inferior de la clase donde se encuentra la mediana.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

Ejemplo:
Calcular el percentil 35 y 60 de la distribucin de la tabla:

UNIDAD 5:

REGRESIN Y CORRELACIN LINEAL4

Regresin:
Es un mtodo estadstico desarrollado para investigar relaciones entre variables.
El anlisis de regresin genera una ecuacin matemtica que permite describir la relacin
existente entre dos variables. Se obtiene una lnea conocida como lnea de regresin que
nos describe la relacin o dependencia entre las dos variables.
Esta lnea o funcin matemtica, en el caso de una variable dependiente ( una influye sobre
la otra) se puede expresar a travs de :
Una recta

y = a +bx

Parbola = 2 + +
Potencial =
Exponencial =

REGRESIN LINEAL:
Es el anlisis que ms se usa por su simplicidad, en muchos casos de la vida real se ajustan
lo suficiente para ser aceptada.

Est dada la relacin lineal por la ecuacin de la forma:

y = a +bx

Y= variable a estimar
x= variable independiente
b= es la pendiente de la recta, o inclinacin
a= coeficiente de posicin u origen en la ordenada. Intercepto de la lnea con el eje y

Estadistica y muestreo , Ciro Martinez, Pag 561

CORRELACION:
Es el grado de relacin existente entre dos variables.

Cuando existe correlacin total entre dos variables se cumple que para cada valor
de una le corresponde un nico valor de la otra variable.
El requisito esencial para utilizar esta tcnica es que ambos conjuntos de datos por
relacionar se puedan cuantificar, por eso se habla de las dos variables una
dependiente y otra independiente, la dependiente se dibuja en el eje Y y la
independiente en el eje X.

Coeficiente de correlacin:

El coeficiente de correlacin R mide el grado de relacin entre las


dos variables. Este vara desde -1 a +1.

Interpretacin del Coeficiente de correlacin:

FUERTE CORRELACION POSITIVA: significa que si estn correlacionadas la


causa con el efecto. Por tanto si usted controla la causa podr predecir qu suceder
con el efecto, ya que en la medida que la causa aumente o disminuya en magnitud
suceder lo mismo con el efecto.
FUERTE CORRELACIN NEGATIVA: En esta tambin se puede predecir qu
suceder con el efecto, pero esta vez si la magnitud de la causa aumenta entonces el
efecto disminuye y viceversa.
CORRELACIN DBIL POSITIVA O NEGATIVA: significa que el efecto estudiando
no se puede explicar solamente por la causa estudiada y existen otras variables que
determinan su comportamiento. En estos casos se requiere utilizar otras tcnicas
ms complejas como el Diseo de Experimentos o el anlisis de variable mltiple.
NINGUNA CORRELACIN: es til tambin determinar que no existe ninguna
relacin entre las dos variables analizadas, ya que lo que se crea poda ser la con
el efecto estudiado y por tanto se descarta como factor de anlisis.

Ejemplo:

Fuerte correlacin positiva

Вам также может понравиться