Вы находитесь на странице: 1из 29

UNIVERSIDAD NACIONAL DE INGENIERIA

FACULTAD DE INGENIERIA CIVIL


ESTADISTICA Y PROBABILIDADES

INTRODUCCIN
El presente trabajo fue realizado con la intencin de agrupar un conjunto de datos
que frecuentemente se nos presenta a diario para llevarlo a un diseo y analizar.
Cuando hablamos de mtodo, nos referimos a un conjunto de procedimientos
sistemticos para lograr el desarrollo de una ciencia.
Ahora bien, al desglosar nuestra investigacin planteamos tcnicas referentes a
como recolectar datos, como medir los datos, codificacin, validez y los diferentes
instrumentos de medicin tales como: la entrevista, el cuestionario, la observacin,
la encuesta.
El experimento entre otro tomando en consideracin la confiabilidad de estos
instrumentos que no es otra cosa que el grado en que su aplicacin repetida al
mismo sujeto o objeto produce iguales resultados sin dejar otras. Sus posibles
variaciones antes instrumentos poco confiables.
A continuacin presentamos un desarrollo bien definido que nos permitir conocer
cada unos de los mtodos para recolectar informacin.
Las universidades fueron: UNALM, Stanford, Navarra, Irvinne, UNDAC, UNE.

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

ANTECEDENTES:
UNALM
La Universidad Nacional Agraria La Molina (UNALM) mantiene su estructura de
funcionamiento por departamentos, pero como unidad acadmica, ncleo de
operaciones de investigacin, enseanza y proyeccin social que agrupa a
profesores que cultivan disciplinas afines, bajo un sistema de currculum flexible.
Est regida por la Ley Universitaria N 23733, promulgada el 9 de diciembre de
1983. Precisamente, esta norma deja en libertad a cada universidad para que
organice y establezca su propio rgimen acadmico, de acuerdo con sus
caractersticas y necesidades.
La UNALM es una organizacin tcnica, acadmica y nica en el pas. Ofrece a
sus alumnos ambientes propicios para el estudio, cmodas aulas de clase,
laboratorios modernos y equipados para cada una de las especialidades, un
centro de procesamiento de datos, extensas reas para prcticas de campo,
invernaderos, planos pilotos agroindustriales que generan recursos propios, y la
biblioteca agrcola ms completa del pas.

STANDFORD
La Universidad Leland Stanford Junior (Leland Stanford Junior University en
ingls), conocida como Universidad Stanford, ubicada en Palo Alto (California), es
una universidad privada, considerada como una de las ms prestigiosas de los
Estados Unidos y del mundo.
Est localizada a unos 56 km al sudeste de San Francisco, en terrenos del
condado de Santa Clara contiguos a la ciudad de Palo Alto. La universidad se
halla por lo tanto en el corazn geogrfico e histrico de Silicon Valley.

NAVARRA

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

La Universidad de Navarra es una universidad privada perteneciente al Opus Dei y


fundada en Pamplona (Navarra, Espaa) en 1952 por Josemara Escriv de
Balaguer.
En la Universidad de Navarra se pueden cursar 27 titulaciones oficiales y ms de
300 programas de postgrado en 10 facultades, dos escuelas superiores, el IESE
(Instituto de Estudios Superiores de la Empresa), dos escuelas universitarias, el
ISSA (School of Management Assistants), y otros centros e instituciones. La
Biblioteca de la Universidad, con ms de 1,1 millones de volmenes, tiene una de
las mayores colecciones de Europa.
Incluye la Clnica Universidad de Navarra que, con cerca de 1.700 profesionales
cualificados, atiende a ms de 100.000 pacientes al ao. En el ao 2004 se
inaugur el Centro de Investigacin Mdica Aplicada (CIMA) en el que 300
investigadores desarrollan sus estudios biomdicos.
La Universidad de Navarra, junto con la Universidad Europea de Madrid, la
Universidad CEU San Pablo, la Universidad Internacional de Catalua, la
Universidad Catlica de Valencia San Vicente Mrtir y la Universidad Alfonso X el
Sabio es una de las 6 nicas universidades privadas en Espaa autorizadas para
impartir los grados oficiales de Medicina.

UNDAC
A mrito de la Resolucin N 040/A - 90 - R, se crea la Escuela de Post Grado el
22 de febrero de 1990. Con Resolucin N 286 - 95 - ANR, La Escuela de Post
Grado entra en funcionamiento del 28 de octubre de 1994 con la Resolucin N
286 - 95 - ANR.
Se rige por las Leyes Peruanas y su propio Estatuto, en cuyo artculo se establece
los fines siguientes:
Formar investigadores en los diferentes campos de la ciencia, de la tecnologa y
de las humanidades, para contribuir a la solucin de los problemas regionales y
nacionales.
Preparar investigadores del ms alto nivel cientfico para las labores de
investigacin y docencia universitaria.

UNE
La historia de la Universidad Nacional de Educacin se remonta al 6 de Julio de 1822, cuando el
de San Martn, por Decreto Supremo, cre la primera Escuela Normal de Preceptores, fecha

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

celebracin del Da del Maestro.


Inaugurada oficialmente dos meses despus, inici su fecunda y azarosa vida
como forjadora de preceptores para los primeros aos del Per independiente. Su
primer Director fue el ciudadano ingls Diego Thompson, quien implant el modelo
educativo llamado Sistema Lancasteriano en la preparacin de los maestros. De
acuerdo con este sistema, los alumnos ms avanzados se convertan en monitores
y contribuan mediante la prctica en el aula a la mejor formacin de sus
condiscpulos.

OBJETIVOS:
1. Evaluar y realzar la calidad de los datos
2. Describir la poblacin de estudio y su relacin con alguna supuesta fuente
(justificar todos
los pacientes potenciales involucrados; comparacin de la poblacin de estudio
obtenida con
la poblacin blanco)
3. Evaluar la posibilidad de sesgos (p.ej., no-respuesta, negativa a contestar, y
desaparicin de sujetos, grupos de comparacin)
4. Estimar las medidas de frecuencia y extensin (prevalencia, incidencia, media,
mediana)
5. Estimar medidas de fuerza de asociacin o efecto
6. Evaluar el grado de incertidumbre a partir del azar (ruido)
7. Controlar y analizar los efectos de otros factores relevantes
8. Buscar una mayor comprensin de las relaciones observadas o no observadas
9. Evaluar el impacto o importancia

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

EDICION DE DATOS:
En un estudio bien ejecutado, el plan de recoleccin de datos incluye
procedimientos, instrumentos,
y formularios, diseados y ensayados para maximizar su precisin. Todas las
actividades de recoleccin de datos son monitorizadas para asegurar la
adherencia al protocolo de recoleccin de datos y para promover acciones para
minimizar y resolver situaciones de datos faltantes o cuestionables. Los
procedimientos de monitorizacin son establecidos al inicio y mantenidos durante
todo el estudio, dado que cuanto antes se detecten las irregularidades, mayor la
probabilidad de que puedan ser resueltas de manera satisfactoria y ms
precozmente se puedan establecer medidas preventivas.
Sin embargo, a menudo hay necesidad de editar los datos, tanto antes como
despus de computarizarlos. El primer paso es manual o edicin visual. Antes
de digitar los formularios (salvo que los datos sean entrados en la computadora en
el momento de recoleccin, p.ej., a travs de programas como CATI - entrevistas
telefnicas asistidas por computadora (computer-assisted telephone interviewing),
los formularios deben ser revisados para identificar irregularidades y problemas
que pasaron desapercibidos o no fueron corregidos durante el monitoreo.

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

LIMPIEZA DE DATOS
Una vez que los datos son introducidos en la computadora y son verificados
(pueden verificarse por introduccin por dos personas o por verificacin visual) son
sometidos a una serie de verificaciones por la computadora para limpiarlos.
Verificacin de rangos
La verificacin de rango compara cada dato con un conjunto de valores permitidos
y usuales para esa variable. La verificacin de rango se usa para:
1. Detectar y corregir valores no vlidos
2. Identificar e investigar valores inusuales
3. Sealar valores atpicos o extremos (outliers) (an si son correctos, su
4. presencia puede influir sobre los mtodos estadsticos a utilizar)
SEXTA PRCTICA CALIFICADA
TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

5. Verificar la lgica de las distribuciones y tambin apreciar sus formas, dado


que esto tambin afectar la seleccin de procedimientos estadsticos
Verificacin de la consistencia
La verificacin de la consistencia examina cada par (a veces ms) de datos
relacionados, en relacin con el conjunto de valores habituales y permitidos de las
variables como par. Por ejemplo, los hombres no deben haber tenido una
histerectoma. Los estudiantes universitarios habitualmente tienen por lo menos 18
aos (aunque pueden haber excepciones, por eso se considera que la verificacin
de la consistencia es un procedimiento blando, no duro.) La verificacin de la
consistencia se usa para:
1. Detectar y corregir las combinaciones no permitidas
2. Sealar e investigar combinaciones inusuales
3. Verificar la consistencia de los denominadores y valores ausentes y no
corresponde (i.e., verificar que los patrones de salteado de llenado han
sido cumplidos
4. Verificar la lgica de las distribuciones conjuntas (p.ej., en los grficos de
puntos)

CODIFICACION DE LOS DATOS


La codificacin de los datos significa la traduccin de la informacin en valores
adecuados para ser ingresados en la computadora y para el anlisis estadstico.
Todo tipo de datos (p.ej., historias clnicas, cuestionarios, pruebas de laboratorio)
debe ser codificado, aunque en algunos casos la codificacin ha sido realizada
previamente. El objetivo es crear variables a partir de la informacin, con la
posibilidad de anlisis en mente. Las siguientes interrogantes subyacen las
decisiones sobre codificacin:
1. Qu informacin existe?
2. Qu informacin es relevante?
3. Cmo ser probablemente analizada?
SEXTA PRCTICA CALIFICADA
TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

Ejemplos de decisiones sobre codificacin y edicin de datos


Un criterio tpico para la seropositividad para VIH es un ELISA repetidamente
positivo (ensayo inmunoenzimtico recombinante) para anticuerpos VIH
confirmado por una prueba
Western Blot con elfin de identificar la presencia de protenas particulares (p.ej.,
p24, gp41, gp120/160.) De esta manera los datos del laboratorio pueden incluir
todos los siguientes:
a. Una evaluacin global del estado VIH (positivo/negativo/indeterminado)
b. Pares de resultados de ELISA expresados como:
i.

+ + / + / / indeterminado

ii.

densidades pticas

b. Resultados de Western Blot (para las personas con resultados de ELISA


positivos) expresados como:
i.

(+ / / indeterminado)

ii.

deteccin de bandas especficas de protenas, p.ej., p24, gp41,


gp120/160

Es necesario llegar a un balance entre la codificacin de lo mnimo y la


codificacin de todo.

La codificacin es ms sencilla cuando se hace toda de una vez.


Uno siempre puede ignorar posteriormente las opciones codificadas que se
consideran sin importancia.
La informacin no codificada no estar a disposicin para su anlisis (p.ej.,
la fecha en que se recibi el cuestionario, qu cuestionarios fueron
seleccionados al azar para una encuesta de verificacin basada en 10% de
los cuestionarios totales).

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

Mayores detalles significan ms re-codificaciones para el anlisis lo cual


significa ms programacin y por lo tanto ms oportunidades para cometer
errores.
Las decisiones postergadas deben ser concretadas en algn momento, as
que porqu no hacerlo de entrada (p.ej., cuando un entrevistado marca
respuestas adyacentes como 3. Una o dos veces y 4. Dos a cinco veces
qu debe codificarse 3?,4?, 3.5? un valor codificado faltante? Un
cdigo a ser reemplazado en el futuro cuando se tome una decisin?
Es importante documentar cmo se realiz la codificacin y cmo se
resolvieron los problemas, de manera de mantener la consistencia y
contestar las inevitables preguntas.

NIVELES O ESCALAS DE MEDICIN


Los constructos o factores en estudio son representados por variables. Las
variables (tambin llamadas factores) tienen valores o niveles. Las variables
resumen y reducen los datos, tratando de representar la informacin esencial.
Tcnicas analticas dependiendo del tipo de variable
Las variables pueden ser clasificadas de diversas maneras. Una variable continua
toma todos los valores dentro de su rango permitido, de manera que entre dos
valores cualesquiera dentro del rango hay otros valores legtimos entre ellos. Una
variable continua (llamada tambin a veces variable de medicin) se usa en

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

respuesta a la pregunta cunto?. Las mediciones como peso, altura, y la


presin arterial pueden, en principio, ser representadas por variables continuas y
frecuentemente son tratadas como tales en los anlisis estadsticos. En la
prctica, por supuesto, los instrumentos utilizados para medir estos y otros
fenmenos y la precisin con que se registran los valores permiten slo un nmero
finito de valores, pero estos pueden ser considerados como puntos en un
continuo. Matemticamente, una variable discreta puede tomar slo ciertos valores
entre sus valores mximo y mnimo, an si no hay un lmite para el nmero de
dichos valores (p.ej., el conjunto de nmeros racionales es pasible de ser contado
aunque es ilimitado en nmero). Las variables discretas que pueden tomar
cualquier valor dentro de un conjunto grande de valores a menudo son tratadas
como si fueran continuas. Si los valores de una variable pueden ser ordenados, el
hecho de que el analista decida tratar la variable como discreta y/o continua
depende de la distribucin de la variable, los requerimientos de los procedimientos
analticos disponibles y la opinin del analista sobre la interpretacin de los
resultados que se pueden obtener.

Tipos de variables discretas


1. Identificacin una variable que simplemente nombra cada observacin (p.ej.,
un nmero de identificacin en el estudio) y que no se usa en el anlisis
estadstico;
2. Nominal una categorizacin o clasificacin, que no tiene un orden inherente;
los valores o la variable son completamente arbitrarios y podran ser
reemplazados por cualquier otro sin afectar los resultados (p.ej., grupos
sanguneos ABO, nmero de registro en la clnica, etnia).
Las variables nominales pueden ser dicotmicas (dos categoras, p.ej. sexo) o
politmicas (ms de dos categoras).

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

3. Ordinal una clasificacin en que los valores pueden ser ordenados o tienen
un orden; dado que los valores codificados slo necesitan reflejar el orden pueden
ser reemplazados por cualquier otro conjunto de valores con el mismo
ordenamiento relativo (p.ej., 1, 2, 5; 6,
22, 69; 3.5, 4.2, 6.9 podran todos ser utilizados en vez de 1, 2 ,3). Como ejemplos
podemos considerar la severidad de las lesiones y la situacin socioeconmica.
4. De conteo el nmero de entidades, eventos, o algn otro fenmeno que
puede ser contado, para el cual la pregunta relevante es cuntos? (p.ej., paridad,
nmero de hermanos); la sustitucin de los valores de la variable por otros
nmeros cambiara su sentido. En el anlisis de datos epidemiolgicos, las
variables de conteo a menudo se tratan como continuas, sobre todo cuando sus
posibles valores son muchos.
Tipos de variables continuas
1. De intervalo las diferencias (intervalos) entre los valores tienen significado,
pero las razones entre los valores no lo tienen. Es decir, que si la variable toma los
valores 11-88, con un promedio de 40, tiene sentido afirmar que el puntaje del
sujeto A de 60 se aleja el doble del promedio que el puntaje de 50 del sujeto B.
Pero no tiene sentido decir que el puntaje del sujeto A es 1.5 veces el promedio.
La razn es que el punto cero de la escala es arbitrario, de manera que los valores
de los puntajes tienen sentido slo en relacin uno con el otro. Sin prdida de
informacin, la escala puede ser desplazada: 11-88 puede ser transformada en 077 restando 11 puntos. Los puntajes de la escala tambin pueden ser
multiplicados por una constante. Despus de cualquiera de estas dos
transformaciones, el puntaje del sujeto A sigue alejndose el doble de la media
que el puntaje del sujeto B, pero el puntaje del sujeto A no es ms 1.5 veces el
puntaje promedio. Las escalas sicolgicas (p.ej., para ansiedad, para depresin) a
menudo utilizan este tipo de escalas. Un ejemplo que proviene de la fsica es la
temperatura medida en escala de Fahrenheit o Celsius.
2. De razn tanto las diferencias como las razones tienen sentido. Tienen un
punto cero no arbitrario, de manera que tiene sentido caracterizar un valor como
x veces el valor del promedio. Cualquier transformacin salvo la multiplicacin
por una constante (p.ej., el cambio de unidades) distorsionar las relaciones de los
valores de una variable medida en una escala de razn. Los parmetros
fisiolgicos como la presin arterial o el colesterol son medidas de razn. La
temperatura absoluta o Kelvin es una medida en escala de razn.
Muchas variables importantes en epidemiologa son dicotmicas (i.e., nominal con
dos niveles) - enfermo vs. sano, expuesto vs. no expuesto. Aunque una variable
puede aparentar ser ordinal o continua, el propio fenmeno puede no merecer ser
tratado como tal. Sera necesario preguntarse:

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

Es que ms es realmente ms? y hay umbrales o discontinuidades


involucradas? De nuevo, la realidad subyacente (o, ms bien, el modelo
conceptual que tengamos de ella) determina el enfoque de la cuantificacin. Los
valores de las variables a menudo son agrupados en un pequeo nmero de
categoras para algunos anlisis y utilizados en su forma original para otros.
TRABAJO PREPARATORIO EXPLORANDO LOS DATOS
Trata de sentir los datos analizar la distribucin de cada variable. Examina
grficos de correlacin bivariados y cruces de variables. Tienen sentido los
patrones que aparecen? Son crebles?
Observa la forma simetra vs. asimetra, interrupciones en la forma
Elige medidas de resumen apropiadas para la distribucin y tipo de variable
(nominal, ordinal, medida)

De posicin media, mediana, porcentaje por encima del punto de corte


Dispersin desvo estndar, cuartiles
Busca relaciones entre los datos
Mira dentro de los subgrupos importantes
Observa la proporcin de valores faltantes

CUERPO DEL INFORME


Titulo:

Medida de los tiempos de conexin a las pginas de las diversas


universidades asignadas: UNALM, Stanford, Navarra, Irvinne, UNDAC, UNE;
realizando una distribucin estadstica que nos ayude a obtener informacin en
este caso cuantitativa.

Mtodos:

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

En la medida de los tiempos en conectarse a los sitios webs de las universidades


se us el programa PingDom Tools complementa la barra de herramientas del
explorador.
Tenemos lo siguiente:

Origen:

Los datos fueron tomados del tiempo que tarda en conectarse a los sitios webs de
las universidades para la medida se us el programa PingDom Tools complementa
la barra de herramientas del explorador.

Herramientas:

Para obtener los clculos se uso la siguiente teora de estadstica descriptiva;


Poblaciones, muestras e inferencia
Como se ha sealado anteriormente, el objetivo de la estadstica descriptiva, es la
descripcin de los datos y no la inferencia partiendo de los datos.
Una poblacin de unidades es un grupo de entidades que tienen alguna
caracterstica cuantificable en comn.
Las unidades pueden ser personas, rboles, bacterias, compuestos qumicos, etc..
Pueden ser finitas o infinitas en nmero. La caracterstica cuantificable puede ser
una variable continua o discreta.
Una poblacin de observaciones es un grupo que consiste en los valores
numricos de una caracterstica cuantificable determinada en cada elemento de
una poblacin de unidades.
La misma poblacin de unidades tendr en ocasiones ms de una poblacin de
observaciones asociada.
Una muestra de unidades es un nmero finito de unidades procedentes de una
poblacin de unidades.
Una muestra de observaciones es un nmero finito de observaciones procedentes
de una poblacin de observaciones.
Es decir una muestra es una parte de una poblacin que aislamos para estudiarla.
Este concepto es de importancia para el anlisis estadstico porque por lo general
uno dispone de una muestra de una poblacin para el estudio que intenta realizar.
Por ejemplo, si necesitramos hacer un promedio de todas las alturas de los
habitantes de un pas de 200.000.000 de habitantes (esta sera la poblacin
SEXTA PRCTICA CALIFICADA
TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

estadstica), es lgico suponer lo engorroso que sera medir la altura de todos.


Esto se realiza midiendo las alturas de una muestra de esta poblacin, por
ejemplo 10.000 habitantes. Este procedimiento es inductivo ya que el investigador
saca conclusiones acerca de la poblacin basndose en el anlisis de una
muestra de esa poblacin; esto es hacer una inferencia acerca de una poblacin
partiendo de una muestra.
Se llama inferencia estadstica una conclusin que se refiere a una poblacin de
observaciones, obtenida sobre la base de una muestra de observaciones.
Caracterstica descriptiva global de una poblacin de observaciones se llama
parmetro.
Caracterstica descriptiva global de una muestra de observaciones se llama
estadgrafo.
Muestra aleatoria
Una muestra aleatoria es una muestra sacada de una poblacin de unidades, de
manera que todo elemento de la poblacin tenga la misma probabilidad de
seleccin y que las unidades diferentes se seleccionen independientemente.
Variables aleatorias y distribuciones
Se llama variable aleatoria aquella que toma diversos valores o conjuntos de
valores con distintas probabilidades. Existen 2 caractersticas importantes de una
variable aleatoria, sus valores y las probabilidades asociadas a esos valores.
Una tabla, grfico o expresin matemtica que d las probabilidades con que una
variable aleatoria toma diferente valores, se llama distribucin de la variable
aleatoria.
Como vimos anteriormente, la inferencia estadstica se relaciona con las
conclusiones que se pueden sacar acerca de una poblacin de observaciones
basndose en una muestra de observaciones. Entonces intervienen las
probabilidades en el proceso de la seleccin de la muestra; en este caso se desea
saber algo sobre una distribucin con base en una muestra aleatoria de esa
distribucin.
La representacin de los datos: FRECUENCIAS
Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y
categoras y determinar las frecuencias de las clases, o sea, el nmero de
elementos que pertenecen a una clase. El ordenamiento tabular de los datos
por clases conjuntamente con las frecuencias de clases se
denomina distribucin de frecuencias.

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

El caso que se describe a continuacin, variables discretas se


denomina distribucin por conteo de valores individuales. Supongamos que
un determinado colectivo, representado por la variable estadstica Xi, que
para mayor sencillez consideraremos como unidimensional; sean los datos
de esta variable (representativo cada uno de ellos de un suceso) X1, X2, ,
Xn (supuesto que sean n los valores de la variable considerada.)
Frecuencia de un dato
El nmero de veces que este aparece en el colectivo consecuentemente, si una
variable estadstica toma r valores, cada uno de los cuales puede repetirse un
cierto nmero de veces, podramos decir que el nmero de datos representado por
la variable seran N, siendo N la suma de las respectivas frecuencias de cada dato

Frecuencia absoluta o simplemente frecuencia (fi)


Nos habla del nmero de veces que un dato aparece en un colectivo
Frecuencia relativa
Se definir como: el coeficiente entre la frecuencia absoluta del dato considerado y
la frecuencia total.

Para variables discretas

Donde: N=fi y fi/N=1

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

Valores de la variable Xi

frecuencias absolutas

frecuencias relativas

(datos)

fi

fi/N

X1

f1

f1/N

X2

f2

f2/N

Xn

fn

fn/N

Intervalos

Marcas de Clases

Frecuencias Absolutas

(C)

Xi

fi

X1-X2

X1

f1

X2-X3

X2

f2

Xn-1-Xn

Xn

fn

Para variables continuas

Donde:

Marca de clase:
Numero de observaciones:
Amplitud del intervalo:

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

REGLAS GENERALES PARA CONSTRUIR LAS DISTRIBUCIONES DE


FRECUENCIAS POR INTERVALOS
Sean las distribuciones de datos del conjunto;
A = (X1, X2,, Xn)
1.

Efectuar el arreglo ordenado (Ascendente o Descendente) de la poblacin o


muestra
2. Obtener la frecuencia absoluta mediante la tabulacin o conteo de los datos
(homogenizar los datos)
3. Encontrar el rango o recorrido (R) de los datos:
R = (valor mayor valor menor) = Xn X1
4.

Encontrar el nmero de clases o intervalos de clases (K). El nmero de


clases debe ser tal que se evite el detalle innecesario, pero que no conduzca
a la prdida de ms informacin de la que puede ser convenientemente
ignorada. Para este clculo se utiliza la formula de Sturges
K = 1 + 3.322(log. N)

REPRESENTACIONES GRFICAS DE LA DISTRIBUCIN DE


FRECUENCIAS

Los Cuadros estadsticos:

La estadstica es una disciplina que nos ensea a organizar los datos


recogidos para poder analizar sus caractersticas y posteriormente inferir, a
partir de las muestras tomadas, las caractersticas de la poblacin investigada.
Los cuadros o tablas corresponden a arreglos sistemticos de los datos por
filas y columnas y son un buen complemento del texto en los informes
El primer procedimiento estadstico consiste en tabular los datos segn el tipo
de escala de medicin utilizada. La tabulacin de los datos conlleva a
representar la informacin a travs de tablas que de forma general contiene las
siguientes partes fundamentales:
a) Numeracin (siempre que se presenten dos o ms cuadros)

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

b) Ttulo: es la descripcin que precede al cuadro, la cual deber estar


redactada en forma breve y clara, de tal manera que exprese su
contenido, siguiendo el ordenamiento del mismo. Es necesario
abarcar las caractersticas: Qu, Dnde, Cmo y Cundo
c) Encabezamiento: se refiere al nmero de atributos o variables que
se quieren representar en el cuadro y se anotan como
denominaciones de las columnas y subcolumnas; puede ser
unidimensional, bidimensional o multidimensional. Los ttulos de las
columnas van en maysculas y los subttulos en minsculas.
d) Cuerpo: es el conjunto de columnas y lneas que contiene el cuadro
en orden vertical y horizontal, donde se colocan los datos sobre los
hechos observados.
e) Pie: se refiere a la informacin adicional necesaria a saber: notas,
llamadas, fuentes de informacin y otras. Se anotan en el espacio
debajo de la lnea inferior que limita el cuerpo del cuadro.

Los Grficos Estadsticos:

El grfico es quizs el auxiliar ms valioso y utilizado para expresar datos


estadsticos, este elemento no le aade novedad a las tablas o cuadros
estadsticos, es de fcil comprensin y accesible a un nmero mayor de
usuarios. El grfico adems de expresar visualmente los hechos ms
importantes de la informacin numrica, permite una mejor y ms fcil
comprensin y ahorra tiempo y esfuerzo en el anlisis de datos estadsticos
al facilitar su apreciacin visual en forma conjunta:
a) Histogramas de frecuencias:

Un histograma es un grfico que sirve para representar una distribucin de


frecuencias. Este grfico est formado por un conjunto de rectngulos (caso
de variables continuas) que tienen como base un eje horizontal
(generalmente el eje de las abscisas o de las X), y como centro los
puntos medios de las clases. Los anchos de las clases y las reas de los
rectngulos son proporcionales a las frecuencias de las clases. En el caso
de las variables discretas el grfico consiste de un conjunto de barras
verticales en lugar de rectngulos, hallndose cada barra sobre
la observacin respectiva y con una altura proporcional a la frecuencia de la
observacin

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

b) Polgono de frecuencias:

El polgono de frecuencias es un grfico formado por lneas quebradas, que


tiene los centros de las clases representadas en un eje horizontal (eje de
las X) y las frecuencias de las clases en un eje vertical (eje de las Y). La
frecuencia correspondiente a cada centro de clase se seala mediante un
punto y luego los puntos consecutivos se unen por lneas rectas. Del
correspondiente histograma se puede lograr el polgono de frecuencia
uniendo los puntos medios de las bases superiores de cada rectngulos
mediante lneas rectas.

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

c) Ojivas:

Las ojivas se refieren a los grficos que se construyen utilizando una


distribucin acumulativa de frecuencias, el orden de acumulacin se aplica
al cuadro de distribucin de frecuencia y puede ser descendente (fa, fra)
o ascendente (fa, fra). La figura que se forma al unir los puntos del
polgono de frecuencias acumulativas es lo contrario del orden anunciado
(por ejemplo si se utiliz el orden descendente en la acumulacin de los
datos en el cuadro, la ojiva resulta ser ascendente).

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

FICHA TECNICA ESTADISTICA


Nombre de la variable: Tiempo de conexin al sitio web de la universidad
solicitada

Descripcin de la variable: Nos referimos a un tipo de variable de tipo


cualitativa continua, ya que nos referimos al tiempo de conexin.

Unidad de medida: El tiempo medido es en segundos


Periodicidad

Medicin del registro: El tiempo que se demoro en recolectar todas las


mediciones fue de alrededor de una hora aproximadamente.
Cobertura de Internet: Hablamos de un servicio inalmbrico de banda
ancha en una notebook y en el momento que se tomo los datos se
encontraba a una velocidad de speedy de 24Mbps.

Nombre de la fuente de informacin: Las universidades UNALM,


Standford, Navarra, Irvine, UNDAC, UNE.

Tipo de fuente de informacin: Muestra aleatoria de medicin de tiempo de


conexin al sitio web de las universidades

Registro Administrativo

Observaciones: Se pudo haber hecho las mediciones en otro tipo de


horario, en nuestro caso se realizo en la noche alrededor de las 8 de la
noche donde la velocidad del internet es de mejor recepcin.
Disponibilidad de la estadstica: Los sitios webs de las respectivas
universidades son
1. UNALM
www.lamolina.edu.pe/
2. STANDFORD
www.stanford.edu/
3. NAVARRA
www.unav.es/
4. IRVINE
www.uci.edu/
5. UNDAC
www.undac.edu.pe/
6. UNE
www.une.edu.pe/

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

RESULTADOS
Veamos los datos obtenidos:
UNALM

STANDFORD NAVARRA

IRVINE

UNDAC

UNE

2.37

4.33

1.57

3.57

1.81

6.34

2.36

4.5

0.9

2.9

0.9

5.7

2.35

5.1

1.2

3.15

1.15

5.85

2.3

5.4

1.3

3.45

1.2

5.94

2.5

4.22

1.15

3.03

1.35

6.01

2.1

4.34

3.81

1.45

6.16

2.3

5.23

1.6

3.56

1.6

6.34

2.2

4.1

1.5

4.15

1.81

6.38

2.25

3.9

1.78

3.5

1.9

6.26

2.23

4.8

1.9

3.68

1.83

6.45

2.4

4.8

2.2

4.2

1.79

6.62

2,5

3.8

1.2

2.2

6.79

2.6

4.25

1.6

3.95

2.01

6.4

2.45

1.72

3.83

6.72

2.5

4.7

0.95

3.32

1.9

6.28

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

2.4

3.9

1.32

3.57

1.5

6.5

Haciendo los clculos de las medidas de tendencia central:


MEDIA ARITMETICA

MODA

Donde:
L=Limite inferior de la clase modal.
d1=Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d2= Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior.
C= Intervalo de clase.
MEDIANA

Donde:
n=Nmero total de observaciones.
L=Limite inferior de la clase que contiene la mediana.
f =Frecuencia de la clase que contiene la mediana.
F=Frecuencia acumulada "menos de" de la clase anterior.
C = Intervalo de clase.

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

Los datos obtenidos fueron los siguientes

UNALM
Stanford
Navarra
Irvine
UNDAC
UNE

2.363125
4.523125
1.430625
3.604375
1.65
6.29625

ANALISIS Y COMPARACION DE DATOS

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

Mo

Me

2.5
3.9
1.2
3.57
1.81
6.34

2.365
4.42
1.41
3.57
1.8
6.34

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

COMPARACION DE MODAS

COMPARACION DE VARIANZAS

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

COMPARACION DE CURVAS DE DISTRIBUCION NORMAL

1.43

1.65 2.36

3.60

Tenemos:

UNALM
0 STANDFORD
NAVARRA
IRVINE
UNDAC

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

ROJO
VERDE
AZUL
AMARILLO
MAGENTA

4.52

6.29

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

UNE

CYAN

ANALISIS DE LAS GRAFICAS:


DE LA MEDIA:
Representa el valor promedio que es la suma de los datos recogidos sobre el total
de los datos : y en nuestra grafica observamos que la mayor media es la UNE y la
de menor media es la universidad de Navarra, esto quiere decir que en valor
promedio nos demoramos mayor tiempo en ingresar a la pgina principal de la
UNE respecto a las dems universidades
DE LA MODA:
Representa el dato de mayor frecuencia de los datos recogidos para el anlisis
En nuestra grafica observamos que la de mayor moda es la UNE de misma
manera la de menor moda es la universidad de Navarra
DE LA MEDIANA:
Es el valor que separa en dos partes iguales los datos recogidos previamente
ordenados en forma creciente o decreciente tambin viene a ser el percentil 50
En la grfica tenemos que la UNE es de mayor mediana y la universidad de
Navarra es la de menor mediana
OBSERVACION: vemos que en la comparacin de la media mediana son iguales
porque las desviaciones estndar son casi insignificantes con respecto a la media
DE LA CURVA NORMAL:
Como bien sabemos al tratar de graficar nuestras distribuciones muestrales a una
curva, la aproximamos a un tipo de curva conocida, esta sera la curva normal, es
importante tambin recalcar la estandarizacin de datos.
Entonces nosotros aproximamos a un tipo de curva conocida que es la normal y al
hacer el anlisis de las curvas vemos que la tenga mayor altura es la que presente
menor desviacin estndar, entonces al analizar nuestra grafica vemos que la
curva de mayor varianza es de la universidad de Standford y la de menor varianza
es de la UNALM; entonces concluimos que al haber hecho las mediciones tuvimos
mayores variaciones en la universidad de standford, puede ser porque entramos a
un tipo de pgina que pertenece a un pas lejano, tambin porque presenta
mayores complementos en su web.

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

OBSERVACIONES Y CONCLUSIONES:
Notamos que la diferencia de tiempo al ingresar a un sitio web se debe a su
cantidad de informacin (archivos, videos, animaciones, etc.), a nuestro
historial visitado, la hora que se visita, la cantidad de usuarios que visita
esta pgina, etc., lo que hace que posea ms lentitud en su proceso de
carga.
Gracias a este trabajo mediante a la estadstica comparativa pudimos
comparar los anlisis mustrales mediante grficas obteniendo as una idea
de cmo se funcionan estas y sus caractersticas, adems de que al
realizar una distribucin de frecuencias, hacemos una tabla que resume de
una manera ms entendible, ordenada numricamente los datos de una
manera conveniente.
Mayormente al hacer una distribucin de datos de una muestra se trata se
ajustar o aproximar a una distribucin conocida como la normal y la tstudent para facilitar el anlisis y adems al hacer este tipo de
aproximaciones tambin disminuimos nuestro porcentaje de error, ya que
compensa todas la observaciones iniciales al hacer las mediciones, debido
a que toda la informacin se condensa en nuestra grafica.
Se observa que los valores atpicos aumentan el grado de desconfianza en
nuestro anlisis.
Al tomar los datos se observo que a medida que temamos mas datos estos
se dispersaban y el coeficiente d variacin aumentaba, esto ocurre pues al
abrir tantas veces el mismo sitio web los accesos ya se hacen rpidos, pues
es una direccin conocida para el buscador, adems que ya est guardada
en el historial de exploracin.
La principal ventaja de usar una de estas tablas de resumen es que las
principales caractersticas de los datos se hacen evidentes inmediatamente
para el lector.
La principal desventaja de tal tabla de resumen es que no podemos saber
cmo se distribuyen los valores individuales dentro de un intervalo de clase
particular sin tener acceso a los datos originales. El punto medio de la
clase, sin embargo, es el valor usado para representar todos los datos
resumidos en un intervalo particular. El punto medio de una clase (o marca
SEXTA PRCTICA CALIFICADA
TRABAJO DE APLICACIN

UNIVERSIDAD NACIONAL DE INGENIERIA


FACULTAD DE INGENIERIA CIVIL
ESTADISTICA Y PROBABILIDADES

de clase) es el punto a la mitad de los lmites de cada clase y es


representativo de los datos de esa clase.

BIBLIOGRAFIA

Manual de Crdova y Zamora, Estadstica y Probabilidades

http://es.geocities.com/riotorto/nopa/nopa.htm

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad

http://es.wikipedia.org/wiki/Valor_esperado

http://es.wikipedia.org/wiki/Variable_aleatoria

SEXTA PRCTICA CALIFICADA


TRABAJO DE APLICACIN

Вам также может понравиться