Вы находитесь на странице: 1из 7

Tarea 1 Curso Biometría

Semestre I-2018

Antecedentes

Esta tarea evalúa los contenidos vistos en las clases 1 y 2, y en el práctico 1. Específicamente se
trata de técnicas de análisis de datos, que se enmarcan en la rama de la estadística denominada
estadística descriptiva. El análisis de un conjunto de datos comienza siempre con un resumen
gráfico y numérico. Mientras más complicado es el conjunto de datos, más importante es manejar
formas efectivas de visualizarlos e identificar patrones clave. Tal como vimos en las clases y
práctico, los datos crudos pueden registrarse en tablas y luego trabajados en un computador
utilizando una hoja de cálculo (ej. Microsoft Excel) u otro medio. Entonces, este módulo tiene
como objetivo que los estudiantes desarrollen y/o refuercen su capacidad de:

1. Sintetizar (resumir grandes cantidades de datos),


2. Analizar (evidenciar patrones y pautas de variación que son difíciles de capturar en una
tabla numérica), y
3. Comunicar sus análisis.
Instrucciones

Forme pareja con un compañero/a de curso y remita un informe escrito que contenga las siguientes
actividades:

1. Seleccione una variable cualitativa (ej. Color de ojos, tipo de pelo, sexo, etc.) y dos
variables cuantitativas de su interés (ej. Estatura y peso, edad y estatura, etc.). Justifique
porqué eligió cada variable e indique en qué escala se mide cada tipo de datos (ej. nominal,
ordinal, de intervalo o de razón). Se espera que usted trabaje con variables de interés en el
área de la bioingeniería y/o biotecnología. 1,5 puntos
2. Identifique la población de interés (ej. Estudiantes curso de biometría año 2018) y realice
un muestreo (selección de individuos) registrando sus observaciones (ej. Color de pelo,
estatura y peso). Considere un tamaño de muestra de al menos 30 individuos/objetos e
indique cómo realizó el muestreo. 1 punto.
3. Tabule y presente las observaciones recolectadas usando tablas de data cruda (ej. Cada
individuo muestreado, su color de ojos, estatura y peso). Luego para cada variable presente
tablas de frecuencia (absoluta, relativa y acumulada). 1,5 puntos.
4. Para cada variable elija una representación visual (gráfico) adecuada para el tipo de datos.
Describa qué información puede extraer desde cada gráfico. 1,5 puntos.
5. Para las dos variables cuantitativas, entregue una tabla resumen conteniendo el promedio,
la varianza, la desviación estándar y el coeficiente de variación considerando: a) el total de
datos (ej. Estatura de todos los individuos) y b) comparando dos categorías (ej. Estatura de
estudiantes con ojos de color café versus la de estudiantes con ojos de color negro).
Comente sus resultados (ej. ¿Qué grupo tiene mayor estatura promedio? ¿En qué grupo la
estatura es más variable?). Además, grafique la variable cuantitativa 1 versus la variable
cuantitativa 2 usando un gráfico de dispersión. ¿Qué indica el gráfico? 1,5 puntos.
6. Confeccione su informe en un procesador de texto (ej. Microsoft word), incluyendo las
tablas y figuras solicitadas. Identifique a los autores del informe en la primera página.
7. Fecha de entrega miércoles 11 de abril de 2018, hasta las 13:00.
8. Enviar los informes (word o pdf) y consultas a seneira@udec.cl.
Aspectos importantes de considerar para su informe

1. Preparación de los datos


El primer paso en el análisis de datos es recolectarlos de forma correcta. Recuerde que los datos
siempre deben ser:

• Objetivos y cuantificables: Deben basarse en hechos y no en opiniones.


• Exactos: debemos asegurarnos que la variabilidad en el proceso de recolección de datos (error de
medida) no desvirtúe la variabilidad del proceso en estudio.
• Completos: se debe registrar toda la información relevante asociada a cada toma de datos (instrumento,
hora del día, muestreador, etc.) considerando futuros análisis que puedan ser necesarios.
• Representativos: deben reflejar todos los hechos y circunstancias que se producen en la realidad.

Antes de recolectar los datos debemos identificar la unidad o unidad muestral (ej. Un individuo,
un objeto, etc.). La población o universo de unidades es el total de unidades. En estadística nos
concentramos en la recolección de valores de la característica (o conteos de un rasgo cualitativo)
evaluada en cada unidad de la población. Este conjunto se denomina población estadística o
simplemente población. Rara vez se puede conocer la población, por lo que tomamos una muestra
desde ella. La muestra (o el conjunto de datos muestreados) es un subconjunto de valores que son
recolectados en el marco de una investigación y está constituida por las mediciones registradas en
las unidades que son efectivamente observadas. Entonces, la población es el objetivo de nuestra
investigación y aprendemos de ella tomando una muestra.

2. Sobre la confección de tablas y figuras (gráficos)


2.1. Tablas
En general, debemos asegurarnos que la tabla sea auto-explicativa. Incluya un título, una breve
descripción de la fuente de la data, establezca en qué unidades se expresa la data, y etiquete las
columnas y filas cuando sea necesario o apropiado.
En el caso de tablas con datos crudos, planee la tabla (hoja) de modo que la recopilación sea fácil
y no ambigua, y las cantidades derivadas sean resueltas convenientemente en la misma planilla (ej.
suficiente espacio para calcular totales). Mantenga la tabla tan simple como sea posible (simple is
beauty!) y al anotar números use una cantidad suficiente de cifras de modo de no desperdiciar
información. Sin embargo, no anote dígitos sin importancia. Si tiene dudas, la regla de pulgar es
anotar hasta la tercera cifra significativa. Distinga claramente cuando un valor es cero respecto de
un valor no presente.
En el caso de las tablas de cálculo, realice los cálculos en la misma planilla si es posible. Muchas
veces transferir data desde una planilla a otra introduce error. Si debe transferir los datos a otra
planilla, asegúrese de revisar los números transferidos. Por ejemplo, cerciórese que el total de las
columnas de los números transferidos es igual al total de los números originales en la planilla de
campo. Además, revise número por número. Finalmente otorgue un patrón lógico a sus cálculos
en la planilla y seleccione unidades de medida que el lector entienda y que mantengan la tabla
simple (e.g., millones de pesos y no pesos).

2.2. Gráficos
Confeccione gráficos auto-explicativos, entregando una leyenda con una breve descripción de la
fuente de los datos. Siempre etiquete los ejes y establezca las unidades de medida. Marque las
escalas y entregue una clave si es necesario. Escoja las escalas de cada uno de los ejes de modo
que sean convenientes y aseguren el uso de la mayor parte de la superficie del gráfico. Esté atento
a lo engañoso que puede resultar el gráfico si no se incluye el origen. No usar los productos por
defecto (EXCEL, R u otro), se puede (y debe) mejorar sustancialmente la presentación cambiando
los estilos de líneas, el tamaño de los puntos, etc. Por ejemplo, mantenga grillas y etiquetas sólo si
mejoran el contenido de la información (normalmente no es el caso). Evite gráficos
“amontonados”, en su lugar use más de un gráfico si el mensaje que se quiere transmitir es
complicado.

3. Determinar los valores extremos de los datos y su rango


3.1. Obtener el valor máximo y el valor mínimo en su data
Los valores extremos del conjunto de datos cuantitativos corresponden al valor máximo (Vmax) y
al valor mínimo (Vmin). Usted puede ordenar sus datos usando la función “ordenar” del menú datos
de Excel. Entonces podrá identificar Vmax y Vmin. Alternativamente, puede encontrar Vmax y Vmin
usando las funciones ‘=min()’ y/o ‘=max()’ de Excel. Para ello posiciónese en una celda
cualquiera, escriba el signo ‘=’ y luego la función “min” seleccionando el conjunto de datos de
interés. Repita la operación para encontrar Vmax.

3.2. Obtener el rango (o recorrido) de valores en su data.


El rango se obtiene como la diferencia entre el valor máximo y el mínimo, esto es:
R = Vmax – Vmin.

4. Graficar la distribución de frecuencia de sus datos usando un histograma


Un histograma de frecuencias es un gráfico de barras que presenta la distribución de frecuencia de
un conjunto de datos de una variable continua. Tiene las siguientes características:
1. La escala horizontal es cuantitativa y mide los valores de los datos.
2. La escala vertical mide las frecuencias de las clases.
3. Los límites consecutivos deben tocarse (variable continua)

4.1. Definir las clases que contendrá el histograma


Entendemos por clases los intervalos en que se divide la característica (variable) sobre la que se
ha tomado los datos. El número de clases es igual al número de barras que tendrá el histograma.
En general, el número de clases que debe tener un histograma varía dependiendo del número de
datos. Algunos textos recomiendan lo siguiente: 6 clases para conjuntos de 20 a 50 datos; 7 clases
para conjuntos de 51 a 100 datos; 8 clases para conjuntos de 101 a 200 datos; 9 clases para
conjuntos de 201 a 500 datos; 10 clases para conjuntos de 501 a 1000 datos; y de 11 a 20 clases
para conjuntos de >1000 datos. Otros textos recomiendan un total de 10 clases. Debe tener en
cuenta que, dependiendo del número de clases, perderemos más o menos información desde la
muestra.

4.2. Obtener la amplitud del intervalo de cada clase


Al obtener la amplitud del intervalo de cada clase se debe tener las siguientes consideraciones:
• Todas las clases tendrán el mismo intervalo
• No habrá superposición entre las distintas clases
• La amplitud aproximada del intervalo se obtiene dividiendo el rango por el número de clases.
• La amplitud se redondea posteriormente a un número o cifra decimal conveniente para el
manejo de las clases y la graduación del eje horizontal del histograma.

4.3. Construir las clases anotando los límites de cada una de ellas
Conociendo el valor mínimo en nuestra muestra empezamos el primer intervalo en ese valor que
es el límite inferior de esa clase. El límite superior se obtiene de sumar al límite inferior la amplitud
del intervalo. Construya una tabla como la siguiente:

Clase Límite superior de la Límite inferior de la Marca de clase Frecuencia


clase clase

4.4. Determinar el número de datos que están incluidos en cada una de las clases (frecuencia
de clase)
Cuente el número de observaciones que caen en cada una de las clases de frecuencia. En Excel
este conteo puede realizarse automáticamente utilizando análisis de datos -> Histograma.

4.5. Dibujar y rotular el gráfico para la distribución de frecuencia


Los datos de una variable numérica resumidos en tablas, tienen una expresión gráfica que ayuda a
su interpretación visual. Esta representación se denomina gráfico de barras (si se trata de una
variable discreta) o histograma (si se trata de una variable continua). Considere las siguientes
reglas básicas:

1. Cada observación representada en un gráfico de barras o histograma ocupa un rectángulo de


igual área, cuya base está dada por el ancho del intervalo correspondiente.
2. Para cada intervalo, el rectángulo que representa su frecuencia puede considerarse como una
'acumulación' de los rectángulos correspondientes a las observaciones.
5. Calcular medidas de tendencia central y de dispersión
Como vimos en clases, un conjunto de datos contiene mucha más información que la que podemos
apreciar a partir de la lectura de una tabla numérica. Ya vimos que podemos resumir la información
en forma gráfica (histograma), pero deseamos contar con una o varias medidas que caractericen
toda la información contenida en el conjunto de datos. Estas medidas nos permitirán comparar
nuestra muestra con la información de muestras provenientes de otras poblaciones u otras muestras
de nuestra misma población recolectados en otro(s) momento(s) y/o lugar(es).

Usando las definiciones y/o ecuaciones presentadas en clase, calcule la media aritmética, la
mediana y la moda. Calcule también la varianza, la desviación estándar y el coeficiente de
variación. Compare sus resultados al calcular estas medidas usando las funciones de Excel. Ej.
‘=media()’; ‘=moda()’; ‘mediana()’; ‘=var()’; ‘=desvest()’. Recuerde que en cada función debe
indicar entre paréntesis el conjunto de datos que estamos analizando.

Вам также может понравиться