Вы находитесь на странице: 1из 28

UNIDAD 1: FASE 2

POR: YUDAISE MELADIS GONZALEZ

TUTORA: LUISA FERNANDA CASAS

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIAS


ARAUCA 2019
1. Consulte y relacione en sus propias palabras las siguientes
definiciones básicas en la unidad 1 del curso:

 Vector de datos: Un vector de datos es


un vector formado por una o más variables aleatorias
escalares. La estadística se ocupa de los vectores que
tienen aplicaciones en muchas ciencias y técnicas.

 Matriz de datos: Una matriz es un conjunto ordenado en


una estructura de filas y columnas. Los elementos de este
conjunto pueden ser objetos matemáticos de muy variados
tipos, aunque de forma particular, trabajaremos
exclusivamente con matrices formadas por números reales.
Normalmente las matrices son designadas por letras
mayúsculas.

 Variable cuantitativa continua: Una variable continua es


aquella que puede adoptar cualquier valor en el marco de un
intervalo que ya está predeterminado. Entre dos de los
valores, siempre puede existir otro valor intermedio,
susceptible de ser tomado como valor por la variable
continua.

 Variable cuantitativa discreta: solo puede adquirir un


valor de un conjunto de números. Existen separaciones
entre los valores sucesivos que pueden observarse: es decir,
que no se “llenan” con otros valores intermedios.

 Variable cualitativa nominal: En esta variable los valores


no pueden ser sometidos a un criterio de orden, como por
ejemplo los colores o el lugar de nacimiento.
 Variable cualitativa categórica: una variable
categórica es una variable que puede tomar uno de un
número limitado, y por lo general fijo, de posibles valores,
asignando a cada unidad individual u otro tipo observación a
un grupo en particular o categoría nominal sobre la base de
alguna característica cualitativa. Por ejemplo, los predictores
categóricos incluyen sexo, tipo de material y método de
pago.

 Tabla de frecuencias, como es la tabla de frecuencias


de una variable continua y de una discreta, ¿cuál tiene
intervalos?

Tablas de distribución de frecuencias: Las Tablas de Distribución de


Frecuencias permiten la organización y presentación de un conjunto de
datos de acuerdo con la variable estudiada. En estas tablas, el
ordenamiento de los datos se realiza en función a algunos parámetros
básicos que forman parte del contenido.

Tabla de distribución de frecuencias para datos discretos: Se


utilizan cuando la variable es cuantitativa discreta. Se caracteriza
porque no hay que formar intervalos (no es necesario agrupar los
datos). Una tabla de distribución de frecuencias puede tener la siguiente
estructura:

Fuente: Cibertec análisis probabilístico


Tablas de frecuencias con datos agrupados

Cuando los valores de la variable son muchos, conviene agrupar los


datos en intervalos o clases para así realizar un mejor análisis e
interpretación de ellos.

• Para construir una tabla de frecuencias con datos


agrupados, conociendo los intervalos, se debe determinar la frecuencia
absoluta (fi) correspondiente a cada intervalo, contando la cantidad de
datos cuyo valor está entre los extremos del intervalo. Luego se calculan
las frecuencias relativas y acumuladas, si es pertinente.

 Tabla de frecuencias de variable cualitativa, explique el


cuadro de la primera web.

 Histograma, en que variables se usa: Se utiliza cuando


se estudia una variable continua, como franjas de edades o
altura de la muestra, y, por comodidad, sus valores se
agrupan en clases, es decir, valores continuos

 Gráficos de barras, en que variables se usa: El


diagrama de barras (o gráfico de barras) es un gráfico que
se utiliza para representar datos de variables cualitativas o
discretas. Está formado por barras rectangulares cuya altura
es proporcional a la frecuencia de cada uno de los valores de
la variable.

 Media poblacional: La media poblacional, valor esperado o


esperanza matemática de una variable aleatoria.

 Media muestral: Es la media de los valores de una muestra


(media muestral) sirve para estimar la media de la población
de la que se ha extraído la misma; la varianza muestral
podría usarse para estimar la varianza poblacional, etc. Esto
se denomina como realizar una estimación puntual.

Formula

 Varianza poblacional: Varianza poblacional: σ


2
el cuadrado
de la desviación estándar poblacional σ

Varianza de la población

σ 2
=
∑ (x 1−μ)2
n

Donde:

σ 2 =varianza de la poblacion
x i=termino del conjunto de datos

∑ ¿ sumatoria

μ=media de la poblacion
n=tamaño de la poblacion

 Varianza maestral
La varianza establecerá la variabilidad de la variable aleatoria. En
el caso de una varianza muestral estaremos ante el cálculo de la
varianza de una comunidad o grupo de población en base a una
muestra.

Formula

Mediana: (media aritmética o simplemente media). es el promedio


aritmético de las observaciones, es decir, el cociente entre la suma de
todos los datos y el número de ellos. Si xi es el valor de la variable y
ni su frecuencia, tenemos que:

 Moda: es el valor de la variable que más veces se repite, es decir,


aquella cuya frecuencia absoluta es mayor. No tiene por qué ser única.

Cuartiles y percentiles:

Los cuartiles son los tres valores de la variable que dividen a un


conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y
al 75% de los datos.

Q2 coincide con la mediana.

Cálculo de los cuartiles


1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la


expresión Cálculo de los cuartiles Cálculo de los cuartiles

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa


cada cuartil mediante la expresión

Cálculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se

encuentra , en la tabla de las


frecuencias acumuladas .
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez
partes iguales. Los deciles dan los valores correspondientes al 10%, al
20%... y al 90% de los datos. D5 coincide con la mediana.

Cálculo de los deciles

En primer lugar buscamos la clase donde se

encuentra , en la tabla de las


frecuencias acumuladas.

2. El estudiante debe consultar la presentación de instalación del programa


R e instalarlo en su PC.
3. Cada estudiante debe consultar la presentación DESCRIPTIVAEN R y
seguirla para en el programa R correr el código suministrado. En el
archivo código descriptiva.

variable continua
Años

16 18 20 22 24

Boxplot Edad
Histogram of edad
3.0
2.5
2.0
Frequency

1.5
1.0
0.5
0.0

14 16 18 20 22 24 26

edad

variable discreta
0 1 2 3 4 5
Frecuencias absolutas

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0
1
2
3
4
Diagrama de barras Hermanos

5
Grafico de tarta de Hermanos

3 5

variable cualitativa
Diagrama de barras
estudio
0.30
0.25
0.20
Frecuencias relativas

0.15
0.10
0.05
0.00

Sin estudios Estudios Primarios Estudios Superiores

4. Cada estudiante debe trabajar una variable cuantitativa continua de su


carrera, una variable discreta de su carrera y una variable cualitativa de
su carrera, tomando desde el programa R el archivo código descriptiva y
reemplazando los datos de sus variables generando los vectores de cada
una de sus variables y ejecutando el procesamiento.
variables continuas.
Histogram of Alturaplanta
4
3
Frequency

2
1
0

1.10 1.15 1.20 1.25 1.30

Alturaplanta
Boxplot Alturaplanta
1.30
1.25
Años

1.20
1.15
1.10

variable discreta.
1 2 3 4 5 6
Diagrama de barras Numerodehojasplantas
4
3
Frecuencias absolutas

2
1
0

1 2 3 4 5 6
Grafico de tarta de Numerodehojasplantas

2 1

3
5
4

variable cualitativa.
Diagrama de barras UTIIDADPLANTA
3.0
2.5
2.0
Frecuencias absolutas

1.5
1.0
0.5
0.0

SOMBRA MADERABLE ORNAMNETAL

Referencias

Balzarini, M. (2013). Estadística y biometría: ilustraciones del


uso e infostat en problemas de agronomía. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.
action?docID=3221775&query=bioestadistica

Di, R. J. A., Casanoves, F., & Gonzalez, L. A. (2008). Estadística


para las ciencias agropecuarias (7a. ed.). Recuperado de:
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.acti
on?ppg=1&docID=3185731&tm=1519912328994

Balzarini, M. (2013). Estadística y biometría: ilustraciones del


uso e infostat en problemas de agronomía, p. 257-292.
Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.
action?docID=3221775&query=bioestadistica

Matus, R., Hernández, M., & García, E. (2010). Estadística.


Recuperado de:

http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
ppg=1&docID=3187261&tm=1519661894239

Вам также может понравиться