Вы находитесь на странице: 1из 11

R version 3.5.

3 (2019-03-11) -- "Great Truth"

Copyright (C) 2019 The R Foundation for Statistical Computing

Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.

Escriba 'contributors()' para obtener más información y

'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.

Escriba 'q()' para salir de R.

>

> # CURSO ESTADISTICA DESCRIPTIVA (300046_761) PERIODO ACADÉMICO 16-1 DE 2020

> # CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Y MANEJO DEL CODIGO R UNIDAD 1

> # Recuerde que para ejecutar cada una de las líneas del código debe digitar "Control+r"

> # Recuerde siempre ejecutarlo en orden, de arriba hacia abajo

>

> # Las líneas del código que inician con el símbolo # no son comandos sino textos explicatorios

> # IMPORTANTE: NO MODIFIQUEN NINGUNA PARTE DEL CÓDIGO

> # Si lo modifican, les pueden aparecer errores

> # Si por error lo modificó, ingrese nuevamente a la carpeta de Google Drive y descárguelo
nuevamente

>

> # En este ejercicio, conoceremos los principales tipos de varables que se manejan en estadística
descriptiva:
> # Variable cuantitativa continua

> # Variable cuantitativa discreta

> # Variable cualitativa o categórica

> ###VARIABLES CUANTITATIVAS CONTINUAS

> ###Son variables de mediciones en individuos u objetos peso, edad, altura

> ###son variables que admiten decimales.

> ###VARIABLE EDAD: es una varible continua, ya que se pueden tener 10.5 años

> edad=c(18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25)

> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> summary(edad)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

15.00 18.80 20.00 20.29 22.00 25.00

> mean(edad)#media aritmética

[1] 20.29333

> var(edad)#varianza

[1] 7.182095

> sd(edad)#desviación estándar

[1] 2.679943

> min(edad) #Mínimo

[1] 15

> max(edad)# Máximo

[1] 25

> range(edad) #Rango

[1] 15 25

> median(edad)# Mediana

[1] 20

> length(edad)# Número de datos

[1] 15
> quantile(edad, 0.25)# Cuantil Q1

25%

18.8

> quantile(edad, 0.75)# Cuantil Q3

75%

22

> quantile(edad, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

20

> IQR(edad) #Rango intercuartílico

[1] 3.2

> sort(edad)# Ordenar

[1] 15.0 17.0 18.0 18.4 19.2 19.4 19.6 20.0 20.4 21.4 22.0 22.0 23.0 24.0 25.0

>

> ### Regla de Sturges OPCIONAL PERO SE DEBE ACLARAR EL NUMERO DE INTERVALOS

> range(edad,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores


perdidos

[1] 15 25

> nclass.Sturges(edad)#Número de intervalos

[1] 5

> seq(15,25,length=nclass.Sturges(edad)) # Límites de los intervalos

[1] 15.0 17.5 20.0 22.5 25.0

> intervalosEdad=cut(edad,breaks=seq(15,25,length=nclass.Sturges(edad)),include.lowest=TRUE)

> intervalosEdad # Se muestran los intervalos de edad, uno correspondiente a cada edad
observada

[1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (17.5,20] (20,22.5] (17.5,20] (20,22.5] (17.5,20] (22.5,25]
[15,17.5] (20,22.5] [15,17.5] (20,22.5] (22.5,25]

Levels: [15,17.5] (17.5,20] (20,22.5] (22.5,25]

> puntos=min(edad)+(0:nclass.Sturges(edad))*(max(edad)-min(edad))/nclass.Sturges(edad)

>
> #Histograma de la variable edad con la regla de Sturges:

> hist(edad,main="Histograma con Regla de Sturges variable edad",breaks=puntos) # este


comando crea el gráfico de histograma con la regla de Sturges

>

> # Instalación libreria "agricolae":

> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del
código

> # Esta es la forma de instalar desde el editor:

> install.packages("agricolae") # Esperar que salga una lista de países y seleccionar USA(IA)

> ## Damos "OK" y el programa instala el paquete

> ## Es una libreria grande, así que hay que tener paciencia y esperar hasta que esté totalmente
instalada

> ## Esperar hasta que aparezca el mensaje "The downloaded binary packages are in (muestra la
carpeta donde se guardaron)

> # finalmente, debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda

> ## Esperar hasta que aparezca el mensaje "The downloaded binary packages are in (muestra la
carpeta donde se guardaron)

> # finalmente, debe aparecer nuevamente el cursor rojo en la consola de resultados a la izquierda

> # si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo

> library(agricolae)

>

> ### Gráficos de variables continuas:

> hist(edad,ylab="Frecuencia",main="Histograma de la variable continua Edad")# Histograma

> boxplot(edad,ylab="Edad (años)",main="Boxplot o diagrama de cajas variable continua") #


Gráfico de diagrama de cajas o Boxplot

>

> ###VARIABLES CUANTITATIVAS DISCRETAS

> # si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo

> library(agricolae)

>
> ### Gráficos de variables continuas:

> hist(edad,ylab="Frecuencia",main="Histograma de la variable continua Edad")# Histograma

> boxplot(edad,ylab="Edad (años)",main="Boxplot o diagrama de cajas variable continua") #


Gráfico de diagrama de cajas o Boxplot

>

> ###VARIABLES CUANTITATIVAS DISCRETAS

> ## variables de conteos, solo toman valores en números enteros numero de hermanos

> ## numero de frutos, número de partos.

> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2)

>

> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> # si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo

> #Histograma de la variable edad con la regla de Sturges:

> hist(edad,main="Histograma con Regla de Sturges variable edad",breaks=puntos) # este


comando crea el gráfico de histograma con la regla de Sturges

>

> # Instalación libreria "agricolae":

> # Es obligatorio instalar la libreria Agricolae, para poder ejecutar los siguientes comandos del
código

> # Esta es la forma de instalar desde el editor:

> install.packages("agricolae") # Esperar que salga una lista de países y seleccionar USA(IA)

Installing package into ‘C:/Users/User/Documents/R/win-library/3.5’

(as ‘lib’ is unspecified)

Warning: package ‘agricolae’ is in use and will not be installed

> # si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo

> library(agricolae)

>

> ### Gráficos de variables continuas:


> # si la libreria quedó bien instalada, al dar "CONTROL+R" aparece "library(agricolae)" en color
rojo

> library(agricolae)

>

> ### Gráficos de variables continuas:

> hist(edad,ylab="Frecuencia",main="Histograma de la variable continua Edad")# Histograma

> boxplot(edad,ylab="Edad (años)",main="Boxplot o diagrama de cajas variable continua") #


Gráfico de diagrama de cajas o Boxplot

> boxplot(edad,ylab="Edad (años)",main="Boxplot o diagrama de cajas variable continua") #


Gráfico de diagrama de cajas o Boxplot

>

> ###VARIABLES CUANTITATIVAS DISCRETAS

> ## variables de conteos, solo toman valores en números enteros numero de hermanos

> ## numero de frutos, número de partos.

> Hermanos=c(0,1,4,1,2,3,2,3,1,2,0,5,4,3,2)

>

> #Presentar en el informe grupal los siguientes resultados en un cuadro, explicando cada uno de
ellos:

> summary(Hermanos)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

0.0 1.0 2.0 2.2 3.0 5.0

> min(Hermanos) #Mínimo

[1] 0

> max(Hermanos)# Máximo

[1] 5

> range(Hermanos) #Rango

[1] 0 5

> mean(Hermanos)# Media aritmética ## SI HAY DATOS PERDIDOS TOCA CON SUMMARY

[1] 2.2

> median(Hermanos)# Mediana


[1] 2

> length(Hermanos)# NÚMERO DE DATOS

[1] 15

> sd(Hermanos)# Desviación típica

[1] 1.473577

> quantile(Hermanos, 0.25)# Cuantil Q1

25%

> quantile(Hermanos, 0.75)# Cuantil Q3

75%

> quantile(Hermanos, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

> IQR(Hermanos) #Rango intercuartílico

[1] 2

> sort(Hermanos)# Ordenar

[1] 0 0 1 1 1 2 2 2 2 3 3 3 4 4 5

> ##En este caso las tablas de frecuencias se desarrollan por pasos:

> table(Hermanos) #Tabla de frecuencias absolutas

Hermanos

012345

234321

> fabs=table(Hermanos)##Tabla de frecuencias absolutas

> fabs

Hermanos

012345

234321

> fabsacum<-as.table(cumsum(fabs))#Frecuencias absolutas acumuladas


> fabsacum

0 1 2 3 4 5

2 5 9 12 14 15

> frel=prop.table(table(Hermanos))#Tabla de frecuencias relativas

> frel

Hermanos

0 1 2 3 4 5

0.13333333 0.20000000 0.26666667 0.20000000 0.13333333 0.06666667

> frelacum<-as.table(cumsum(frel))#Frecuencias relativas acumuladas

> frelacum

0 1 2 3 4 5

0.1333333 0.3333333 0.6000000 0.8000000 0.9333333 1.0000000

> # Podemos decir que cero hermanos tiene el 0.1 en proporción ó el 10% de los individuos
encuestados.

> # Las proporciones se multiplican por 100 para expresarlas en porcentaje.

>

> ##Gráficos de variables cuantitaivas discretas:

> boxplot(Hermanos,ylab="número de hermanos",main="Boxplot o diagrama de cajas variable


discreta")

> boxplot(Hermanos,ylab="número de hermanos",main="Boxplot o diagrama de cajas variable


discreta")

> boxplot(Hermanos,ylab="número de hermanos",main="Boxplot o diagrama de cajas variable


discreta")

> barplot(fabs,xlab="Número de hermanos",ylab="Frecuencias absolutas",main="Diagrama de


barras Frecuencia Absoluta")

> barplot(frel,xlab="Número de hermanos",ylab="Frecuencias relativas",main="Diagrama de


barras Frecuencia relativa")

> barplot(frelacum,xlab="Número de hermanos",ylab="Frecuencias relativas",main="Diagrama de


barras Frecuencias relativas acumuladas")

> pie(fabs,col=rainbow(6),main=c("Grafico de tarta de Hermanos"))#Gráfico de tarta

>
> ##VARIABLES CUALITATIVAS

> # Son variables atribuibles a espectos cualitativos no numéricos, como el color, la raza, etc...

> # Pueden ser de tipo nominal, donde cada categoría es independiente de la otra, como el color o
la raza

> # O de tipo categórigo, donde existe algún tipo de estratificación o nivel, como el nivel de
estudios o el estrato socioeconómico.

> # A continuación tomaremos como ejemplo la variable categórica "Nivel de estudios" de los
agricultores pertenecientes a una misma vereda.

> # Para poder codificar lo que cada agricultor respondió, se le asigna un número a cada nivel de
estudio:

> # Nivel de estudios: 0:“Sin estudios”; 1: “Estudios Primarios”; 2: “Estudios Secundarios”;


3:“Estudios Superiores”

>

> estudios=c(1,2,0,1,0,1,1,2,3,2,3,1,2,3) # Esto es lo que respondió cada agricultor ya codificado,


para poderlo analizar en el programa R.

>

> # Ahora, hay que explicarle al programa lo que significa cada número

> # Se le aclara que nuestra variable tiene 4 categorías, del 0 al 3

> # Se indica a qué corresponde cada número, desde el menor grado hasta el más avanzado y cuál
es su etiqueta:

>

> estudios=factor(estudios, levels=c(0,1,2,3),

+ labels=c("Sin estudios","Estudios Primarios",

+ "Estudios Secundarios","Estudios Superiores"))

>

> estudios # Muestra los que respondió cada agricultor

[1] Estudios Primarios Estudios Secundarios Sin estudios Estudios Primarios Sin estudios
Estudios Primarios Estudios Primarios

[8] Estudios Secundarios Estudios Superiores Estudios Secundarios Estudios Superiores Estudios
Primarios Estudios Secundarios Estudios Superiores

Levels: Sin estudios Estudios Primarios Estudios Secundarios Estudios Superiores

>
> # Una vez se ha codificado exitosamente la variable, se puede analizar con R:

> # Presentar estos resultados en un cuadro y explicar:

> # Presentar estos resultados en un cuadro y explicar:

>

> summary(estudios)# debe aparecer cada categoria con el número de agricultores que se
encuentran en ella

Sin estudios Estudios Primarios Estudios Secundarios Estudios Superiores

2 5 4 3

> table(estudios) #Tabla de frecuencias absolutas

estudios

Sin estudios Estudios Primarios Estudios Secundarios Estudios Superiores

2 5 4 3

>

> # Hay que tener cuidado cuando se va a usar un comando que ya se había usado antes

> # Es importante cambiarle el nombre, o va a producir los resultados para los que se creó
inicialmente

> # En la variable discreta, ya habíamos usado los comandos "fabs" y "frel"

> # Así que para usarlos nuevamente, les cambiamos el nombre a "fabs1" y "frel1":

>

> fabs1=table(estudios)# Tabla de frecuencias absolutas

> fabs1 # si no se le cambia el nombre, aparecería el mismo que produjo en la variable discreta

estudios

Sin estudios Estudios Primarios Estudios Secundarios Estudios Superiores

2 5 4 3

> frel1=prop.table(table(estudios))# Tabla de frecuencias relativas

> frel1

estudios

Sin estudios Estudios Primarios Estudios Secundarios Estudios Superiores

0.1428571 0.3571429 0.2857143 0.2142857

>
> # Podemos decir que el 0.1 de los agricultores encuestados no tienen estudios o en proporción,
el 10%

> # Para pasarlo a porcentaje, se multiplica el resultado por 100

>

> ##Gráficos de variables cualitativas

> barplot(fabs1,ylab="Frecuencias absolutas",main="Diagrama de barras frecuencias absolutas


nivel de estudio de agricultores") #

> barplot(frel1,ylab="Frecuencias relativas",main="Diagrama de barras frecuencias relativas nivel


de estudio de agricultores")

>

> #Les deseamos éxitos en la ejecución de este ejercicio.

> # Si tiene alguna inquietud, por favor consulte con su respectivo tutor, de acuerdo al grupo al
que pertenece.

> # Preparado por Luis Alberto Cáceres

> # Director del curso Estadística Descriptiva (para ciencias agrarias)