Вы находитесь на странице: 1из 19

TALLER R, Laboratorio 1

UNIVERSIDAD NACIONAL DE COLOMBIA


Asignaturas: Bioestadística Fundamental; Probabilidad y estadística
fundamenta

RESUMEN
En el siguiente informe se presenta el desarrollo de “Taller 1” en R-studio, se desarrolló
el código basándose en la guía y consulta Bibliográfica, posteriormente se realiza las
observaciones y resultados obtenido por R-studio.

INTRODUCCIÓN
A continuación, expondremos una serie de ejercicios desarrollados en R-studio con el
fin de afianzar los temas vistos en clases como lo son:

● Media
● Mediana
● Mediana recortada
● Percentiles
● Tablas y gráficas
utilizando una serie de funciones y comandos incluidos en la librería de R-studio
(usingR) como:
● mean(x)
● mediam(x)
● trim
● quantile
● plot
● data
● hist
● ggplot
● data.frmae
● breaks
Estas herramientas son elementos aplicados a un conjunto de datos mutuamente
relacionados para obtener una idea de cómo se comportan y tener una visión amplia
de sus comportamiento .
MARCO TEÓRICO
● R : es un entorno y lenguaje de programación con un enfoque al análisis
estadístico, este programa se caracteriza por tener código abierto, así como la
posibilidad de dar accesos a bases de datos realizadas por organizaciones
permitiendo un accesos basto a información disponible para el análisis, otra gran
virtud de el acceso a bases de datos es la posibilidad de adquirir comandos con
propiedades más específicas o con mejor respuesta para los requerimientos
● R-studio: “Es un entorno de desarrollo integrado (IDE) para el lenguaje de
programación R, dedicado a la computación estadística y gráficos. Incluye una
consola, editor de sintaxis que apoya la ejecución de código, así como
herramientas para el trazado, la depuración y la gestión del espacio de trabajo”
1

Ejemplo 4.
1. Leer los datos utilizando el método que se prefiera.
Ej. 3 — Consideremos los siguientes datos.

Descripción de la programación (3.1):


Primeramente ingresamos los datos en un archivo de texto o fichero de texto (.txt) del
cual leeremos los valores y así R-studio nos creará una tabla con los valores de este
fichero con ayuda de la función ¨read.table¨ la cual nombraremos “ejemplo4_”
colocándolo en la primera línea del txt y al nombrar la variable.
Acá podemos visualizar que luego de importar el fichero de texto nos aparece en el environment un
data reproducible que será la tabla de 120 variables provenientes del “.txt”.

Luego utilizamos el método de transcripción dándole términos a una variable y


teniendo en cuenta que el punto “.” Será distinción decimal y la coma “,” la
utilizaremos para separar cada término; nombrado a este grupo de valores
‘’Ejemplo4’’ con el fin de probar que los dos métodos son igual de funcionales.
Luego de ello visualizaremos en el environment un values que podrá ser ejecutable y manipulable para
operar.

2. Calcular la media, mediana, media recortada con una proporción del 0.05, los
percentiles de orden 0.1 y 0.9.

Descripción de la programación (3.2):


Mediante las función ‘’mean’’ hallamos la media del grupo de datos ejemplo 4, de igual
manera ayudándonos de la función ‘’mediam’’ encontramos la mediana, para luego a
la media darle una proporción del 0.05 siendo este resultado la media recortada, luego
para hallar los percentiles se utilizó la función ‘’quartile’’ debidamente para orden 0.1 y
0.9 con (ordene,probs) luego de la función dicha.
3. Supongamos que se han seguido recogiendo datos. En concreto una segunda
muestra con los siguientes valores.
Parte2 <-C(123.34, 78.23, 89.6, 1.2)
## [1] 123.34 78.23 89.60 1.20

Incorporar estas nuevas observaciones a los datos originales y calcular las


descriptivas numéricas anteriores sobre los nuevos datos. Indicar cuáles de ellas
varían y cuáles no justificando la respuesta.
Descripción de la programación (3.3):
Como lo hicimos anteriormente hallamos la media, mediana, media recortada y
cuartiles con las funciones ya nombradas para la variable ‘’parte2’’ que fue una
corrección hecha para ‘’ejemplo4’’

Ej. 4 — Vamos a realizar distintas representaciones gráficas con los datos del
ejercicio 3. Se pide lo siguiente:
1. Realizar distintos histogramas de los datos que aparecen en el ejercicio
Modificando el número de clases. ¿Hay un comportamiento consistente en la
representación gráfica?
2. Representar gráficamente un estimador kernel de la densidad. Observar el valor
que se ha utilizado para el ancho de banda.
3. Modificar el valor del ancho de banda observado en el apartado 2 doblando su valor
y volver a representar el estimador kernel de la densidad.
4. Modificar el valor del ancho de banda observado en el apartado 2 considerando la
mitad de su valor y volver a representar el estimador kernel de la densidad.
5. Comparar los tres estimadores kernel que hemos obtenido. ¿Qué ocurre cuando
incrementamos el ancho de banda? ¿Y cuándo lo disminuimos?
Descripción de la programación (4):

Se realizó una tabla con ayuda de tabla1 = data.frame, para luego realizar los
histogramas variando los Breaks
Histograma, break ‘’1’’

Histograma, Break ‘’8’’


Histograma, Break ‘’2’’

Histograma, Break ‘’3,4’’


Histograma, Break’’5,6,8’’

Se realizaron los histogramas variando los breaks con el fin de percibir la información
dada por cada histograma según sus clases, para luego concluir que a una mayor
agrupación de datos se pierde la facilidad de identificar la información que pretende
dar la gráfica.
Ahora utilizaremos el df= data frame para generar un ggplot o estimador de kernel variando los
binwidth verificando así el comportamiento de la gráfica al modificar su ancho

ggplot, binwidth”15”
ggplot, binwidth”13”
ggplot, binwidth”10”

ggplot, binwidth”8”
ggplot, binwidth”5”

ggplot, binwidth”3”
ggplot, binwidth”1”

ggplot, binwidth”0.5”
Para luego hacer una comparación según su geometría a los tres ggplot que hemos
obtenido previamente (3,6,1.5)
ggplot, binwidth”_”

ggplot, binwidth”3”
ggplot, binwidth”6”

ggplot, binwidth”1.5”
Si se elimina el dato extremo, la forma del gráfico y las conclusiones son similares,
aunque la escala es distinta. Esto significa que es un gráfico robusto, que no se ve
muy influenciado por la presencia de valores anómalos.

Referencias:
https://es.wikipedia.org/wiki/R_(lenguaje_de_programaci%C3%B3n)

gjhgfjht

Вам также может понравиться