Академический Документы
Профессиональный Документы
Культура Документы
RESUMEN
En el siguiente informe se presenta el desarrollo de “Taller 1” en R-studio, se desarrolló
el código basándose en la guía y consulta Bibliográfica, posteriormente se realiza las
observaciones y resultados obtenido por R-studio.
INTRODUCCIÓN
A continuación, expondremos una serie de ejercicios desarrollados en R-studio con el
fin de afianzar los temas vistos en clases como lo son:
● Media
● Mediana
● Mediana recortada
● Percentiles
● Tablas y gráficas
utilizando una serie de funciones y comandos incluidos en la librería de R-studio
(usingR) como:
● mean(x)
● mediam(x)
● trim
● quantile
● plot
● data
● hist
● ggplot
● data.frmae
● breaks
Estas herramientas son elementos aplicados a un conjunto de datos mutuamente
relacionados para obtener una idea de cómo se comportan y tener una visión amplia
de sus comportamiento .
MARCO TEÓRICO
● R : es un entorno y lenguaje de programación con un enfoque al análisis
estadístico, este programa se caracteriza por tener código abierto, así como la
posibilidad de dar accesos a bases de datos realizadas por organizaciones
permitiendo un accesos basto a información disponible para el análisis, otra gran
virtud de el acceso a bases de datos es la posibilidad de adquirir comandos con
propiedades más específicas o con mejor respuesta para los requerimientos
● R-studio: “Es un entorno de desarrollo integrado (IDE) para el lenguaje de
programación R, dedicado a la computación estadística y gráficos. Incluye una
consola, editor de sintaxis que apoya la ejecución de código, así como
herramientas para el trazado, la depuración y la gestión del espacio de trabajo”
1
Ejemplo 4.
1. Leer los datos utilizando el método que se prefiera.
Ej. 3 — Consideremos los siguientes datos.
2. Calcular la media, mediana, media recortada con una proporción del 0.05, los
percentiles de orden 0.1 y 0.9.
Ej. 4 — Vamos a realizar distintas representaciones gráficas con los datos del
ejercicio 3. Se pide lo siguiente:
1. Realizar distintos histogramas de los datos que aparecen en el ejercicio
Modificando el número de clases. ¿Hay un comportamiento consistente en la
representación gráfica?
2. Representar gráficamente un estimador kernel de la densidad. Observar el valor
que se ha utilizado para el ancho de banda.
3. Modificar el valor del ancho de banda observado en el apartado 2 doblando su valor
y volver a representar el estimador kernel de la densidad.
4. Modificar el valor del ancho de banda observado en el apartado 2 considerando la
mitad de su valor y volver a representar el estimador kernel de la densidad.
5. Comparar los tres estimadores kernel que hemos obtenido. ¿Qué ocurre cuando
incrementamos el ancho de banda? ¿Y cuándo lo disminuimos?
Descripción de la programación (4):
Se realizó una tabla con ayuda de tabla1 = data.frame, para luego realizar los
histogramas variando los Breaks
Histograma, break ‘’1’’
Se realizaron los histogramas variando los breaks con el fin de percibir la información
dada por cada histograma según sus clases, para luego concluir que a una mayor
agrupación de datos se pierde la facilidad de identificar la información que pretende
dar la gráfica.
Ahora utilizaremos el df= data frame para generar un ggplot o estimador de kernel variando los
binwidth verificando así el comportamiento de la gráfica al modificar su ancho
ggplot, binwidth”15”
ggplot, binwidth”13”
ggplot, binwidth”10”
ggplot, binwidth”8”
ggplot, binwidth”5”
ggplot, binwidth”3”
ggplot, binwidth”1”
ggplot, binwidth”0.5”
Para luego hacer una comparación según su geometría a los tres ggplot que hemos
obtenido previamente (3,6,1.5)
ggplot, binwidth”_”
ggplot, binwidth”3”
ggplot, binwidth”6”
ggplot, binwidth”1.5”
Si se elimina el dato extremo, la forma del gráfico y las conclusiones son similares,
aunque la escala es distinta. Esto significa que es un gráfico robusto, que no se ve
muy influenciado por la presencia de valores anómalos.
Referencias:
https://es.wikipedia.org/wiki/R_(lenguaje_de_programaci%C3%B3n)
gjhgfjht