Вы находитесь на странице: 1из 26

UNIVERSIDAD CUAUHTÉMOC

PLANTEL AGUASCALIENTES
EDUCACIÓN A DISTANCIA

Maestría en Ciencia de los Datos y


Procesamiento Masivo (BIG DATA)

Análisis de datos con R


Cuatrimestre I

1.3 La sintaxis y los comandos R

Objetivo de la unidad: Instalar y conocer el entorno de programación R. Conocer la sintaxis y


los comandos básicos de R.

Mario Alberto Vargas Moreno

27 de noviembre de 2016

“EXCELENTES PROFESIONISTAS, MEJORES SERES HUMANOS”

1
Nombre de la Unidad.
Introducción a R
Objetivo de la Unidad.
• Instalar y conocer el entorno de programación R.
• Conocer la sintaxis y los comandos básicos de R.
• Conocer y utilizar funciones establecidas en R.
• Editar y ejecutar comandos desde archivos.

1. Índice

Contenido
1.Índice.................................................................................................................................... 2
2.Resumen ............................................................................................................................. 3
Introducción ............................................................................................................................ 4
3.Descripción de la Actividad(es): ...................................................................................... 5
4.Desarrollo de la actividad(es):............................................................................................... 6
5.Conclusiones .................................................................................................................... 25
6.Bibliografía. ....................................................................................................................... 26

2
2. Resumen

El desarrollo de la nube se ha venido dando durante ya algunos años y este se

ha dado gracias a la conjunción de muchas otras tecnologías que han permitido

el desarrollo de esta.

Dentro de estas tecnologías se encuentran las que permiten analizar una gran

cantidad de datos, es aquí donde el Leguaje R se vuelve una herramienta

potente que nos permite ser aplicada a la minería de datos.

Durante el siguiente escrito se pretenden mostrar algunas de características del

lenguaje en cuanto al comportamiento de su sintaxis y manejo de comando, los

cuales se ampliarán su uso más adelante.

3
Introducción

En la actualidad la gran cantidad de datos que cada vez más se requieren

manipular en el campo de la estadística ha exigido buscar e implementar

herramientas de software que precisamente nos permitan realizar un análisis

adecuado de los datos.

Dentro del documento se mostrarán algunos de los comandos y la sintaxis para

manejar vectores, desarrollo de gráficos, declaración de variables que están

ligadas al lenguaje de programación R.

Estos comandos los explicare desde mi interpretación mostrando algunas

características y servicios que presta cada uno.

4
3. Descripción de la Actividad(es):

El alumno deberá acceder a CURSO 1 R (Enlaces a un sitio externo.) y realizar los

ejercicios del capítulo 1 y 2. Para realizar los ejercicios, el alumno podrá apoyarse del

libro AN INTRODUCTION TO R, capítulo 1 y 2. Enviar en un archivo PDF un resumen

de todos los comandos y funciones aprendidas en la práctica.

Nota: no olvide explicar para qué sirve cada comando.

5
4. Desarrollo de la actividad(es):

 . > 1 + 1 : En R se puede realizar una operación matemática como la suma


el programa arroja el resultado.
 “Arr, matey!” : Aquí podemos escribir una cadena de caracteres el
programa arroja como respuesta los valores asignados.

6
 Al igual que ejemplo anterior al realizar una operación entre números 6 *
7 este arrojara como respuesta el valor de esta 42.
 3 <4 TRUE :En esta ocasión se ve la utilidad de valores lógicos. Al
comprobar que el numero 3 es menor que el numero 4 arroja la expresión
True.

 2+2 == 5 False : Aquí el programa arroja un valor lógico falso al revisar


la comparación de datos.
7
 T == TRUE
 F == FALSE: Se asignan falso a la abreviatura F y T a la abreviatura
verdadero.
 x <- 42 aquí se asigna el numero 42 a la variable x en minúscula.

 X/2 : Aquí como ya se asignó un valor a la variable x el programa arroja el


resultado de la división.

 x <- "Arr, matey!" Aqui a la variable x se le asigna un grupo de caracteres


"Arr, matey!"
 x "Arr, matey!" Si se escribe la variable en algún momento del programa
este responde con el valor antes almacenado en ella.

8
 x <- TRUE : Aquí se asigna el valor TRUE a la variable x.
 sum (1, 3, 5) Aquí se realiza la función suma de los valores que se
encuentran entre paréntesis.

 rep (“Yo ho!”, times = 3) rep llama a la función repetir y time = 3 es la


cantidad de veces que se repite la cadena de caracteres que introducimos
entre “”
 sqrt(16) Sqrt Llama a la función raíz cuadrada de un valor que va a estar
entre paréntesis.
 help (sum) La función help llama a la ayuda del programa sobre la función
que esta entre paréntesis.

9
 example (funtion name) : example llama a la opción de ejemplos que tiene
el programa sobre una función que se escribe entre paréntesis.

 example (min) Example min llama a la opción de ejemplos que tiene el


programa sobre la función min que está escrita entre paréntesis.
 help (rep) Llama a la opción de ayuda que tiene el programa sobre la
función rep que está escrita entre paréntesis.

 list.files() Lista archivos que se encuentran dentro del directorio de R.

10
 Source (“bottle2.R”): Permite ejecutar una secuencia de comandos en
este caso bottle2.R

11
 >c (4, 7, 9) Se crea un vector con la función c (que es la abreviatura de
Combine) crea un nuevo vector mediante la combinación de una lista de
valores.
 c ('a', 'b', 'c') Se crea un vector con la función c con ciertos items dentro
del.
[1] "a" "b" "c"

* > c(1, TRUE, "three")

[1] "1" "TRUE" "three"


12
Si se intentan combinar diferentes tipos de vectores como en el ejemplo anterior
sucederá que todos los valores se convertirán a un solo modo (caracteres) de
modo que el vector puede contenerlos a todos.

 5:9 Aquí se crea un vector en secuencia desde el numero 5 hasta el


número 9.

 seq (5,09 )
 [1] 5 6 7 8 9

 También se puede utilizar la función seq que permite hacer lo mismo que
en el ejemplo anterior.

 seq (5, 9, 0.5)


[1] 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0
También podemos delimitar un valor de incremento para la secuencia en este
caso es de 0.5 en 0.5.

13
 9: 5
[1] 9 8 7 6 5
También se pueden realizar vectores en decremento desde un número mayor a
uno menor.

 sentence <- c('walk', 'the', 'plank')


> sentence[3]
[1] "plank"
En este ejemplo se creó un vector con 3 cadenas diferentes y luego se llamó al
elemento 3 del vector que fue plank.
 En el lenguaje R el indice de los vectores inicia en 1 a diferencia de otros
lenguajes que inicia en 0.
 sentence[3] <- "dog"
También podemos cambiar el valor de los elementos por ejemplo en el vector
que se trabaja se cambia el vector de la posición 3 que es plank por dog.
 Como también podemos agregar nuevos elementos al vector que se está
trabajando.

14
 sentence[c(1, 3)]
[1] "walk" "dog"
 Se puede usar un vector dentro de los corchetes para acceder a múltiples
valores. Aquí se consigue la primera y tercera palabra.
sentence[2:4]
 Esto significa que puede obtener los rangos de valores entre la segunda a la
cuarta palabra.
[1] "the" "dog" "to"
 también podemos asignar nuevos valores dentro del vector_:
sentence[5:7] <- c('the', 'poop', 'deck')

15
 sentence[6]
[1] "poop" nos arroja la sexta palabra que tenemos dentro del vector.

 ranks <- 1:3


> names(ranks) <- c("first", "second", "third")
En R se puede asignar nombres a los elementos de un vector que pasa por un
segundo vector lleno de nombres, usando la función names.

16
 vesselsSunk <- c(4, 5, 1):Aquí se asigna un nuevo vector.
> barplot(vesselsSunk): Aquí se llama a la función barplot que nos permite
graficar lo que anteriormente se encuentre dentro del vector.

 names(vesselsSunk) <- c("England", "France", "Norway")


Si se le asignan nombres a los valores del vector,
R utilizará esos nombres como etiquetas en el diagrama de barras.
Luego llamamos nuevamente a la función de grafico de barras. Y nos aparecerán
con las etiquetas en la parte de abajo.

17
 barplot(1:100)
Esta instrucción nos permite llamar una gráfica de un vector de los números 1 al
100.

18
 a <- c(1, 2, 3)Se crea el vector a con los valores 1,2,3
> a + 1 Luego se le añade un escalar al vector arrojando:
[1] 2 3 4 aquí se le suma la unidad a cada elemento del vector.
 a/2

[1] 0.5 1.0 1.5 Aquí lo que se hace es tomar todos los elementos del vector a y
dividirlos por 2.
 a*2
[1] 2 4 6 Aquí lo que se hace es tomar todos los elementos del vector a y
multiplicarlos por 2.

19
> b <- c(4, 5, 6) Aquí se crea otro vector llamado b. con los valores 4,5,6.
> a + b Aquí se realiza la suma de dos vectores a + b
[1] 5 7 9 Este es el resultado que arroja el programa.

 a == c(1, 99, 3) Aquí se comparan los elementos de los vectores a y c,

[1] TRUE FALSE TRUE : Este es el resultado.

 >a<b Al compararse si los datos del vector a son menores que los del
vector b arrojo:
[1] TRUE TRUE TRUE
20
 sin(a)
[1] 0.8414710 0.9092974 0.1411200

La función sin nos arrojara el seno de los valores que se encuentran en el vector
a.

 sqrt (a)
[1] 1.000000 1.414214 1.732051 nos arroja la raíz cuadrada de los valores del
vector a.

21
Plot x,y permite graficar los valores en un editor gráfico.

> values <- -10:10


> absolutes <- abs(values)
> plot(values, absolutes) Aqui se grafica la informaciòn que se encuentra en los
vectores values y absolutes.

22
> sum(a, na.rm = TRUE)Se le asigna a los valores de N.A el valor verdadero
para que R nos permita realizar la operación suma sin problemas sin tener en
cuenta este valor para la operación.
[1] 20

23
24
5. Conclusiones

El lenguaje programación R es un lenguaje y entorno de programación para

análisis estadístico y gráfico que nos permite realizar análisis de una gran

variedad de información.

El lenguaje es bastante amigable y los entornos de programación como RStudio

permiten realiza diferentes ejemplos del lenguaje.

Es muy interesante la forma de poder asignar vectores y graficarlos sin tanta

complejidad para ello.

La posibilidad de operar el contenido de vectores con diferentes operaciones

aritméticas hace que el entorno de programación R sea bastante útil en el manejo

de datos estadísticos y en el proceso de la minería de datos y máquinas de

aprendizaje.

25
6. Bibliografía.

Goette, P. (2014). R, un lenguaje y entorno de programación para análisis


estadístico. Genbetadev.com. Retrieved 26 November 2016, from
http://www.genbetadev.com/formacion/r-un-lenguaje-y-entorno-de-
programacion-para-analisis-estadistico

Jones, O., Maillardet, R., & Robinson, A. (2009). Introduction to scientific


programming and simulation using R (1st ed.). Boca Raton, FL: Chapman &
Hall/CRC.

Try R. (2016). Try R. Retrieved 25 November 2016, from


http://tryr.codeschool.com/levels/1/challenges/1

Vargas, M. (2016). Ingresar a Canvas. Cuauhtemoc.instructure.com.


Retrieved 25 November 2016, from
https://cuauhtemoc.instructure.com/courses/237/assignments/2885

26

Вам также может понравиться