Вы находитесь на странице: 1из 13

Taller de R

y R-commander
Mara Jos Nueda
Mario Trottini
Dpto. Estadstica e Investigacin Operativa.

ndice
1.

Qu es R?

2.

Paquetes y ayuda

3.

Manejo de objetos en R

4.

Importar y exportar datos

5.

Anlisis exploratorio
1.

Grficos

2.

Descriptivos

6.

Inferencia clsica para la media

7.

Rcmdr
2

1. Motivacin: Qu es R?

R es un sistema para anlisis estadstico con doble naturaleza:


programa y lenguaje de programacin.

Dialecto del lenguaje S (AT&T Bell).

Se distribuye gratuitamente bajo los trminos de la GNU General


Public Licence.

Lenguaje orientado a objetos.

Cdigo fuente en C y Fortran.

1. Motivacin: Qu es R?
!

Es libre. Se obtiene en http://cran.r-project.org para windows,


LINUX y MacOS x
Combina anlisis preempaquetados (ANOVA, regresin logstica,
anlisis de supervivencias, componente principales, etc.) con anlisis
ad-hoc.
Capacidad de manipular datos y funciones. Permite realizar varios
anlisis sobre los mismos datos; el mismo anlisis a diferentes datos.
La comunidad de R es muy dinmica e integrada por estadsticos de
gran renombre.
Extensiones especficas a reas nuevas (bioinformtica,
geoestadstica, etc.)
La documentacin es muy completa y accesible.
4

Materiales
1. En: http://cran.r-project.org/
- Manuales en pdf editados por los desarrolladores de R.
- Manuales, tutoriales, presentaciones, traducciones, etc. de usuarios de R.

Ejemplos:

R para Principiantes, the Spanish version of R for Beginners, translated by Jorge A. Ahumada.

A Spanish translation of An Introduction to R by Andrs Gonzlez and Silvia Gonzlez .

Grficos Estadsticos con R by Juan Carlos Correa and Nelfi Gonzlez.

Generacion automatica de reportes con R y LaTeX by Mario Alfonso Morales Rivera.

2. Listas de correo para usuarios de R: dudas.


3. Proyectos: ej. Bioconductor: manejo de datos de bioinformtica.
4. R-news: revista con artculos de inters para usuarios de R:

novedades,

cambios http://cran.r-project.org/doc/Rnews/

1. Motivacin: Qu es R?
1. Flexibilidad
"
"

Para el investigador
Para el profesor
Permite implementar programas y combinarlos con los paquetes de
R. Esto es til para:
- Mtodos estadsticos ms novedosos y sofisticados, usualmente
no disponibles o disponible con mucho retrasos en otros software
como SPSS.
- Animaciones grficas tiles en docencia.
-

2. Disponibilidad

No fomentar la piratera en alumnos ni en egresados.

2. Paquetes y ayuda

Los paquetes contienen un conjunto de funciones, datos y manuales.

Paquetes estndar: ya vienen al instalar R.

base, utils.

stats: estadsticos estndar, ANOVA, R.L.

graphics: funciones para grficos.

Otros paquetes: hay que instalarlos y cargarlos: ej. MASS, foreign.

library(): lista los paquetes tenemos instalados en nuestro ordenador.

library(foreign) o por el men: carga el paquete cluster.

O a partir del men desplegable:


Paquetes instalar paquetes
Paquetes- cargar paquete

Algunas funciones de inters

Paquete STATS:

hclust: Anlisis cluster jerrquico.


kmeans: cluster no jerrquico, k-medias.
aov: anlisis de la varianza.
princomp: Anlisis de componentes principales
lm: ajuste de un modelo lineal

Paquete MASS:

lda: anlisis discriminante


corresp: anlisis de correspondencias simple

Para ver todo lo que incluye un paquete:


help(package=STATS)
8

Ayuda (ejemplo)

help(mean) = ?mean

Estructura de la ayuda

Descripcin

Usage: cmo se emplea

Argumentos de entrada

Valores de salida

Rerefencias

See also: comandos que podran interesar

Ejemplo

No pedir ayuda de una funcin cuyo paquete no se ha cargado.

html help: keywords.


9

3. Manejo de objetos en R

Introduccin

Tipos de objetos

Atributos de los objetos

Operadores bsicos

10

Introduccin

Datos, variables, funciones y resultados en R son objetos

Los objetos se guardan en la memoria activa

Con el smbolo <- o con = asignamos los valores a los objetos

Los nombres de los objetos comienzan por letras (A-Z,a-z) y pueden


incluir letras, nmeros y puntos.

El comando ls() Lista los objetos en memoria


Ejemplos sencillos (desde R abrir script Sintaxis1.R)
x<-10 ;
y<-2 ;
z<-x*y
v<-c(2,4,6,8,10)
v1<-c(1:10)
v2<-rep(2,5)
v3<-c(v,v1,v2)
Nombre<-c(Mara,Pepe,Alex)
ls()

# Nmeros:
# Vector, numeric
# Vector, numeric
# Vector, numeric
# Vector, numeric
# Vector, character
11

Tipos de Objetos (datos, resultados)

Representacin ms habitual:

Vector

Factor

Matriz: todas las columnas son del mismo tipo (num,carac o log)

Data.frame: puede tener columnas de distinto tipo

Lista
Tipos de datos:

Numrico

Carcter

Lgico
Mas ejemplos sencillos:
A<-matrix(c(1,2,3,4,5,6),2,3)
[por defecto la rellena por columnas: byrow=FALSE]
B<-matrix(2,2,3)
data()
[lista de sets de datos hay en el sistema]
data(iris) [carga datos del sistema]

# Matriz
# Matriz
# Data.frame
12

Atributos de los objetos


length(v)
dim(iris)
nrow(iris)
ncol(iris)
class(v)
colnames(iris) [Muestra los nombres de columnas]
rownames(iris) [Muestra los nombres filas]
colnames(A)<-c(col1,col2,col3) [Asigna esos nombres a las
columnas]
A[,1] [Muestra la primera columna como si fuera un vector]
A$col1
A[2,] [Muestra fila 2]
A[1:2,] [Muestra las 2 primeras filas]
13

Operadores bsicos

Operaciones aritmticas con vectores


"
"
"
"
"
"
"
"
"

Operaciones aritmticas: +, -, *, /, ^, etc.


sum(), mean(), sd(), var()
quantile() [dara los percentiles: 0,25,50,100]
quantile(,probs=0.4) [dara el percentil especificado en probs]
median()
sqrt() [aplicara la raz cuadrada a todos los elementos]
range(); min(); max()
cumsum() [vector cuyo elementos son los valores acumulados del vector]
cummin(); cummax(), cumprod(), diff()

14

Operadores bsicos (Cont.)

Operaciones bsicas con matrices y data.frame


" t(X): traspuesta de X
" A%*%B: Multiplicacin de matrices
" A*B: Multiplicacin elemento a elemento
" inverse(X)
" cbind(A,B): Pega matriz B a la derecha de A (columnas)
" rbind(A,B): Pega filas
" apply(A,1,mean) [Aplica la funcin media a las filas (1) de A]
" apply(A,2,mean) [Aplica la funcin media a las columnas (2) de A]

15

4. Importar y exportar datos

Antes de importar o exportar datos puede ser


conveniente comprobar y, si preciso, cambiar de
directorio de trabajo usando los comandos: getwd
y setwd
getwd()

# visualiza el directorio de trabajo actual

setwd(C://Taller-R)

# cambia el directorio de trabajo

A partir del men desplegable: file - change directory.


16

Importar datos
"
"
"
"

read.table
read.spss
read.dta ()
read.xls

()

para ficheros .txt


para ficheros SPSS
para ficheros STATA
para ficheros EXCEL

Ejemplos
colegio<-read.table("colegio.txt",header=T,sep=)
coches<-read.spss(comercios.sav",to.data.frame =TRUE)
fix(colegio)
fix(comercios)
()

Para su uso es necesario cargar el paquete foreign


http://cran.r-project.org/src/contrib/PACKAGES.html#foreign
17

Exportar datos
"

write.table

para exportar tablas

Ejemplo
write.table(A,file=matriz-A.txt)

18

Guardar objetos
"

save()

[Guarda el objeto especificado en un archivo de R]

"

load()

[Recupera el objeto guardado con save]

"

save.image()

[Guarda todos los objetos]

Al terminar una sesin R pregunta si queremos guardar la


sesin de trabajo. Si indicamos que s se guardarn dos
ficheros:

19

5. Anlisis exploratorio
Grficos univariantes
Diagrama de sectores: pie(table(x))
Diagrama de barras: barplot(table(x))
Histograma: hist(x)
Grfico tallo y hojas: stem(x)
Grfico caja y bigotes: boxplot(x)

20

10

25

Notable

20

Aprobado

10

15

Sobresaliente

Suspenso
Aprobado

Notable

Sobresaliente

Suspenso

90
80
70

8 10

60

50

4
2
0

Frequency

14

Histogram of colegio$peso

40

50

60

70

80

90

Chico

Chica

colegio$peso

5. Anlisis exploratorio
Estadsticos descriptivos
Media: mean(x)
Mediana: median(x)
Varianza: var(x)
Desviacin tpica: sd(x)
Recorrido intercuartlico: IQR(x)
Percentiles: quantile(x)
Percentil 80: quantile(x,probs=0.8)
summary(x)

22

11

6. Inferencia clsica para la media


t.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)
Media de una poblacin
t.test(x, mu=6)
Diferencia de medias de dos poblaciones independientes
t.test(x~y,var.equal=T)
var.test(x~y) # Para comprobar que se da la igualdad de varianzas
Diferencia de medias de dos poblaciones dependientes
t.test(x~y,paired=T)
23

7. R-commander
Interfaz grfica que permite llevar a cabo muchas de las funciones
estadsticas mediante ventanas.
Para abrir R-comander: library(Rcmdr)
Para realizar los grficos vistos anteriormente:

24

12

7. R-commander-documentacin
http://knuth.uca.es/ebrcmdr

25

13

Вам также может понравиться