Академический Документы
Профессиональный Документы
Культура Документы
FACULTAD DE CIENCIAS
PRESENTA
CURSO-TALLER
“ESTADISTIMATICA R”
(MODELIZACION ESTADISTICA-INFORMATICA CON R)
ESPOCH 2015-2016
Dr. Jorge Congacha
OBJETIVOS DEL CURSO-TALLER
APRENDER CÓMO PROGRAMAR EN R Y CÓMO USAR RStudio PARA REALIZAR UN ANÁLISIS DE DATOS EFICAZ.
Duración
48 Horas con cuatro módulos y cada módulo de 12 horas
divididas en
8 horas presenciales (HP) y 4 horas de trabajo individual (HTI)
Aval
FIMA-ESPOCH
Presentación y objetivos
La Estadística es una rama de las Matemáticas que trata recopilar,
representar, analizar (o modelizar) e interpretar datos, con la
finalidad de ayudar a tomar decisiones (o formular predicciones) y
sacar conclusiones. Muchos docentes-investigadores y estdiantes
de la ESPOCH que dominan su especialidad presentan dificultades
en la parte estadística, lo cual ha repercutido a que la
investigación sea vista como una actividad poco accesible.
Por tanto, el objetivo de este curso-taller es la adquirir y fortalecer
la Estadística Matemática(Descriptiva-Probabilidades-Inferencial) y
conocer herramientas metodológicas de R que posibiliten la
aplicación correcta de las técnicas estadísticas en las distintas
etapas de la investigación científica. El curso-taller combinará
conocimientos teóricos con aplicaciones prácticas, utilizando el
software estadístico libre R.
Veamos con las siguientes actividades de aprendizaje(AA) lo dicho y tengamos de manera sucinta
presente que “R es un lenguaje y un entorno para efectuar cálculos estadísticos y análisis gráficos, de
distribución libre con un costo de cero dólares.
AA1: crear 2 vectores e imprimirlos(x <- 1:50 e y <-rnorm(50)). Además calcular con comandos algunas
estadísticas descriptivas y realizar un diagrama de dispersión con el comando plot(x,y) y mejorar su
presentaciòn.
AA2: Con los comandos dados del paquete “graphics” poner colores y llamarla a esta grafica “la
alfombra guaneña”. ¿Aprecia la potencialidad de R?
¿Qué es R?
R es un sistema para análisis estadísticos y gráficos creado por
Ross Ihaka y Robert Gentleman.
R tiene una naturaleza doble de programa y lenguaje de
programación.
R se distribuye gratuitamente bajo los términos de la GNU General
Public Licence; su desarrollo y distribución son llevados a cabo
por varios estadísticos conocidos como el Grupo Nuclear de
Desarrollo de R.
R está disponible en varias formas: el código fuente escrito
principalmente en C (y algunas rutinas en Fortran),
esencialmente para máquinas Unix y Linux, o como archivos
binarios pre compilados para Windows, Linux , Macintosh y Alpha
Unix.
Los archivos necesarios para instalar R, ya sea desde las fuentes o
binarios pre-compilados, se distribuyen desde el sitio de internet
Comprehensive R Archive Network (CRAN) junto con las
instrucciones de instalación.
¿Qué hace R?
R posee muchas funciones para hacer análisis estadísticos y
gráficos.
Las entidades que manipula R se llaman Objetos. Por ejemplo: variables, datos,
arreglos, etc. Los vectores de números reales o complejos; lógicos o caracteres se
guardan en la memoria de la computadora en forma de objetos, con un nombre en
específico. El usuario puede modificar o manipular estos objetos por medio de
operadores (aritméticos, logicos) y funciones (otros objetos). Este tipo de objetos se
denominan “estructuras atómicas”, puesto que son del mismo tipo bien sea numeric,
complex, logical o character. R también maneja objetos denominados listas y pueden
ser de cualquier tipo y/o combinado.
> A <- 1
>A=1
> assign(“A”, 1)
>A
[1] 1
Los nombres pueden usar dígitos, caracteres alfanuméricos y
“.”, “-”.
Los nombres pueden empezar con “.” o letras, si empieza
con “.” el segundo caracter no debe ser un dígito.
> a <- 1:10 # a es un vector que contiene los 10 primeros
naturales y es un vector u objeto diferente a A, R es sensible.
>b <- c(49,49,19,16,13) # otro vector llamado b y se le asigna
las edades de los miembros de la familia Congacha-Ortega.
ASPECTOS IMPORTANTES DE R
(para empezar)
I. Manejo Estadístico de datos
en R
II. Importando R exportando
datos en R
III.Gráficos en R
IV.Programación en R
I. Manejo Estadístico de
datos en R
1) Tipos de objetos
2) Operaciones aritméticas
3) Generación de secuencias
4) Acceso a elementos
5) Ordenación
6) La familia apply
1) Tipos de objetos 1/4
vector Colección ordenada elementos del mismo tipo.
> x <- c(1, 2, 3); y <- c("a", "b", "Hola"); v1 <- c(TRUE, TRUE, FALSE)
> #¿Qué tipo de datos son: x, y , v1?
funciones Código.
1) Tipos de objetos:
Atributos de los objetos 3/4
x <- 1:15; length(x)
y <- matrix(5, nrow = 3, ncol = 4); dim(y)
x<- 1:10
y<-rnorm(10)
z<- c(2,3)
x+y;x-y;x*y;x/y;x^¨2;x^z¿Cómo esta funcionando R?
sum(x);prod(y);max(z);min(x);sqrt(z)
c(2, 3,1) + c( 3, 4, 5)
c( 2, 3 ,5) + c( 3, 4, 5, 8 ) ¿Cómo esta funcionando R?
#Número complejo z1 = a +bi, a y b números reales, todo
Número real es un numero complejo ¿por qué?
sqrt(-9+0i), #¿que resultado obtiene?
Secuencias
1 : 30 = c( 1, 2, ..., 29, 30) #¿son equivalentes?
#Tiene la mayor prioridad en una expresión
1: n – 1 o 1 : ( n - 1 )
#Explique estos resultados
seq ( 2,15)
seq(2,15,3)
#Explique estos resultados
rep(5,8)
rep(“NO”,8)
#Explique este resultado
x<-1:10;x
x>5
# ¿Qué resultados obtuvo?
#¿que clase de datos se generaron?
Los vectores deben tener todos los valores del mismo tipo.
(numéricos, complejos, lógicos o caracteres),la misma longitud.
mode(objeto) o class(objeto)
length(objeto)
Investigar
La función as, puede cambiar el modo de un objeto
Por ejemplo sea x el objeto o vector (Carlos,Juan,Maria,
Susy) cambie a valores numericos (1,2,3,4)
as.numeric( x )
¿Qué obtuvo?
PROHIBIDO OLVIDAR
Aplique en las actividades de
aprendizaje propuestas
Actividad de aprendizaje
Con el vector n genere las operaciones que se le solicita:
#n son promedios de la segunda prueba parcial de 6
estudiantes del cuarto nivel de la escuela FIMA-ESPOCH.
n<- c(9.5, 8.7, 6.2, 7.5, 6, 10)#En R el punto es separador
decimal
Promedio
Desviación estandard
longitud del vector
Vector ordenado de mayor a menor
¿Qué clase de vector(objeto) es n? ¿class o mode es igual?
¿Qué clase de objetos son: a <- 1:10; b>5; raíz cuadrada de -
-100; h <- rep(“M”,10)
Genere 10 veces M y 6 veces F
MAS DE R
Lista, es un objeto que consiste de una colección ordenada de objetos conocidos
como componentes.
Por ejemplo:
Lista <- list(esposo=“Jorge”, esposa=“Miriam”, No.de.hijos=3, edad.hijas=c(19,17,13)).
Matrices
Las matrices o arreglos multidimensionales, son vectores con un vector de dimensión
NO NULO
> V <- runif(100)
> dim(V) <- c(10, 10, 1)
> V#Matriz de 10 filas y 10 columnas
#¿Qué dimension tiene V?
m <- matrix(2,3,4);m;#¿cómo es la matriz m?
x <- 1:10
m1 <- matrix(x,2,10);m1
#¿cómo se formo la matriz m1?
Resp. Con los elementos del vector x se forma la matriz m1 de 2 filas y 10 columnas
> m3 <- array(1: 20, dim = c(4, 5));m3
#¿cómo es la matriz m3?
> m4 <- array(c(1:3, 3:1), dim= c(3, 2));m4
#¿cómo es la matriz m4?
Data.frame
#Ahora introducimos un data.frame(matriz de datos)