Вы находитесь на странице: 1из 11

Conociendo R (I)*

Deybi Morales Len (Universidad Centroamericana UCA) 15/07/12

Este documento es parte de una coleccin de tutoriales elaborados para Grupo de Usuarios R de Nicaragua. R es un software estadstico (libre) de licencia GNU. Puede descargarlo desde http://www.rproject.org. En la elaboracin de este tutorial se ha hecho uso solo de softwares libres: Ubuntu, L X, Latex, LibreOce y R. Apoyamos Y el uso del software libre para los pases en vas de desarrollo.

1.

Qu es R?

R es un software estadstico con licencia GNU. Muchos lo consideran como la sintaxis que conforman el lenguaje R. El lenguaje R tuvo su origen del lenguaje S potente en operaciones estadsticas. A diferencia del lenguaje S, R no es comercial pero son dos lenguajes ms utilizados en las investigaciones acadmicas, convirtindose R en una potente alternativa libre de lenguajes estadsticos como Stata, SAS, Matlab , SPSS

2 y de lenguajes econmetricos como Eviews3 .

Comparacin entre Eviews, Stata, SPSS y R


Potencia Eviews SPSS Stata R Dicultad de uso Baja Baja Media Alta

Precio Alto Muy alto Medio/alto Gratuito

Uso prioritario Aplicacin a la modelizacin economtrica Docencia/profesional Investigacin aplicada Investigacin bsica y aplicada

Alta Alta Muy alta Mxima

La potencia de R es mxima pero esto va acorde de su dicultad alta porque no posee botones y menus que abarquen todas sus funciones. Pero esta dicultad

su alternativa libre directa se conoce como Octave 2 Una alternativa libre directa se llama PSPP 3 Una alternativa libre directa se llama Gretl 4 Muoz, Jordi. Curso de Introduccin a Stata
1

* Revisiones: 12/07/12, 15/07/12 & 18/07/12 1 No es un lenguaje meramente estadsticos,

se vence una vez cruzada su curva exponencial de aprendizaje de los aspectos bsicos de su lenguaje de programacin, con un gua o tutor vencer esa curva se puede hacer en menos de una semana. Es recomendarble crear script durante cada sesin de trabajo. Esto permite explotar al mximo su capacidad de programacin. Se debe destacar que las revistas especializadas de investigaciones cientcas solicitan los archivos que contienen la sintaxis de programacin utilizadas en el programa estadsticos de preferencia. R permite que su desarrollo sea trabajado por millones de usuarios alrededor del mundo. Actualmente es apadrnado por un extenso nmero de universidades alrededor del mundo, conformndose grupos de investigadores que utilizan R para las distintas ramas de las ciencias creando paquetes para automatizar un conjunto de rutinas. En esta redaccin R cuenta con aproximadamente 4000 paquetes que expanden su operaciones estadsticas, matemticas y capacidades grcas. Los creadores de esta obra maestra fueron Robert Gentleman y Ross Ihaka del Departamento de Estadstica de la Universidad de Auckland en 1993 crearon R. Pero ahora su desarrollo actual es responsabilidad del R Development Core Team quienes han creado todo un proceso para mantener la calidad profesional de R. La primera versin estable de R vi la luz en el ao 2000

7 poniendo a R en

una experiencia de desarrollo estable de 13 aos. En la actualidad sale una nueva versin de R cada dos meses incluyendo la mejora de los paquetes lo que lo convierte en el software que va a la mano de los nuevos descubrimientos estadsticos aplicados a las distintas ciencias. Debemos recordar que el lenguajes y entorno de programacin de R facilita al usuarios crear las funciones que le son demandadas. Para explotar la capacidad de R es necesario hacer uso de su lenguaje de programacin. El usuario menos exigente puede hacer uso del paquete Rcmdr que agrega una interface compuesta de men para rutinas comunes.

Caractersticas de R
R nos proporciona de muchas herramientas estadsticas (modelos lineales y no lineales, tests estadsticos, pruebas hiptesis anlisis de series temporales, algoritmos de clasicacin y agrupamiento, etc.) y grcas. R puede personalizarse segn las necesidades de cada usuario existen un conjunto de paquetes que son agrupados segn las temticas: Econometra, Finanzas, clculos, etc.

la redaccin de este documento R est en su versin 2.15. Estamos por recibir la versin 2.16 es una gran ventaja poder disponer en pocos minutos sin gastos de licencia de la ltima versin.

7A

R posee un potente lenguaje de programacin que permite al usuario crear sus propias funciones. Es muy parecido al c++ y el usuarios avanzado puede manipular R desde ese entorno de programacin. R trabaja con objetos, los objetos son creados por usuarios cuando este nombra las salidas, indicadores y bases de datos. Esto evita volver a ejecutar rutinas repetitivas durante se est trabajando. R puede conectarse con bases de datos online. Actualmente R posee una conexin con la Base de Datos de Indicadores de Desarrollo del Banco Mundial. Tambin puede conectarse a software online como ggplot2 y googleVis teniendo la posibilidad de crear grcas dinmicas y profesionales. R puede trabajar para clculos numricos necesarios para lgebra lineal, adiciones, resolver ecuaciones, etc. Su limitante en esta rea puede vencerse ya que R puede hacer uso del lenguaje de clculos simblicos Yacas lo que permite expandir su capacidad de clculos con aplicaciones derivadas e integrales avanzadas. Esto lo vuelve una seria competencia para matlab en esta rea. Se ha trabajo R con la capacidad para integrarse a otros programas co-

A mo L T X para la creacin de informes, paquetes para elaborar informes E onlines, Excel para importar datos o hacer que Excel haga uso de las capacidades de R, Gretl para expandir sus capacidades economtricas con R, Yacas para expandir el clculo numrico de R, etc. Su capacidad de simulacin es extendida a distintas ciencias sociales, econmicas y naturales. R tiene el privilegio de tener abierta ms de una base de datos a la vez. Tambin tiene la opcin de guardar un archivo llamado Workspace que agrupa todas las bases de datos utilizadas durante la sesin de trabajo en R. Adems tiene la capacidad de guardar el historial de trabajo pudiendo recuperar en otra sesin de trabajo los objetos creados.

1.1. Grupo de Usuarios R Nicaragua.


Se ha conformado el grupo para Nicaragua que rene a estudiantes y profesionales que utilizan o desean aprender R en Nicaragua. Actualmente el grupo est compuesto de Estudiantes y licenciados de Economa que hacen uso de las herramientas economtricas y grcas. Fundadores del Grupo: Lic. Deybi Morales Len. Jeferson Ruz (Estudiante investigador)

Lic. Octavio Martnez MSc. Jos ngel Morales Torres (Director del Departamento de Economa Aplicada UCA) El grupo cuenta de 240 miembros registrados. El grupo es administrado por: Lic. Jilber Urbina Lic. Deybi Morales Len Lic. Dennis Cceres Jeferson Ruz (Estudiante investigador) Lic. Ixchen Triguero El grupo realiza charlas y tutoriales como parte de las actividades. Trabajamos en la aplicacin emprica de R para Nicaragua y buscamos su certicacin en los prximos cursos. Se trabaja con bases de datos nacionales obtenidas del INIDE, BCN, MAGFOR, MIFIC y dems instituciones estatales o privadas. Algunos objetivos del grupo son: Realizar cursos de R que atienda a las demandas del mercado laboral. Mejorar el nivel cuantitativo de la Carrera de Economa Aplicada de la UCA. Donar tutoriales impresos sobre R a la Biblioteca Jos Coronel Urtecho. Elaborar investigaciones econmicas aplicadas a Nicaragua. Expandir R a otras ciencias. Somos un grupo sin nes de lucro, cualquier apoyo al grupo Usuarios R Nicaragua, dirigirse a usuariosrnicaragua@groups.facebook.com o si tiene cuenta en facebook ingresa al grupo: https://www.facebook.com/groups/usuariosrnicaragua. .

1.2. Capacidades grca


Mapas para estadsticas espaciales. La capacidades de R se ha expandidos hasta los shapeles , haciendo uso de estos para presentar indicadores sociales directamente en los mapas. Permite

8 Son

archivos que contienen los croquis de los mapas de un pas especco

la posibilidad de encontrar clsteres, es decir concentraciones referente a un indicador econmico o social.

1.3. Grcas estadsticas


R permite desde la elaboracin de grcas sencillas hasta grcas profesionales. Entre la capacidad grcas tenemos grcos dinmicos, grcos de dispersin, pasteles, barras, lneas, etc. Algunos ejemplos empricos.

1.4. Intefaces conocidas


R es un lenguaje de programacin y tal es su importancia que su terminal o consola es la parte ms importante de sus interfaces. En Windows tenemos una interface por defecto que se compone de la consola, menu para guardar, copiar, abrir editor de script, instalar paquetes, ayuda, etc.

En Linux, R no tiene interface por defecto pero puede utilizarse R desde la terminal. El usuario que desee trabajar de manera amigable con R desde linux y an desde windows puede descargar e instalar Rcommander el mismo que se instala con el paquete Rcmdr, Tinn-R o Rstudio son editores especializado para R. Los cursos y charlas de R los realizamos desde Rstudio pero aun tiene ciertas limitantes como crear varias ventanas con grcos, introducir o editar bases de datos desde una ventana parecida a LibreOce Calc o Excel, etc. Aunque tiene ms ventajas tiles que desventajas en este y prximos tutoriales sealaremos cules comandos no son funcionales en Rstudio. Veamos las interfaces ms conocidas: RGui, la interface por defecto en Window.

Esta interface de window posee una ventana otante llamada consola que es la nica que necesita R para trabajar por medio de lneas de comandos. Por tal razn en linux, R puede trabajar directamente desde la terminal de linux ubuntu, fedora, debian, etc. R se ejecuta en estas terminales haciendo correr solo la letra R.

Rcommander, interface con menus similares a los que posee Stata, Eviews y Spss.

Se asemeja a Stata y SPSS porque agrega menu para realizar rutinas estadsticas y grcas, as se evita la aplicacin de comandos. Tinn-R, una interface con editor universal pero pensado para R.

Es una interface avanzada que permite al usuario acostumbrarse a la sintaxis de R ya que colorea y autocompleta. Rstudio, la interfaces para empezar a aprender programacin en R.

10

Un editor en la ventana superior izquierda para elaborar los scripts, los scripts son archivos guardados con extensin .R que poseen lineas de programacin elaborada por el usuario, tiles para guardar y recuperar procesos. Estos scripts se asemejan a program de Eviews y Do-File de Stata. Rstudio ha agregados algunas funcionalidades al editor como la capacidad de redactar informes en

A L T X, crear informes web, visualizar bases de datos, etc. E


El siguiente documento se llamar Introduccin R (II). Contendr una introduccin bsica a la programacin de R para ingresar bases de datos y manipular.
Comentarios y sugerencias para mejorar este documento: morales.economia@gmail.com

11

Вам также может понравиться