Академический Документы
Профессиональный Документы
Культура Документы
¿Qué es RStudio?
RStudio es una interfaz que permite acceder de manera sencilla a toda la potencia de
R, para utilizarRStudio se requiere haber instalado R previamente. ... Es un lenguaje
de programación completo con el que se añaden nuevas técnicas mediante
la definición de funciones.
¿Qué es Hadoop?
Hadoop es un sistema de código abierto que se utiliza para almacenar, procesar y
analizar grandes volúmenes de datos; cientos de terabytes, petabytes o incluso más.
Como hemos visto anteriormente Big Data es una de las herramientas que
revolucionaran al mundo por medio del estudio y chequeo de la información masiva
que siempre ha estado presente en nuestras vidas pero que no alcanzamos o logramos
percibir como lo hace este tipo de tecnología haciendo más óptimo y eficiente el
desenvolvimiento en tareas o trabajos refinando el mas mínimo detalle conforme pasa
el tiempo.
Pre-requisitos para la instalación de Rstudio (RBase)
Para poder instalar RStudio se requiere instalar de RBase es una paquetería que sirve
como base (como su nombre lo dice) para la instalación de dicho software en la imagen
anterior se ejecuta el instalador de este.
En esta parte de la instalación también nos dira si queremos agregar algún acceso
directo.
Aquí se mostrara el proceso de la instalación.
Instalación de JAVA
Para la instalación de JAVA necesitas ejecutar los siguientes comandos
en la terminal:
java -version
Instalación de Hadoop
Ingresamos a la pagina oficial de Hadoop (Apache):
http://hadoop.apache.org/releases.html
nos generara un enlace el cual tenemos que bajar con el comando wget
wget http://www-eu.apache.org/dist/hadoop/common/hadoop-2.8.4/hadoop-2.8.4.tar.gz
sudo su hduser
pass: hadoop
cd
cd ~
tar xzf hadoop-2.8.4.tar.gz
mv hadoop-2.8.4 hadoop
nano HADOOP_HOME/etc/hadoop/hadoop-env.sh
hadoop/etc/hadoop/core-site.xml:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
hadoop/etc/hadoop/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
yarn-site.xml
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
http://127.0.0.1:8088/cluster
Conclusión
Con estos pasos podemos guiarnos y realizar la instalación correcta de estos softwares
que son muy necesarios para el procesamiento de datos masivos los pasos son
relativamente simples algunos son un poco complicados, pero es necesario seguirlos
para que a la hora de ocupar de estas herramientas podamos realizar los proyectos
que se requieran sin ningún problema es recomendable buscar la información en ingles
ya que suele estar más actualizada.