Академический Документы
Профессиональный Документы
Культура Документы
Para la presente guía se va realizar una instalación de Apache Spark versión 1.6.0 en el sistema
operativo Ubuntu versión 16.04
$ wget http://www.scala-lang.org/files/archive/scala-2.11.7.deb
$ sudo dpkg -i scala-2.11.7.deb
$ wget http://d3kbcqa49mib13.cloudfront.net/spark-1.6.0.tgz
$ tar xvf spark-1.6.0.tgz
El código de arriba permite descargar el paquete necesario de Apache Spark en el
directorio home.
10. Ahora se define las variables de entorno en el sistema operativo correspondientes a Spark
y a Pyhton
export SPARK_HOME='/home/rsk/spark-1.6.0'
export PATH=$SPARK_HOME:$PATH
export PYTHONPATH=$SPARK_HOME/python:$PYTHONPATH
11. Por ultimo ya podemos utilizar spark tranquilamente y poder trabajar en este caso con
phtyon
Instalación de Nodos en Apache Spark
Antes de realizar la instalación de los nodos se debe considerar lo siguiente que el nodo Master y
los nodos Slaves deben estar en la misma red y se tiene que habilitar SSH sin contraseñas (Secure
Shell) para Spark master en los Spark Slaves (este paso solo es necesario para habilitar el inicio de
sesión remoto para las acciones de inicio y apagado del daemon esclavo).
2. Generar el acceso remoto por ssh entre el/los esclavos frente al master
2.1. Generar la nueva llave publica en el nodo master y esclavo.
ssh-keygen
Al finalizar este proceso se genera automáticamente las claves ssh en el nodo master y
esclavo.
2. Ahora definida la ip del master se ejecuta en el siguiente comando para que la maquina
inicialice en modo master:
./sbin/start-master.sh
3. Para verificar que el nodo trabaja correctamente ingresamos en el browser la siguiente url
<ip:8080> el cual le abrirá la consola de administración del nodo master:
./sbin/start-slave.sh <master-spark-URL>
4. Para verificar que el nodo trabaja correctamente ingresamos en el browser la siguiente url
<ip:8081> el cual le abrirá la consola de administración del nodo slave: