Академический Документы
Профессиональный Документы
Культура Документы
1
Marco Teórico
Apache Avro
2
Los primeros usos de Avro en Hadoop son para tener un formato de
serialización persistente en HDFS e intercambiar información entre los nodos
del clúster a través de la red.
snappy
gzip
deflate
bzip2
Definición de un esquema:
Apache Spark SQL puede acceder a los ficheros con formato Avro.
3
CASO DE ESTUDIO: Cambios en los Esquemas de Datos USMP
1. Contexto
2. Problemática
3. Diseño
4. Explicación
4
5. Conclusión
a. Permite la continuidad del negocio y el cambio dinámico
flexible de los esquemas de datos.
b. Ahorra tiempos en la programación ya que no hay que agregar
condicionales para tratar la data de manera diferente para
fechas anteriores y posteriores al cambio en los esquemas de
datos.
c. Por lo tanto, en resumen, la evolución del esquema ayuda a los
clientes más nuevos a leer formatos más antiguos al usar la
conversión de formato automático y también ayuda a los
clientes antiguos a suspender el procesamiento de manera
elegante hasta que se les haya permitido comprender formatos
más nuevos.
Bibliografia
5
APACHE. Apache Avro [en línea]. Los Ángeles: Apache Software Foundation
[citado 15 noviembre, 2018]. Disponible en internet:
BBVA. Big Data: ¿En qué punto estamos? [en línea]. Bogotá: BBVA [citado 715
Noviembre, 2018]. Disponible en internet:
ROUTLEDGE. Critical questions for Big data [en línea]. Cambridge: Danah Boyd &
Kate Crawford [citado 29 septiembre, 2013]. Disponible en internet: