Академический Документы
Профессиональный Документы
Культура Документы
FACULTAD DE INGENIERIAS
INGENIERÍA DE SISTEMAS
03-10-2018
2
Tabla de Contenido
Pág
1. Introducción ........................................................................................................................3
2. Objetivos……………………………………………………………………………....…..4
3. Desarrollo……………………….………………………………………………….……...5
4. Conclusiones……………………………………………………………………….…….15
5. Bibliografía………………………………………………………………………………19
3
1. Introducción
ideal es que las soluciones sean orientadas a problemas que impacten a una gran población en
general.
que el estudiante y profesional desarrolle un alto grado investigativo con el fin de aportar
soluciones innovadoras.
El presente Paper fue realizado para la “Conferencia Internacional sobre Ingeniería de datos”
En la actualidad las organizaciones se han vuelto más exigentes con relación a las aplicaciones
empresariales, requieren que los cálculos de los informes de datos transacciones se realicen en
menos tiempo o al mismo tiempo que muchos usuarios transaccionales puedan trabajar.
Para lograr esto, un motor de columna explota el hardware moderno (núcleos de CPU múltiple,
datos requeridas para las aplicaciones empresariales, por ejemplo, estructuras de datos
empleados en la base de datos de SAP HANA para poder operar en computación en memoria.
4
2. Objetivo
3. Desarrollo
para todas las organizaciones. Los datos se introducen en lotes o por registro a través de
múltiples canales, tales como los sistemas de planificación de recursos empresariales (por
Tras una inspección más de cerca, un proceso de ventas supuestamente sencillo exhibe
lotes de producción, así como comparar el inventario resultante con la demanda de los
clientes. Del mismo modo, una organización de ventas estaría interesado en medidas
procesamiento analítico en línea (OLAP). tareas periódicas, tales como el cierre final del
Además, las aplicaciones analíticas requieren lógica de procedimiento, que no puede ser
expresado con SQL normal, por ejemplo, el número de ventas de agrupamiento de los
transferir todos los datos necesarios de la base de datos de la aplicación y procesarlo allí.
Por lo tanto, los datos optimizado las estructuras y los metadatos no pueden ser utilizados
y los resultados intermedios tienen que ser transferidos de nuevo a la base de datos si son
Idealmente, una base de datos deberá ser capaz de procesar todas las cargas de trabajo
(H.Plattner).
Esta observación provocó el desarrollo de la base de datos de SAP HANA (SAP HANA
se basa en el motor de texto SAP TREX (Sanders) y la BI Accelerator SAP (SAP BIA) ,
la SAP HANA DB originó a partir de la tecnología probada del sistema de base de datos
duradero. A partir de hoy, el SAP HANA DB está disponible comercialmente como parte
lógica de aplicación específica analítica. En la sección 3.2 se describe la forma del SAP
discute cómo abordamos los desafíos en las cargas de trabajo transaccionales en los
Una ventaja clave de la SAP HANA DB es su capacidad para ejecutar negocios y lógica
de la aplicación en el interior del núcleo de la base de datos. Para ello, el motor de cálculo
proporciona una abstracción de los planes de ejecución lógicos, llamados modelos de
cálculo.
Por ejemplo SQLScript, un lenguaje declarativo y optimizable para expresar la lógica de
aplicación como datos de flujos o usando la lógica de procedimiento, se compila en
modelos de cálculo. Siguiendo esta ruta, múltiples idiomas de dominio específico pueden
ser apoyados tan alto como un compilador genera la representación intermedia modelo de
cálculo.
Las primitivas de un modelo de cálculo constituyen un plan de ejecución lógica que
consiste en un conjunto de datos acíclicos la gráfica con nodos que representan los
operadores (operaciones plan) y bordes reflejando los datos de flujo (datos de plan). Una
clase de operadores implementa los operadores relacionales estándar como unirse y
selección.
Además, el SAP HANA DB es compatible con una gran variedad de operadores
particulares de aplicación de los componentes de aplicaciones específicas en el núcleo de
la base de datos. Casi todos estos operadores sólo son capaces de acelerar el
10
valor entero (la valueID). Estos valueIDs son más bit-embalado y comprimido. Al
recurrir las filas de una tabla, la compresión más beneficioso (por ejemplo, la
columnas de esta tabla se puede utilizar [11, 12]. La compresión de datos no sólo permite
mantener más datos en un solo nodo, sino que también permite un procesamiento más
rápido de consulta, por ejemplo, mediante la explotación del RLE para calcular los
agregados.
Ya que las actualizaciones individuales son caros en la disposición descrita, cada mesa
tiene un almacenamiento de Delta, que está diseñado para equilibrar entre las altas tasas
las mesas están bloqueadas, las operaciones de escritura son redirigidos a un nuevo
almacenamiento delta cuando el proceso de fusión delta comienza. Hasta que esté
terminado, lea las operaciones de acceso nuevo y viejo de almacenamiento delta, así
operaciones de agrupación escala casi linealmente con el número de hilos hasta que se
pueden entonces ser asignados a diferentes nodos en el paisaje [10]. Los operadores
si ellos posible-ejecuta en el nodo que contiene los datos. En caso de cambio de carga de
Si bien es claro que la columna-tiendas funcionan bien para las cargas de trabajo OLAP,
también sostienen que hay varias razones para considerar la columna-almacén para las
personalizable como SAP ERP, no se utilizan muchas columnas, y por lo tanto sólo
contienen valores por defecto o no hay valores en absoluto. Del mismo modo, algunas
columnas suelen tener un pequeño dominio, por ejemplo, la eficiencia del estado AGS.
En ambos casos, la compresión es muy eficiente, lo cual puede ser una ventaja decisiva
más pequeño, por lo que se requiere número pequeños nodos. Además, la compresión
2) las cargas de trabajo transaccionales del mundo real tienen grandes porciones de las
operaciones de lectura que los puntos de referencia estándar como TPC-C lo define. Por
ser más apropiado para cargas de trabajo OLTP que el sugerido por los puntos de
referencia.
actualiza una fila existente, la versión actual es invalidada y una nueva versión se añade.
Este esquema es más simple que las actualizaciones en-sitio, ya que no requiere ni
nos permite tener índices única para las claves principales, columnas con restricciones
pequeñas particiones de hasta unos cientos de miles filas. Las ventajas son un diseño de
Además de estas ventajas intrínsecas de la columna-tiendas para OLTP, hay varios retos
de los datos de la columna. A pesar de que permite una definición de patrón de acceso de
datos más de grano fino, que puede resultar en una sobrecarga de rendimiento
significativo para asignar la memoria por columnas para manejar un gran número de
columnas, por ejemplo en la construcción de una sola fila de resultado que consta de 100
memoria para múltiples columnas en una sola, cada vez que ayuda a reducir la sobrecarga
de rendimiento.
Como un reto importante, vemos que en las aplicaciones ERP, un número considerable de
cambios se realiza simultáneamente. En contraste con los almacenes de datos, donde las
En este documento se resumen los principios que guían el diseño y la implementación del
utilizando un motor de columna es el enfoque más prometedor para hacer frente a las
simple del diseño base de datos física y el consumo de memoria reducida. Para mantener
aún más la enorme cantidad de datos producidos por las aplicaciones empresariales de
Como resultado.
Sin embargo, una columna de almacenar en memoria apoyar la distribución plantea una
4. Conclusiones
máquina.
Este trabajo sobre el paper abre la mente del estudiante y futuro profesional en
pensar diferente sobre todas las posibles ramas de la ingeniería que se puede
enfocar.
17
5. Bibliografía
Trabajos citados
[1] DJ Abadi, S. M. (s.f.). Columna-Tiendas vs. fila Tiendas-: ¿Qué tan distintos son ellos De
Verdad? SIGMOD.
[10] T. Legler, W. L.-c.-7. (s.f.). La minería de datos con el acelerador de BI de SAP NetWeaver.
VLDB.
[10] T.Legler, W. a. (s.f.). DataMiningwiththeSAPNetWeaverBIAccelerator. VLDB.
[3] S. Chaudhuri, U. D. (s.f.). Una visión general de la tecnología de Business Intelligence.
MCCA.
American National Standards Institute. (Reaffirmed 9 December 2009 ). Estandares IEEE para
el Aseguramiento de la calidad del software.
EEEI. (s.f.). THE SAP HANA DATABASE - AN ACHITECTURE OVERVIEW.
H.Plattner, [. (s.f.). ACommonDatabaseApproachforOLTPandOLAPUsinganIn-
MemoryColumnDatabase. SIGMOD.
Pressman, R. S. (1998). Ingenieria de Software "Un enfoque Practico" . Madrid: Concepción
Fernández Madrid.
Roldos, E. X. (2012). http://calidadtes.blogspot.com. Obtenido de http://calidadtes.blogspot.com:
http://calidadtes.blogspot.com
Sanders, [. F. (s.f.). Engineering Basic Algorithms of an In-Memory Text Search Engine.
ACMTOIS.
SAP. (s.f.). https://support.sap.com. Obtenido de https://support.sap.com:
https://support.sap.com
significados.com. (s.f.). Obtenido de www.significados.com: www.significados.com
Song, [. S. (s.f.). TIEMPO: DBMS OLTP altamente escalable para administrar Stream-intensivo
de actualización Carga de trabajo. 1033-1034.
wikipedia. (s.f.). es.wikipedia.org. Obtenido de wikipedia: https://es.wikipedia.org