Вы находитесь на странице: 1из 12

305510364

Contenido
ANLISIS DE REQUERIMIENTOS...........................................................................2
ANLISIS DE FUENTES DE DATOS........................................................................2
ANALISIS FUNCIONAL.......................................................................................... 5
DISEO............................................................................................................... 6
Diseo del modelo conceptual.........................................................................6
Diseo del modelo lgico................................................................................. 7
Diseo del modelo fsico.................................................................................. 8
Arquitectura..................................................................................................... 9
Carga de Datos................................................................................................ 9
Informes......................................................................................................... 10

305510364

ANLISIS DE REQUERIMIENTOS
El anlisis realizado a partir de los requisitos dados nos permitir detectar los
siguientes hechos principales:
Media de temperaturas por estacin y/o comarca
Evolucin de las temperaturas por estacin y/o comarca
o Temperaturas medias (mximas y minimas)
o Temperaturas mximas
o Temperaturas mnimas
Media de precipitaciones mensual por estacin y/o comarca
Evolucin de las precipitaciones por estacin y/o comarca
Evolucin de la humedad relativa por estacin y/o comarca
Velocidad del viento media por estacin y/o comarca
Evolucin del viento y direccin por estacin y/o comarca
Media anual de temperaturas, precipitaciones y viento por estacin y/o
comarca
Evolucin de temperaturas, precipitaciones y viento por estacin y/o
comarca
Top ten de las comarcas con ms lluvia y humedad relativa
Top ten de las comarcas con menos lluvia y humedad relativa
Top ten de las comarcas con temperaturas ms altas
Top ten de las comarcas con temperaturas ms bajas

ANLISIS DE FUENTES DE DATOS


En los proyectos de Data Warehouse (DW), es necesario analizar las fuentes de
datos. De su anlisis puede desprenderse informacin clave para el xito, as
como la identificacin de los riesgos vinculados al mismo.
En nuestro caso de Diseo de un DW para la gestin y reutilizacin de
informacin meteorolgica no tenemos acceso a los interesados del proyecto.
Por tanto, utilizaremos el sentido comn y algunas suposiciones para el anlisis
de los datos.
Los objetivos para analizar estos ficheros son:
a) Identificar los campos de datos que contienen.
b) Identificar los campos de datos no relevantes y, por tanto, desechables.
c) Identificar los tipos de campo y si son opcionales (aceptan valores nulos).
Para esta prctica, contamos con los siguientes ficheros Excel como fuente de
los datos:
aec-214_20xx.xls
aec-217_20xx.xls
aec-925_20xx.xls

305510364
(Debera crearse una pequea rutina de lectura de los ficheros que leyese las
cabeceras de los ficheros para:
- indicarnos el tipo de fichero del que se trata y debe coincidir con el nombre del
fichero.
- indicarnos el ao de los datos del fichero y debe coincidir con el ao del nombre
del fichero.
Debemos posicionarnos sobre la fila (registro) con los nombres de las columnas y a
partir de ah comenzar la carga de datos.)

Estos ficheros se han proporcionado con el enunciado de la prctica. Los


principales aspectos que hay que destacar de cada uno de ellos son:
aec-925_20xx.xls: Fichero con informacin de los municipios (supongo
que todos los catalanes). El fichero es anual y suministrado por el
Institut Cartogrfic de Catalunya e Idescat a partir del padrn
municipal anual de habitantes. Se nos ha proporcionado 6 ficheros (6
aos).
- El nombre del fichero contiene informacin sobre el tipo de datos que
contiene aec-925_20xx.xls y sobre el ao aec-925_20xx.xls
- El fichero consta de una nica hoja con cabecera. Las cabeceras
tienen el mismo formato en todos los ficheros a partir de las
cabeceras de las columnas.
- Los ficheros constan de 946 registros (municipios). Este nmero
podr variar si se unen o crean municipios.
- Cada registro tiene 6 campos obligatorios (cuerpo)
- Los campos que se incluyen son:
Campo
Tipo Fichero
Ao Datos
Cdigo
Municipio
Comarca
Altitud
Superficie
Poblacin

Descripcin
Cul de los 3 tipos de fichero es
Ao de los datos del fichero
Cdigo
identificativo
del
municipio
Nombre del municipio
Nombre de la comarca
Altitud en metros sobre el nivel
del mar
Superficie del municipio en KM2
Nmero de habitantes segn
censo

A efectos de la prctica los campos Superficie y Poblacin son


irrelevantes. Para la carga inicial solo el ltimo fichero aec-925_2014.xls
es relevante.

aec-214_20xx.xls: Fichero con datos de temperaturas, Precipitaciones,


humedad y viento anuales de las comarcas catalanas. El fichero es anual
y suministrado por el Departament de Medi Ambient i Habitatge. Servei
Meteorolgic de Catalunya. Se nos ha proporcionado 5 ficheros (5 aos).
- El nombre del fichero contiene informacin sobre el tipo de datos que
contiene aec-214_20xx.xls y sobre el ao aec-214_20xx.xls

305510364
-

El fichero consta de una nica hoja con dos cabeceras: una para las
temperaturas y otra para las precipitaciones, la humedad y el viento.
Las cabeceras tienen el mismo formato en todos los ficheros a partir
de las cabeceras de las columnas.
Los ficheros constan de 41 registros (comarcas). Este nmero no
debera variar.
Cada registro tiene 8 campos obligatorios (cuerpo).
Los campos que se incluyen son:
Campo
Tipo Fichero
Ao Datos
Comarca
Estacin / Municipio
Altitud
Media Anual
Media mxima
Media mnima
Mxima Absoluta
Mnima Absoluta

Descripcin
Cul de los 3 tipos de fichero es
Ao de los datos del fichero
Nombre de la comarca
Nombre del municipio
Altitud en metros sobre el nivel
del mar
Temperatura Media anual
Temperatura
media
de
las
mximas
Temperatura
media
de
las
mnimas
Temperatura mxima del ao
Temperatura mnima del ao

El campo Altitud no sera necesario por estar ese dato Municipios.

aec-217_20xx.xls: Fichero con datos de precipitaciones anuales de las


comarcas catalanas. El fichero es anual y suministrado por el
Departament de Territori i Sostenibilitat. Servei Metereolgic de
Catalunya. Se nos ha proporcionado 5 ficheros (5 aos).
- El nombre del fichero contiene informacin sobre el tipo de datos que
contiene aec-217_20xx.xls y sobre el ao aec-217_20xx.xls.
- El fichero consta de una nica hoja con dos cabeceras: una para las
precipitaciones de Enero a Junio y otra para las precipitaciones de
Julio a Diciembre. Las cabeceras tienen el mismo formato en todos los
ficheros a partir de las cabeceras de las columnas.
- Los ficheros constan de 41 registros (comarcas). Este nmero no
debera variar.
- Cada registro tiene 8 campos obligatorios (cuerpo)
- Los campos que se incluyen son:
Campo
Tipo Fichero
Ao Datos
Comarca
Estacin / Municipio
Enero
Febrero

Descripcin
Cul de los 3 tipos de fichero es
Ao de los datos del fichero
Nombre de la comarca
Nombre del municipio
Precipitaciones del mes en milmetros
(mm3)
Precipitaciones del mes en milmetros
4

305510364

Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre

(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)

del mes en milmetros


del mes en milmetros
del mes en milmetros
del mes en milmetros
del mes en milmetros
del mes en milmetros
del mes en milmetros
del mes en milmetros
del mes en milmetros
del mes en milmetros

OBSERVACIONES:
1. La poblacin anual de los municipios no es relevante tenerla ao a ao
2. Habra que tener una media de temperatura por meses; temperatura max. y
mim. por meses y media de las temperaturas max. y min.
3. Lo mismo para el viento.
4. Lo mismo para las precipitaciones.
5. La humedad relativa es la media anual?
6. Aadira horas de sol mensuales u horas media de sol cada mes
7. Aadira temperatura del agua del mar por mes y a diferentes temperaturas
8. Aadira informacin sobre la contaminacin atmosfrica
9. Aadira informacin sobre la temperatura a diferentes altitudes.
10. Si un municipio no es estacin ese ao tendremos valores nulos en los datos
de los ficheros aec-214_20xx.xls y aec-217_20xx.xls.

ANALISIS FUNCIONAL
A continuacin, se describen los requerimientos funcionales para el diseo del
DW para la gestin y reutilizacin de informacin meteorolgica.
En trminos de la arquitectura funcional, tenemos:
Las fuentes de datos estn compuestas por tres (3) ficheros Excel.
La arquitectura puede estar formada por varios elementos que estarn
alojados en la misma mquina.
- Data Mart: vamos a considerar que se est creando un data mart
en lugar de un almacn de datos corporativo.
5

305510364
-

MOLAP: a partir de la informacin en el data mart, se crear cubo


multidimensional.

305510364

DISEO
Diseo del modelo conceptual
Describiremos a continuacin el modelo multidimensional conceptual que sirve
de base para el diseo y construccin del sistema. El modelo est compuesto
por dimensiones de anlisis (y los atributos correspondientes) y hechos
(conjunto de indicadores con sus dimensiones relacionadas).
Tambin se detalla la matriz de indicadores que recoge todos los indicadores,
hechos y dimensiones de anlisis de explotacin.
Del mdulo Diseo Multidimensional tenemos el concepto de Modelo
multidimensional que: representa la informacin de procesos de negocio
mediante un modelo compuesto de dimensiones y hechos.
- Dimensin: entidad que contiene informacin descriptiva sobre
elementos de negocio (temporalidad, geografa, productos, empleados,
clientes, etc.). Representa un punto de vista que utilizaremos en nuestro
anlisis.
- Hecho: conjunto de indicadores que miden un determinado evento de
negocio. Representa un tema objeto de anlisis.
- Mtrica: valor numrico que mide un hecho.
A partir del anlisis de requerimientos y del anlisis de fuentes de datos, se ha
identificado:
- Para el DW
HECHOS
Municipios

ATRIBUTOS
Cdigo
Municipio
Nombre
Municipio
Altitud

METRICAS
Estacin
(Si/No)
Poblacin

DIMENSIONES
Tiempo (ao)
Lugar (cdigo comarca)

Superficie

Debe crearse una tabla Comarcas para la carga inicial


Campo
Codigo
Nombre
-

Comarca
Tipo Dato
Nmero Entero
Cadena

Para el Data Mart Meteorologa

HECHOS
Temperaturas

ATRIBU
TOS

METRICAS

DIMENSIONES

Temp. media Anual


Temp. Mxima
Temp. Mnima

Tiempo (ao)
Lugar (cdigo municipio)

305510364
Media
Temp.
Maximas
Media
Temp.
Minimas
Mm lluvia
Acumulado ao
Humedad relativa
Velocidad
Direccin

Pluviometra
Viento

Tiempo (mes, ao)


Lugar (cdigo municipio)
Lugar (cdigo municipio)
Tiempo (ao)
Lugar (cdigo municipio)

Diseo del modelo lgico


Para cada hecho se han determinado sus atributos, mtricas y dimensiones.
HECHOS
h_municipios

ATRIBUTOS
cod_muni
nombre
altitud

HECHOS

ATRIBU
TOS

h_temperaturas

h_pluviometra
h_viento

METRICAS
estacion
poblacion
superficie

METRICAS

DIMENSIONES

med_anual
temp_max
temp_min
med_temp_max
med_temp_min
lluvia_mm
lluvia_acum_ano
humedad
Velocidad
Direccin

d_fecha_temp
d_municipio_temp

Y para las dimensiones


DIMENSIONES
d_fecha_muni
d_fecha_temp
d_fecha_lluvia
d_fecha_viento
d_municipio_temp
d_municipio_lluvia
d_municipio_viento
d_comarca

DIMENSIONES
d_fecha_muni
d_comarca

ATRIBUTOS
Ao
Ao
Ao, mes
Ao
Codigo municipio
Codigo municipio
Codigo municipio
Codigo comarca

d_fecha_lluvia
d_municipio_lluvia
d_fecha_viento
d_municipio_viento

305510364

Diseo del modelo fsico


En nuestras tablas de hechos existen varias referencias temporales. En lugar
de crear dimensiones temporales distintas, es mucho ms lgico crear dos
dimensiones temporales (ao y mes/ao). Podramos tambin crear una nica
dimensin fecha y en el proceso de ETL obtener ao y mes/ao segn fuera
necesario. Lo mismo ocurre para las dimensiones de Lugar. Por tanto:
Para la tabla de hecho de municipio, tendremos:
TABLA
h_municipi
os

CAMPOS
cod_mun Numero
i
Entero
nom_mu Cadena
ni
altitud
Numero
Entero
estacion
Cadena
poblacio
Numero
n
Entero
superfici
Numero
e
Decimal
d_fecha
Fecha
(nivel
ao)
d_comar
Numero
ca
Entero

HECHOS
h_temperatu
ras

h_pluviometr
a

h_viento

Clave
Primaria

Clave
fornea
Clave
fornea

CAMPOS
id_temp

Numero Entero

Clave Primaria

d_fecha
d_municipio
med_anual
temp_max
med_temp_max
med_temp_min
id_lluvia

Fecha (nivel ao)


Numero Entero
Numero Decimal
Numero Decimal
Numero Decimal
Numero Decimal
Numero Entero

Clave fornea
Clave fornea

d_fecha

Fecha (niveles mes y


ao)
Numero Entero
Numero Decimal
Numero Decimal

Clave fornea

d_municipio
lluvia_mm
lluvia_acum_an
o
humedad
id_velocidad

Numero Decimal
Numero Entero
9

Clave Primaria

Clave fornea

Clave Primaria

305510364
d_fecha
d_municipio
Velocidad
Direccin
DIMENSIONES
d_fecha
d_municipio
d_comarca

Fecha (nivel ao)


Numero Entero
Numero Decimal
Cadena

Clave fornea
Clave fornea

ATRIBUTOS
Ao, mes
Codigo municipio
Codigo comarca

Esto simplifica el modelo final con el que trabajaremos, al tener menos


dimensiones, y simplificar tambin los procesos de carga de dimensiones.

Arquitectura
La arquitectura de la solucin involucra sistemas externos. En un primer
momento solo estarn conectados los correspondientes a los datos de
meteorologa (ms los de municipios y comarcas). Los datos de estos sistemas
externos sern copiados peridicamente en un espacio de datos operacionales.
Desde este espacio, va procesos ETL, se cargar el data mart correspondiente
a meteorologa. En el futuro, se prev existan nuevas cargas de datos para
crear otros data mart o enriquecer el existente.
Habr tambin una capa de explotacin (lo lgico es que sea web) que permita
la consulta de informes, el anlisis y la visualizacin de los cuadros de mando.

Carga de Datos
Nos centraremos ahora en los procesos ETL (Extraccin, Transformacin y
Carga (Load). Lo que se desea es estructurar y acomodar los datos de las
fuentes de datos en el DW.
Los procesos ETL son manipulaciones de flujos de datos. Estos procesos deben
disearse teniendo en cuenta los siguientes factores:
Cmo debe cargarse de manera lgica la informacin, es decir, qu
debe cargarse primero y qu despus.
La ventana de tiempo disponible, hecho que puede condicionar lo que
debemos cargar.
Tipo de carga: inicial o incremental.
El proceso de carga del data mart se realizar en dos pasos:

Se realizar una carga inicial de las tablas maestras y de los datos que
se obtengan hasta ese momento (histrico).
Se realizar una carga incremental peridica de los datos fuente.

Desconocemos la ventana de tiempo, pero dado que los datos son en su


mayora anuales (algunos podran ser cargados mensuales) y su tamao es
reducido, no debera haber problemas.
10

305510364
Para cada tabla a cargar, sea de dimensiones o de hechos, existir un
procedimiento implementado en PL/SQL de Oracle que la alimentar.
El primer paso en la creacin de los procesos ETL es comprender qu procesos
son necesarios y en qu orden deben llevarse a cabo. En general, se siguen las
siguientes pautas:
Se identifica si los datos se deben cargar en un rea intermedia. En
nuestro caso, no es necesario.
Podemos diferenciar dos tipos de situaciones en nuestro caso
particular:
- Dimensiones con valores fijos ya conocidos, presentes en Excel y
que no van a cambiar en el tiempo (o no deberan). Estas
dimensiones son: comarca y municipio. Estos valores son
reducidos y se insertarn en la carga inicial en la base de datos.
- La dimensin fecha con valores no fijos que se extraern,
transformarn y cargarn mediante procesos ETL.
La tabla de comarcas debe cargarse ante que el resto de hechos. El
hecho de municipio debe cargarse a continuacin y antes del resto de
hechos.
Las dimensiones se cargan antes que las tablas de hecho.
Proceso ETL
Carga Comarcas

Carga dimensin fecha


Carga tabla de hechos
Municipio
Carga tabla resto de
hechos

Descripcin
Cargar todas las comarcas catalanas. Se realizar
directamente sobre la BBDD. Utilizaremos el
fichero aec-925_20xx.xls
Cargar la dimensin fecha por medio de un
proceso ETL
Cargar de la tabla de hechos municipio por medio
de un proceso ETL.
Cargar del resto de tablas de hechos por medio de
procesos ETL utilizando los ficheros Excel da
fuentes de datos

Informes
A continuacin, se muestra el diseo de cada uno de los informes que se
construir para dar respuesta a las necesidades de informacin solicitadas en
el enunciado. En color verde aparecen las dimensiones que paginarn la
informacin con un desplegable (selectivo combo box), en naranja las
dimensiones y atributos, y en azul los indicadores.
Cuadro de mando

El cuadro de mando estar basado en dos velocmetros que marcarn, de 0 a


100%, el rendimiento de los pilotos segn dos tipos de medida:
1)RendimientoGPporpiloto. Muestra el total de grandes premios ganados
por un piloto respecto al nmero de grandes premios disputados durante toda
su carrera deportiva en la Frmula 1.
2)Rendimientomundialporpiloto. Muestra el total de mundiales ganados
por un piloto respecto al total de aos en activo en la Frmula 1.

11

305510364
Tambin habr dos grficos evolutivos:
1)Evolutivoposicinpilotopormundial. Cuanto ms bajo sea el nmero,
mejor, ya que indica la posicin conseguida por un piloto durante toda su
carrera deportiva en la Frmula 1.
2) Evolutivo puntos piloto por mundial. Muestra los puntos conseguidos
por un piloto en cada mundial durante toda su carrera deportiva en la Frmula
1. Hay que tener en cuenta que el ao 2010 cambia el mtodo de puntuacin,
otorgndose muchos ms puntos por cada posicin conseguida en un gran
premio.
El piloto sobre el que se aplicarn estos velocmetros y grficos se seleccionar
mediante un selector desplegable. El desplegable no permitir la agregacin
por pas siguiendo la jerarqua del piloto:

A continuacin, pasamos al diseo fsico.

12

Вам также может понравиться