Академический Документы
Профессиональный Документы
Культура Документы
Contenido
ANLISIS DE REQUERIMIENTOS...........................................................................2
ANLISIS DE FUENTES DE DATOS........................................................................2
ANALISIS FUNCIONAL.......................................................................................... 5
DISEO............................................................................................................... 6
Diseo del modelo conceptual.........................................................................6
Diseo del modelo lgico................................................................................. 7
Diseo del modelo fsico.................................................................................. 8
Arquitectura..................................................................................................... 9
Carga de Datos................................................................................................ 9
Informes......................................................................................................... 10
305510364
ANLISIS DE REQUERIMIENTOS
El anlisis realizado a partir de los requisitos dados nos permitir detectar los
siguientes hechos principales:
Media de temperaturas por estacin y/o comarca
Evolucin de las temperaturas por estacin y/o comarca
o Temperaturas medias (mximas y minimas)
o Temperaturas mximas
o Temperaturas mnimas
Media de precipitaciones mensual por estacin y/o comarca
Evolucin de las precipitaciones por estacin y/o comarca
Evolucin de la humedad relativa por estacin y/o comarca
Velocidad del viento media por estacin y/o comarca
Evolucin del viento y direccin por estacin y/o comarca
Media anual de temperaturas, precipitaciones y viento por estacin y/o
comarca
Evolucin de temperaturas, precipitaciones y viento por estacin y/o
comarca
Top ten de las comarcas con ms lluvia y humedad relativa
Top ten de las comarcas con menos lluvia y humedad relativa
Top ten de las comarcas con temperaturas ms altas
Top ten de las comarcas con temperaturas ms bajas
305510364
(Debera crearse una pequea rutina de lectura de los ficheros que leyese las
cabeceras de los ficheros para:
- indicarnos el tipo de fichero del que se trata y debe coincidir con el nombre del
fichero.
- indicarnos el ao de los datos del fichero y debe coincidir con el ao del nombre
del fichero.
Debemos posicionarnos sobre la fila (registro) con los nombres de las columnas y a
partir de ah comenzar la carga de datos.)
Descripcin
Cul de los 3 tipos de fichero es
Ao de los datos del fichero
Cdigo
identificativo
del
municipio
Nombre del municipio
Nombre de la comarca
Altitud en metros sobre el nivel
del mar
Superficie del municipio en KM2
Nmero de habitantes segn
censo
305510364
-
El fichero consta de una nica hoja con dos cabeceras: una para las
temperaturas y otra para las precipitaciones, la humedad y el viento.
Las cabeceras tienen el mismo formato en todos los ficheros a partir
de las cabeceras de las columnas.
Los ficheros constan de 41 registros (comarcas). Este nmero no
debera variar.
Cada registro tiene 8 campos obligatorios (cuerpo).
Los campos que se incluyen son:
Campo
Tipo Fichero
Ao Datos
Comarca
Estacin / Municipio
Altitud
Media Anual
Media mxima
Media mnima
Mxima Absoluta
Mnima Absoluta
Descripcin
Cul de los 3 tipos de fichero es
Ao de los datos del fichero
Nombre de la comarca
Nombre del municipio
Altitud en metros sobre el nivel
del mar
Temperatura Media anual
Temperatura
media
de
las
mximas
Temperatura
media
de
las
mnimas
Temperatura mxima del ao
Temperatura mnima del ao
Descripcin
Cul de los 3 tipos de fichero es
Ao de los datos del fichero
Nombre de la comarca
Nombre del municipio
Precipitaciones del mes en milmetros
(mm3)
Precipitaciones del mes en milmetros
4
305510364
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
Precipitaciones
(mm3)
OBSERVACIONES:
1. La poblacin anual de los municipios no es relevante tenerla ao a ao
2. Habra que tener una media de temperatura por meses; temperatura max. y
mim. por meses y media de las temperaturas max. y min.
3. Lo mismo para el viento.
4. Lo mismo para las precipitaciones.
5. La humedad relativa es la media anual?
6. Aadira horas de sol mensuales u horas media de sol cada mes
7. Aadira temperatura del agua del mar por mes y a diferentes temperaturas
8. Aadira informacin sobre la contaminacin atmosfrica
9. Aadira informacin sobre la temperatura a diferentes altitudes.
10. Si un municipio no es estacin ese ao tendremos valores nulos en los datos
de los ficheros aec-214_20xx.xls y aec-217_20xx.xls.
ANALISIS FUNCIONAL
A continuacin, se describen los requerimientos funcionales para el diseo del
DW para la gestin y reutilizacin de informacin meteorolgica.
En trminos de la arquitectura funcional, tenemos:
Las fuentes de datos estn compuestas por tres (3) ficheros Excel.
La arquitectura puede estar formada por varios elementos que estarn
alojados en la misma mquina.
- Data Mart: vamos a considerar que se est creando un data mart
en lugar de un almacn de datos corporativo.
5
305510364
-
305510364
DISEO
Diseo del modelo conceptual
Describiremos a continuacin el modelo multidimensional conceptual que sirve
de base para el diseo y construccin del sistema. El modelo est compuesto
por dimensiones de anlisis (y los atributos correspondientes) y hechos
(conjunto de indicadores con sus dimensiones relacionadas).
Tambin se detalla la matriz de indicadores que recoge todos los indicadores,
hechos y dimensiones de anlisis de explotacin.
Del mdulo Diseo Multidimensional tenemos el concepto de Modelo
multidimensional que: representa la informacin de procesos de negocio
mediante un modelo compuesto de dimensiones y hechos.
- Dimensin: entidad que contiene informacin descriptiva sobre
elementos de negocio (temporalidad, geografa, productos, empleados,
clientes, etc.). Representa un punto de vista que utilizaremos en nuestro
anlisis.
- Hecho: conjunto de indicadores que miden un determinado evento de
negocio. Representa un tema objeto de anlisis.
- Mtrica: valor numrico que mide un hecho.
A partir del anlisis de requerimientos y del anlisis de fuentes de datos, se ha
identificado:
- Para el DW
HECHOS
Municipios
ATRIBUTOS
Cdigo
Municipio
Nombre
Municipio
Altitud
METRICAS
Estacin
(Si/No)
Poblacin
DIMENSIONES
Tiempo (ao)
Lugar (cdigo comarca)
Superficie
Comarca
Tipo Dato
Nmero Entero
Cadena
HECHOS
Temperaturas
ATRIBU
TOS
METRICAS
DIMENSIONES
Tiempo (ao)
Lugar (cdigo municipio)
305510364
Media
Temp.
Maximas
Media
Temp.
Minimas
Mm lluvia
Acumulado ao
Humedad relativa
Velocidad
Direccin
Pluviometra
Viento
ATRIBUTOS
cod_muni
nombre
altitud
HECHOS
ATRIBU
TOS
h_temperaturas
h_pluviometra
h_viento
METRICAS
estacion
poblacion
superficie
METRICAS
DIMENSIONES
med_anual
temp_max
temp_min
med_temp_max
med_temp_min
lluvia_mm
lluvia_acum_ano
humedad
Velocidad
Direccin
d_fecha_temp
d_municipio_temp
DIMENSIONES
d_fecha_muni
d_comarca
ATRIBUTOS
Ao
Ao
Ao, mes
Ao
Codigo municipio
Codigo municipio
Codigo municipio
Codigo comarca
d_fecha_lluvia
d_municipio_lluvia
d_fecha_viento
d_municipio_viento
305510364
CAMPOS
cod_mun Numero
i
Entero
nom_mu Cadena
ni
altitud
Numero
Entero
estacion
Cadena
poblacio
Numero
n
Entero
superfici
Numero
e
Decimal
d_fecha
Fecha
(nivel
ao)
d_comar
Numero
ca
Entero
HECHOS
h_temperatu
ras
h_pluviometr
a
h_viento
Clave
Primaria
Clave
fornea
Clave
fornea
CAMPOS
id_temp
Numero Entero
Clave Primaria
d_fecha
d_municipio
med_anual
temp_max
med_temp_max
med_temp_min
id_lluvia
Clave fornea
Clave fornea
d_fecha
Clave fornea
d_municipio
lluvia_mm
lluvia_acum_an
o
humedad
id_velocidad
Numero Decimal
Numero Entero
9
Clave Primaria
Clave fornea
Clave Primaria
305510364
d_fecha
d_municipio
Velocidad
Direccin
DIMENSIONES
d_fecha
d_municipio
d_comarca
Clave fornea
Clave fornea
ATRIBUTOS
Ao, mes
Codigo municipio
Codigo comarca
Arquitectura
La arquitectura de la solucin involucra sistemas externos. En un primer
momento solo estarn conectados los correspondientes a los datos de
meteorologa (ms los de municipios y comarcas). Los datos de estos sistemas
externos sern copiados peridicamente en un espacio de datos operacionales.
Desde este espacio, va procesos ETL, se cargar el data mart correspondiente
a meteorologa. En el futuro, se prev existan nuevas cargas de datos para
crear otros data mart o enriquecer el existente.
Habr tambin una capa de explotacin (lo lgico es que sea web) que permita
la consulta de informes, el anlisis y la visualizacin de los cuadros de mando.
Carga de Datos
Nos centraremos ahora en los procesos ETL (Extraccin, Transformacin y
Carga (Load). Lo que se desea es estructurar y acomodar los datos de las
fuentes de datos en el DW.
Los procesos ETL son manipulaciones de flujos de datos. Estos procesos deben
disearse teniendo en cuenta los siguientes factores:
Cmo debe cargarse de manera lgica la informacin, es decir, qu
debe cargarse primero y qu despus.
La ventana de tiempo disponible, hecho que puede condicionar lo que
debemos cargar.
Tipo de carga: inicial o incremental.
El proceso de carga del data mart se realizar en dos pasos:
Se realizar una carga inicial de las tablas maestras y de los datos que
se obtengan hasta ese momento (histrico).
Se realizar una carga incremental peridica de los datos fuente.
305510364
Para cada tabla a cargar, sea de dimensiones o de hechos, existir un
procedimiento implementado en PL/SQL de Oracle que la alimentar.
El primer paso en la creacin de los procesos ETL es comprender qu procesos
son necesarios y en qu orden deben llevarse a cabo. En general, se siguen las
siguientes pautas:
Se identifica si los datos se deben cargar en un rea intermedia. En
nuestro caso, no es necesario.
Podemos diferenciar dos tipos de situaciones en nuestro caso
particular:
- Dimensiones con valores fijos ya conocidos, presentes en Excel y
que no van a cambiar en el tiempo (o no deberan). Estas
dimensiones son: comarca y municipio. Estos valores son
reducidos y se insertarn en la carga inicial en la base de datos.
- La dimensin fecha con valores no fijos que se extraern,
transformarn y cargarn mediante procesos ETL.
La tabla de comarcas debe cargarse ante que el resto de hechos. El
hecho de municipio debe cargarse a continuacin y antes del resto de
hechos.
Las dimensiones se cargan antes que las tablas de hecho.
Proceso ETL
Carga Comarcas
Descripcin
Cargar todas las comarcas catalanas. Se realizar
directamente sobre la BBDD. Utilizaremos el
fichero aec-925_20xx.xls
Cargar la dimensin fecha por medio de un
proceso ETL
Cargar de la tabla de hechos municipio por medio
de un proceso ETL.
Cargar del resto de tablas de hechos por medio de
procesos ETL utilizando los ficheros Excel da
fuentes de datos
Informes
A continuacin, se muestra el diseo de cada uno de los informes que se
construir para dar respuesta a las necesidades de informacin solicitadas en
el enunciado. En color verde aparecen las dimensiones que paginarn la
informacin con un desplegable (selectivo combo box), en naranja las
dimensiones y atributos, y en azul los indicadores.
Cuadro de mando
11
305510364
Tambin habr dos grficos evolutivos:
1)Evolutivoposicinpilotopormundial. Cuanto ms bajo sea el nmero,
mejor, ya que indica la posicin conseguida por un piloto durante toda su
carrera deportiva en la Frmula 1.
2) Evolutivo puntos piloto por mundial. Muestra los puntos conseguidos
por un piloto en cada mundial durante toda su carrera deportiva en la Frmula
1. Hay que tener en cuenta que el ao 2010 cambia el mtodo de puntuacin,
otorgndose muchos ms puntos por cada posicin conseguida en un gran
premio.
El piloto sobre el que se aplicarn estos velocmetros y grficos se seleccionar
mediante un selector desplegable. El desplegable no permitir la agregacin
por pas siguiendo la jerarqua del piloto:
12