Академический Документы
Профессиональный Документы
Культура Документы
4
Libro del estudiante
Definición de estructura de datos
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
1/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
TABLA DE CONTENIDOS
6 GLOSARIO ..................................................................................................................................................44
2/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Este libro tiene como objetivo proporcionar una comprensión y visión completas sobre las
definiciones de estructuras de datos (DSD - Data Structure Definitions) y la forma de crear un
artefacto DSD a partir de un ejemplo de tabla de datos. Esto incluye:
Al final de este libro, el usuario deberá ser capaz de crear un artefacto DSD y entender cómo
funciona, y también crearlo a partir de una tabla de datos estadísticos.
El libro del estudiante es el cuarto de una serie de 8 libros del estudiante (ver Tabla 1- Libros
del estudiante sobre SDMX) que juntos proporcionan una información completa para el
dominio de SDMX, con una atención particular en el modelo de datos.
Ref. Título
[01] Introducción a SDMX
[02] El modelo de información SDMX
[03] Mensajes SDMX-ML
[04] Definición de estructura de datos
[05] Definición de estructura de metadatos
[06] Tecnologías basadas en XML usadas en SDMX
[07] Arquitecturas SDMX de método pull para compartir datos – Parte
1
[08] Arquitecturas SDMX de método pull para compartir datos – Parte
2
Tabla 1 – Libros del estudiante sobre SDMX
Prerrequisitos
Se recomienda con fuerza la lectura del primer libro del estudiante para obtener una visión
global del modelo de información SDMX y los conceptos básicos de las estructuras de datos y
metadatos. El estudio del segundo libro del estudiante podría ayudar a comprender la
aplicación detallada de los objetos del modelo de información utilizados en las definiciones de
estructuras de datos.
3/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
¿Cuál es el tema?
¿Qué unidades son las que mide?
¿A qué país o región geográfica se aplica? (si es que la hubiera)
¿Cuándo se realizó la medición y con qué frecuencia se midió?
1
El modelo de información SMDX (SDMX Information Model), las directrices orientadas al
contenido (Content Oriented Guidelines) y las estructuras de datos se presentan en el
primer libro “Introducción a SDMX”. El modelo de información SMDX se explica con más
detalle en el libro del estudiante n. 2 "El modelo de información SDMX”.
4/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Cada pregunta se refiere a una idea o “concepto” usado para describir datos. Así pues, las
preguntas de arriba nos llevan a hablar de conceptos descriptores como el tema estadístico,
unidad de medida, país, fecha y frecuencia.
Conforme damos respuesta a las preguntas anteriores, los datos van cobrando sentido:
El tema es “población total”;
La unidad de medida es “número de personas”;
El país es “Bélgica”;
La fecha es “1 de enero de 2001” y la frecuencia es “anual”.
Este ejemplo muestra cómo definir datos estadísticos con un conjunto de descriptores de
conceptos.
Siguiendo este ejemplo, una definición de estructura de datos (DSD - Data Structure
Definition) puede definirse de la siguiente forma:
Una DSD (familia clave - Key Family) especifica un conjunto de conceptos descriptores
(conceptos que describen e identifican a un conjunto de datos (Dataset)). Nos dice qué
conceptos son dimensiones (identificación y descripción), y qué conceptos son atributos
(solamente descripción), y nos aporta un nivel de asociación para cada uno de estos conceptos
basados en la estructura de empaquetado (conjunto de datos, grupo, serie/sección,
observación) así como su estado (obligatorio contra condicional). También especifica qué
listas de códigos proporcionan posibles valores a las dimensiones, como también los posibles
valores para los atributos, ya sean listas de códigos o campos de texto libre. Puede usarse una
definición de estructura de datos para describir datos de serie temporal y tablas de datos
transversales (Cross-Sectional) y multidimensionales.2
Los datos estadísticos presentados en tablas pueden transformarse y obtener así una estructura
de datos SDMX. Aquí se presenta un ejemplo de datos mensuales en la tabla 2.
2
Se proporcionan ejemplos de serie temporal (Time Series), y tablas de datos
transversales (Cross-Sectional) y multidimensionales en el libro del estudiante n. 1
Introducción a SDMX.
5/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Dado el orden que se muestra arriba, la clave para esta serie de datos tendría la forma
M:BE:3:300:FR (los dos puntos “:” separan los valores de dimensión (Dimension)). Esta
sería la correspondencia: ingresos (=300) de importaciones (3=débito/pagos/bienes)
mensuales (=M) del país/ empresa o área que informa (=Bélgica) al área asociada (=Francia).
En relación con los conceptos, el siguiente paso es distinguir entre dimensiones
(Dimensions), atributos (Attributes) y medidas (Measures). Las dimensiones clave (Key
Dimensions) contribuyen a la identificación concreta de una serie de datos o (más
globalmente) de un conjunto de datos (Dataset). Éstas se vinculan a nivel de serie. Los
atributos (Atributes) proporcionan información adicional y pueden vincularse a diferentes
niveles. Las medidas contienen el valor observado durante un período de tiempo (datos de
serie temporal (Time Series)). Los conceptos dimensión de tiempo (período de tiempo), que
no forman parte de la clave, y el atributo de formato de tiempo, completan las definiciones
que son necesarias.
La serie temporal en el ejemplo se expresa en millones de euros. Los conceptos “unidad” y
“unidad múltiplo” no contribuyen a las identificaciones de las series; solamente proporcionan
información adicional a los datos de las tablas. En consecuencia, actúan como atributos que
especifican descripción adicional de los datos.
6/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Los conceptos que van del 1 al 5 son obligatorios para lograr un clara identificación de los
datos de serie temporal. Se consideran dimensiones (Dimensions) y forman la clave de la
estructura de datos (tal como se ha mostrado más arriba).
Se proporciona una definición más formal de una muestra de estructura de datos en la tabla 3.
Ha de tenerse en cuenta que en este ejemplo concreto solo se usan dos conceptos específicos
de dominio estadístico (tema de balance de pagos, sentido del flujo/tipo de transacción). La
mayoría del resto de conceptos son en realidad conceptos de dominio transversal (Cross
Domain) SDMX, provenientes de las directrices orientadas al contenido SDMX (COG -
Content Oriented Guidelines)3, que se deberían aplicar siempre que sea posible.
Pos.
Dimensión o Nombre del Nivel de Lista de
en Identificador
Atributo concepto asociación códigos
clave
1 Dimensión Frecuencia FREQ CL_FREQ
2 Dimensión Área de REF_AREA CL_AREA
informe/referencia
3 Dimensión Tipo de datos para DATA_TYPE_BOP CL_DATA_TYP
estadísticas de E_BOP
balance de pagos
4 Dimensión Tema de balance BOP_ITEM CL_ BOP_ITEM
de pagos
5 Dimensión Área asociada COUNT_AREA CL_AREA
Dimensión Período de tiempo TIME_PERIOD
Atributo Formato de tiempo TIME_FORMAT Serie CL_TIME_FOR
MAT
Atributo Unidad de medida UNIT Serie CL_UNIT
Atributo Unidad múltiplo UNIT_MULT Serie CL_UNIT_MUL
T
El objetivo de este capítulo es el de seguir los pasos necesarios para la creación de una
definición de estructura de datos (DSD - Data Structure Definition) a partir de tablas
estadísticas de representaciones de datos transversales (Cross-Sectional) y de serie temporal
(Time Series), así como introducir los mensajes de estructuras de datos SDMX-ML. Esto
incluye la creación de artefactos unidos al DSD y obtener así un conocimiento completo de la
estructura.
3
La COG (Content Oriented Guidelines) se trató en el primer libro - Introducción a SDMX.
7/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
1. Mostrar la diferencia entre datos de serie temporal (TS - Time Series) y datos
transversales (CS - Cross-Sectional).
2. Construir la definición de estructura de datos (Data Structure Definition):
Definir todos los conceptos relacionados con los datos;
Identificar qué conceptos son dimensiones (Dimensions) y cuáles son atributos
(Attributes);
Declarar las medidas (Measures) y los valores que se observan;
Adjuntar o construir listas de códigos (Code Lists).
8/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Para el ejemplo dado, la construcción del DSD se ha basado en datos previos ya almacenados
en tablas estadísticas (u otros medios como bases de datos o ficheros de datos). Así pues, la
estructura de los datos ya se predefine en el intercambio de datos, donde los conceptos
estadísticos ya se han definido suficientemente en el pasado. Las propiedades de cada
concepto y las características de sus valores pueden obtenerse mediante el estudio del
conjunto disponible de datos recogidos.
En cualquier caso, se debería considerar el rediseño hacia SDMX como una oportunidad de
validar y actualizar el diseño previo de la estructura de datos. La reducción de una tabla
estadística a un modelo común de datos para el intercambio de datos podría contribuir a
obtener una visión más clara de cualquier clase de nueva estructura. En este libro, tal proceso
de rediseño no se trata, pero se trata de la transferencia de datos individuales que se presentan
en las tablas estadísticas con sus estructuras subyacentes (conceptos (Concepts), listas de
códigos (Code Lists), dimensiones (Dimensions), atributos (Attributes) y medidas
(Measures)) con respecto a la correspondiente definición de estructura de datos SDMX
(SDMX Data Structure Definition).
9/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
La tabla estadística incluye la información de cabecera, como el título, número de tabla, los
datos relativos a turismo y la fecha de extracción. Además, se presentan conceptos
estadísticos, que normalmente no son visibles en filas y columnas de la propia tabla extraída.
Empezando por el ejemplo de serie temporal (Time Series), la tabla 4, que se encuentra más
abajo, muestra los datos estadísticos con respecto a periodos de observación anuales. Para esta
tabla solo nos hemos fijado en una única entidad (FR = Francia) geográfica (GEO) para el
desarrollo del número de tipos de establecimientos turísticos a lo largo de un período
específico.
FREQ: A – Anual
GEO: FR – Francia
TOUR_INDICATOR: A001 – Establecimientos
UNIT: NUM – Número
10/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
TIEMPO: 2007A00
TOUR_INDICATOR: A001 – Establecimientos
UNIT: NUM – Número
11/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
vacacionales). Estas observaciones se refieren solo al año 2007, subrayando así la diferencia
principal con los datos de serie temporal (Time Series) donde un fenómeno se mide a lo largo
de un período de tiempo (ej: observaciones anuales desde el 2002 al 2009).
12/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
3.4.1 Conceptos
Al entrar en los detalles de los ejemplos mostrados en las tablas 4 y 5, el primer paso a
realizar es especificar los conceptos, los cuales comprenden los datos subyacentes de la tabla
estadística. Estos se usan para identificar y describir aún más los datos estadísticos y son, por
tanto, indispensables para la transformación de números puros en información estadística.
En el dibujo 3 de arriba se puede observar que los conceptos del tema estadístico se reúnen en
un esquema de concepto (Concept Scheme) = TOUR_concepts’, el cual está identificado por
su ID ‘TOUR_concepts’, el ID de la agencia encargada ‘ESTAT’ y el número de versión.
Estos elementos y los conceptos contenidos han de codificarse, por ejemplo, en el “Data
Structure Wizard” (DSW), que es una herramienta para construir una DSD SDMX.
Los conceptos son identificados mediante su ID (por ejemplo "TOUR_INDICATOR") y
pueden contener información sobre listas de códigos (CL_TOUR_INDICAT) que
proporcionan los valores para el respectivo concepto y contienen una descripción dependiente
del lenguaje (comparar con el dibujo 3).
13/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
La vinculación de los conceptos con la tabla estadística (en formato TS) se ilustra en el dibujo
4 a continuación:
14/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Para poder intercambiar y comprender los datos, hace falta que se declaren los posibles
valores de cada concepto. Aparte de la posibilidad de definir formatos de texto para valores de
texto libre, que suelen usarse para atributos (Attributes), el enfoque más ampliamente usado es
el de adjuntar listas de valores. A esta lista de posibles valores se la conoce como “lista de
código” (Code List). Cada valor de la lista tiene una abreviatura independiente del lenguaje -
un “código” - y una descripción de lenguaje específica. Esto nos ayuda a librarnos de
problemas de traducción a la hora de describir los datos: el código puede traducirse en
descripciones en cualquier lenguaje sin tener que cambiar el código asociado a los propios
datos.
Siempre que sea posible, los valores de las listas de código (Code Lists) se toman de
estándares internacionales; como aquellas propuestas en las directrices orientadas al contenido
SDMX (SDMX Content Oriented Guidelines) u otras internacionalmente estandarizadas (por
ejemplo listas de códigos (Code Lists) ISO para países y divisas). Para este ejemplo, han de
definirse las listas de códigos específicas (Code Lists) o las listas de códigos (Code List)
apropiadas que ya existen para las dimensiones (Dimensions), al igual que para los atributos
(Attributes) no representados por valores de texto libre. Estas dimensiones (Dimensions) y
atributos (Attributes) asociados a listas de códigos (Code List) son denominadas
“codificadas”.
Véase la tabla 7 para obtener un resumen de las listas de códigos (Code Lists) asociadas a los
conceptos del ejemplo. Por favor, téngase en cuenta que para algunos de ellos solo se muestra
una selección de códigos.
15/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
16/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Las siguientes dimensiones (Dimensions) pueden ser detectadas (tal como se ilustran en el
Dibujo 4):
Frecuencia (FREQ);
Región geográfica referida (COUNTRY);
Indicadores de turismo (TOUR_INDICATOR);
Actividad de turismo (TOUR_ACTIVITY);
Tiempo (TIME_PERIOD)
17/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Una serie temporal (Time Series) siempre tiene una “frecuencia” (FREQ). Este es un
concepto descriptor que describe los intervalos de tiempo entre observaciones. La
opción “isFrequencyDimension” ha de ser seleccionada para identificarlo. Solamente
puede haber una dimensión (Dimension) de frecuencia por definición de estructura de
datos (Data Structure Definition);
La dimensión tiempo (Time Dimension) (TIME_PERIOD) es una dimensión
(Dimension) especial que debe ser incluida en cualquier definición de estructura de
datos (Data Structure Definition) que vaya a ser usada para mensajes de datos de serie
temporal (Time Series). Esta dimensión (Dimension) se señala como
“isTimeDimension” en la sección de DSD (familia clave - Key Family).
4
Se proporcionan más explicaciones en profundidad sobre niveles de asociación para
atributos en el libro del estudiante n. 2 "El modelo de información SDMX".
18/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
5
Se proporcionan más explicaciones en profundidad sobre las estructuras de
agrupamiento / empaquetado en el libro del estudiante n. 2 – El modelo de información
SDMX.
19/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Los otros elementos de la clave pueden encontrarse a nivel sección en el ejemplo, de la misma
forma que su declaración a nivel de serie para las estructuras de datos en serie temporal
(Times Series).
Como consecuencia, el ejemplo transversal (Cross-Sectional) muestra las mismas clases de
datos que las hechas antes a partir de una serie temporal (Time Series) en una organización
diferente.
Además de los elementos de la DSD para los datos de serie temporal (Time Series), se han de
añadir especificaciones adicionales al formato transversal (Cross-Sectional) con el fin de que
se pueda usar la DSD para mensajes de datos SDMX-ML de ambas organizaciones de datos.
Las múltiples medidas de la representación de datos transversales (Cross-Sectional) han de
definirse en la dimensión de medida (Measure Dimension). Los valores de la dimensión de
medida (Measure Dimension) también se tratarán como conceptos:
20/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Tras tener una visión general adecuada de la estructura de los datos, la estructura que se
presenta en la tabla 10 puede definirse formalmente en SDMX-ML, preferentemente con la
ayuda de una herramienta dedicada SDMX, como por ejemplo, el Data Structure Wizard
(DSW) o la función de construcción de DSD del registro SDMX (“SDMX Registry”) de
Eurostat.
Dimensiones
1 1 Sección de FREQ Frecuencia CL_FREQ(1.0) Lista de
Asociación códigos de
CS frecuencia
Medidas CS
AT Austria CL_COUNTRY(1.0) Lista de
códigos de
21/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
País
OBS_VALUE Valor de
observación
Otros atributos
Serie Sección Obligatorio UNIT CL_UNIT(1.0) Lista de
códigos de
unidad
Al aplicar una de esas herramientas (por ejemplo el DSW) para definir un DSD con sus
artefactos asociados, las definiciones de estructura de datos (Data Structure Definitions)
definidas se almacenarán en un formato de mensaje de estructura SDMX-ML (SDMX-ML
Structure Message) dedicado. El denominado formato de mensaje de estructura SDMX-ML
(SDMX Structure Message) contiene la descripción de los metadatos estructurales, tales como
la familia clave (Key Family), el esquema de concepto, conceptos y listas de códigos (Code
Lists). Como los mensajes de estructura SDMX-ML (SDMX-ML Structure Messages) no son
fáciles de leer, el dibujo 6 - La parte de Familia Clave (Key Family) de la MIG (Message
Implementation Guide) - muestra la estructura de datos en el formato sencillo de guía de
implementación de mensaje (MIG: Message Implementation Guide).
22/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Con respecto al establecimiento del nuevo Censo 2011, se opta por una organización de datos
transversales (Cross-Sectional) especiales para el intercambio de datos. Primero, se debe
23/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
describir un hipercubo como una DSD. Por consecuente, se debe crear una DSD para cada
uno de los hipercubos de censo.
El formato de estructura de datos detallado más abajo (organización de datos CS sin medidas
CS) para la aplicación piloto del “Census Hub” fue elegido por su flexibilidad en cuanto al
manejo de datos tabulados transversalmente y su estructura específicamente fácil de
implementar.
Se espera que este tipo de DSD se use frecuentemente en el futuro para transmisiones de datos
similares.
El ejemplo se centra en el primer hipercubo de censo incluido en el proyecto piloto de
“Census Hub” con las dimensiones (Dimensions): AGE, CAS (current activity status, “estado
de actividad actual” en inglés), GEO (geographical area) y SEX. Un segundo hipercubo
reemplaza a la dimensión (Dimension) CAS (current activity status) por: Marital status
(“estado civil”).
La especificación de la estructura transversal (Cross-Sectional) del censo del primer hipercubo
puede resumirse de la siguiente forma:
La construcción del DSD sigue los mismos pasos descritos anteriormente, pero teniendo en
cuenta que las dimensiones (Dimensions) descritas arriba reducen la complejidad en cuanto a
los pasos y al número, ya que ninguna dimensión (Dimension) de medida transversal (Cross-
Sectional Measure) ha de ser definida con sus conceptos asociados.
La definición de estructura de datos (Data Structure Definition) construida tiene la misión de
manejar los mensajes de datos SDMX-ML en el formato transversal (Cross-Sectional),
aunque una organización de datos TS también sería posible, ya que las dimensiones
(Dimensions) tiempo, frecuencia y formato de tiempo están definidas.
24/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
25/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
26/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Impresión de informes resumen para listas de códigos (Code Lists), conceptos sacados
de esquemas de concepto (Concept Schemes), DSD, flujos de datos (Data Flows) e
impresión de informes para los componentes DSD y para los códigos de las listas de
códigos (Code Lists);
Habilidades de búsqueda (buscar un flujo de datos (Data Flow) para una DSD
especificada, buscar una DSD para un flujo de datos (Data Flow) especificado, buscar
todas las DSD usando una lista de códigos (Code List) y buscar todas las DSD usando
un concepto dado.
Para crear una nueva lista de códigos (Code List) en la aplicación: al seleccionar 'Add' desde
el menú contextual del nodo 'Code lists', se muestra una nueva página de lista de códigos
(Code List) en la parte derecha de la pantalla y, en la ventana izquierda, un nodo hijo aparece
de las listas de códigos (Code Lists) marcados con '++' (tal como indica la flecha roja '2' en el
dibujo abajo).
Para crear una lista de códigos (Code List), los requisitos mínimos son rellenar los campos
obligatorios de las secciones 'Code List Attributes Panel' y 'CodeList Properties Panel', y
presionar el botón 'Save Code List'. Los campos obligatorios están destacados en amarillo y
6
La siguiente creación de la DSD paso a paso solo trata los objetos principales y los
elementos que son necesarios para construir la DSD para el ejemplo de turismo. Para
una introducción más específica sobre el DSW, se proporciona una guía junto con la
herramienta además de un sistema de ayuda interno que ofrece una orientación
detallada sobre la creación de artefactos. Para este capítulo se usó la versión 0.8.6 del
DSW.
27/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
En el CodeList Properties Panel (5) el usuario puede realizar las siguientes acciones:
Rellenar el campo obligatorio 'Names'. Se ha de definir al menos un valor localizado
(lenguaje).
Para guardar toda la información introducida, presionar 'Save CodeList' (6).
28/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Para añadir un valor, presionar el botón 'New Code' como indica la flecha roja '2', y entonces:
Rellenar el campo obligatorio 'Value' con el código (3);
Rellenar el campo 'Descriptions' (4), que también es obligatorio, con la descripción del
código;
Presionar el botón 'Save Code' (5) y la información se añadirá en la sección superior
de la etiqueta 'Codelist Elements';
Los pasos (2-5) se repiten para introducir cada código ;
El botón 'Remove Code' borra un código después de seleccionarlo;
Para ver los códigos creados como un árbol de código, el usuario debe presionar el
botón de 'Tree view' de la sección señalada por la flecha '2' y una ventana aparecerá
mostrando el árbol de código.
Después de haber rellenado todos los campos obligatorios, la nueva lista de códigos se
guardará al presionar 'Save Code list' (6). Como resultado, el árbol de la ventana izquierda de
la pantalla se refrescará para mostrar la nueva lista de s (Code List) creada. El nombre de la
nueva lista de códigos (Code List) es una combinación del 'ID', 'Agency ID' y 'Version', que lo
identifica singularmente.
Los esquemas de concepto (Concept Schemes) representan una colección de conceptos. Para
iniciar la creación de un esquema de concepto (Concept Scheme) en la aplicación DSW:
29/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
30/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
31/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Scheme) actual como una lista en forma de árbol, presionar el botón 'Tree view'.
Para guardar el esquema de concepto (Concept Scheme) entero, que ahora incluye los nuevos
conceptos creados para el ejemplo de turismo en la tabla, presionar el botón (6) 'Save
ConceptScheme'.
Antes de empezar a crear una nueva DSD, debe de haber en la aplicación DSW al menos un
esquema de concepto (Concept Scheme) con los conceptos definidos.
32/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Al seleccionar 'Add' dentro del menú contextual del nodo 'DSDs', un nueva página de DSD
muestra en la parte derecha de la pantalla, y concretamente en la ventana derecha, un nodo
hijo de DSD aparecerá señalado con '++' (2). Para empezar a completar el artefacto DSD,
seleccionar la etiqueta 'DSD Information' (3) como en el dibujo de arriba.
Información DSD
En el DSD Attributes Panel (4) el usuario deberá realizar las siguientes operaciones:
Rellenar los campos obligatorios 'ID' y 'AgencyID', que se encuentran ya rellenados
con el primer AgencyID de la lista 'OrganisationScheme' proporcionado por la
aplicación DSW;
Los otros campos ('Valid From', 'Valid To', 'URI', 'URN' e 'Is Final') son opcionales.
El campo URI apunta a un mensaje de estructura SDMX (SDMX Structure Message)
que contiene detalles completos sobre el flujo de datos (Data Flow). El atributo 'URN'
(universal resource name) puede albergar un vínculo válido con el registro SDMX
(“SDMX Registry”). Si se selecciona la casilla 'Is Final', el artefacto se protegerá
(ninguna modificación más será posible) y podrán ser añadidas referencias por otros
artefactos (ej: un flujo de datos (Data Flow) basado en esta DSD);
El campo 'Version' se puede rellenar. Si se omite, la versión será la 1.0. Los campos
'ValidFrom' y 'ValidTo' pueden albergar fechas que proporcionen información de
validación suplementaria sobre la versión actual del DSD.
La pantalla 'DSD' contiene una segunda etiqueta que se llama 'DSD Elements' (2).
En primer lugar la etiqueta 'Primary Measure' (señalada en un cuadrado rojo) se tiene que
rellenar. Presionar el botón 'Choose' (2) para seleccionar el concepto OBS_VALUE
relacionado. Un ventana aparecerá mostrando donde el usuario puede buscar y seleccionar el
concepto del esquema de concepto (Concept Scheme) relacionado por ID o por nombre.
Después de rellenar todos los campos obligatorios, con el botón 'Save DSD' (3) se almacena el
artefacto actualizado.
34/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Añadir una nueva dimensión (Dimension), al presionar el botón 'New Dimension' (3).
Una nueva línea de cuadrícula se añadirá a la tabla (rectángulo rojo) enumerando las
dimensiones (Dimensions) incluidas en la DSD actual;
Para seleccionar un 'Role' (4) el usuario ha de elegir una de estas opciones de la lista:
'Dimension', 'TimeDimension', 'FrequencyDimension' o 'MeasureDimension';
Como COUNTRY es la dimensión (Dimension) de medida de nuestro ejemplo, los
campos Role, Concept y Code List que proporcionan los valores para el concepto
COUNTRY han de ser elegidos adecuadamente (4-6);
Completar opcionalmente los elementos de la sección Text Format para definir un
formato de texto específico para la dimensión (Dimension).
35/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Una vez que las dimensiones (Dimensions) reflejadas arriba se hayan definido, el usuario
pasará a la siguiente etiqueta.
36/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
37/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
38/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Añadir un atributo nuevo al presionar el botón 'New Attribute' (3). Una nueva línea de
cuadrícula se añadirá a la sección de la tabla en la pantalla (señalada con el rectángulo
rojo);
Elegir un concepto presionando el botón 'Choose' del campo obligatorio 'Concept' (4)
y seguir los pasos indicados.
39/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
Seleccionar un 'Assignment Status' (5). Este estado indica si un valor ha de ser proporcionado
para el atributo de un fichero de datos. En ese caso, dos estados de asociación son posibles:
'Mandatory' y 'Conditional'.
El elemento 'Attachment Group' se habilita cuando este atributo se atribuye al nivel 'Group'.
Este indica con que grupo (Group) o grupos declarados se puede asociar el atributo. Ningún
grupo (Group) se declara y ningún tipo de relación está prevista en el ejemplo de turismo.
Seleccionar un 'Attachment Level' de la lista respectiva (6). Las opciones disponibles
son 'DataSet', 'Group', 'Series' y 'Observation';
Al seleccionar 'Observation' como nivel de asociación, la sección 'Attachment
Measure' (7) se habilita y el usuario debe elegir de las medidas disponibles, las que
vaya a usar para la asociación. Esto implica el tener que mover al menos un valor
desde la correspondiente lista 'Available' hasta la de 'Selected';
Cuando el usuario selecciona 'Group' como nivel de asociación, la sección 'Attached
Group ID' (8) se habilita y el usuario puede seleccionar normalmente de entre los
grupos (Groups) disponibles aquellos con los que el atributo tiene que asociarse (esto
no es así en el ejemplo de turismo);
El tipo de atributo deberá definirse para los atributos (Attributes) especiales con las
opciones de la lista 'Is...'; éstas son: 'TimeFormat', 'Entity Attribute',
'NonObservational Time Attribute', 'Count Attribute', 'Frequency Attribute' o 'Identity
Attribute'. Por tanto, para el ejemplo, el atributo TIME_FORMAT se señalará como
'Is... TimeFormat';
En la sección 'CrossSectional Attachment Level', el nivel de asociación de la
organización de datos transversales (Cross-Sectional) se tiene que definir, ya que la
DSD TOURISM admite tanto ficheros de datos TS como CS;
La sección 'Text Format' se puede rellenar opcionalmente.
Para guardar el atributo que se está editando, presionar el botón 'Save Attribute' (9). Para
guardar la estructura de datos actual, presionar el botón 'Save DSD' (10)
40/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
41/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
La herramienta DSW contiene una función para crear una MIG para una DSD definida. Para
construir y guardar la MIG (como fichero rtf), el usuario debe presionar el botón 'Download
MIG' (señalado con el rectángulo rojo) en el dibujo de abajo. Se puede seleccionar el destino
de la carpeta de descarga y confirmar la operación.
42/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
43/45
Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos
6 Glosario
Concepto Definición
COG Directrices Orientadas al Contenido (Content Oriented
Guidelines)
CS Transversal (Cross-Sectional)
DSD Definición de Estructura de Datos (Data Structure
Definition)
DSW Data Structure Wizard
ISO Organización Internacional para la Estandarización
(International Organisation for Standardisation)
MIG Guía de Implementación de Mensajes (Message
Implementation Guide)
MSD Definición de Estructura de Metadatos (Metadata Structure
Definition)
SDMX Intercambio de Datos y Metadatos Estadísticos (Statistical
Data and Metadata eXchange)
SDMX-IM Modelo de Información SDMX (SDMX Information
Model)
SDMX-ML Lenguaje de Marcas SDMX (SDMX Mark-up Language) -
Formato XML para el intercambio de datos y metadatos
estructurados en SDMX
TS Serie Temporal (Time Series)
URI Identificador de Recursos Unificados (Unified Resource
Identifier)
URN Nombre de Recursos Unificados (Unified Resource Name)
XML Lenguaje de Marcas Extensible (EXtensible Mark-up
Language)
Tabla 12 - Glosario
44/45