Вы находитесь на странице: 1из 22

La alternativa: Introduccin a XML

Eduardo Peis Universidad de Granada

01/06/2012

1. Resumen SGML

01/06/2012

SGML: sintaxis bsica (1) modelo de declaracin SGML documento


<!SGML ISO 8879:1986 charset baseset ISO 646-1983//charset International Reference Version (IRV)//ESC 2/5 4/0> tipo de <!DOCTYPE biblioteca system c:/sgml/biblioteca.dtd> documento <biblioteca> entidad de sistema <!-- comienzo del registro de un libro --> contenido (#PCDATA) <libro> comentarios SGML <titulo>Los corsarios vacilantes</titulo> elementos <autor>Pompeyo Maas <email>pomp&#46;mcu.es</email> referencia de entidad </autor> <editorial>Labor</editorial> atributos <cubierta tipo=blanda></cubierta> <categora clase=noficcin></categora> <isbn>84-045-87498-0</isbn> <nota nmero=5></nota> <comentarios>Libro reservado</comentarios> </libro> <! ms registros aqu --> </biblioteca> 3 01/06/2012

SGML: sintaxis bsica (2) DTD Document Type Definitiondeclaracin de tipo de documento
<!DOCTYPE biblioteca [ declaracin de entidad <!ENTITY @ &#46;> <!ELEMENT biblioteca - - (libro+)> <!ELEMENT libro O (ttulo, autor+, editorial, cubierta, categora, isbn, nota, comentarios?)> declaraciones de elementos <!ELEMENT ttulo O (#PCDATA)> <!ELEMENT autor O (#PCDATA, email)> No tiene por qu aparecer <!ELEMENT email O (#PCDATA)> ningn contenido (vaco) <!ELEMENT editorial O (#PCDATA)> declaraciones de listas de atributos <!ELEMENT cubierta O EMPTY> <!ATTLIST cubierta tipo (blanda | dura) blanda> <!ELEMENT categora O EMPTY> <!ATTLIST categora clase (ficcin | fantasa | cficcin | misterio | terror | noficcin | histrico | biografa) ficcin > <!ELEMENT isbn O (#PCDATA)> <!ELEMENT nota O EMPTY> <!ATTLIST nota nmero (1 | 2 | 3 | 4 | 5) #REQUIRED> <!ELEMENT comentarios O (#PCDATA)> ]>
01/06/2012

SGML: sintaxis bsica (2.1) declaracin de elementos


clave SGML reglas de minimizacin modelo de contenido

<!ELEMENT libro O (ttulo, autor+, editorial, cubierta, categora, isbn, nota, comentarios?)>
identificador genrico
conectores EMPTY #PCDATA Indicadores de aparicin

claves SGML para modelos de contenido

elemento vaco cualquier cadena de caracteres

conectores

indicadores de aparicin

minimizacin

, |

ambos y en ese orden o uno o el otro en cualquier orden

+ ? *

necesario y repetible (1 o ms veces) opcional (0 o 1 vez) Opcional y repetible (0 o ms veces)

obligatoria etiqueta opcional

&

1 posicin etiqueta inicio 2 posicin etiqueta fin

01/06/2012

SGML: sintaxis bsica (2.2) declaraciones de lista de atributos


nombre de atributo
elemento al que cualifican

valor de atributo
posibles valores AttrType
valor por defecto Default

<nombre nacionalidad=SP sexo=V>Eduardo Peis</nombre> <!ATTLIST nombre nacionalidad (AU | AS | BG || SP | NZ) SP sexo (V | H)
nombre de atributo AttrName

#REQUIRED>

ID IDREF CDATA NMTOKEN NUMBER

identificador nico puntero a algn otro elemento datos de caracteres no analizables cualquier cadena de caracteres caracteres numricos

#REQUIRED #IMPLIED #CURRENT default

obligatorio opcional ltimo especificado especificado

01/06/2012

SGML: sintaxis bsica (2.3) declaraciones de entidades


<!DOCTYPE texto [ entidad general interna <!ENTITY lfp liga de ftbol profesional> ]> <texto>el hecho fue estudiado por la &lfp; en previsin de posibles sanciones</texto> general externa analizada <!ENTITY miscosas SYSTEM http://www.ugr.es/~epeis/miscosas.sgm>

<!ENTITY logo SYSTEM http://www.ugr.es/~epeis/logo.gif>


<!ENTITY @ &#46;> <!DOCTYPE texto [ <!ENTITY % elemento-epr <!ELEMENT epr (#PCDATA)>> %elemento-epr; ]>
entidades predefinidas

no analizada de carcter de parmetro

&amp; &lt; &gt; &apos; &quot;


01/06/2012

& < >

SGML: software
Parsers analizadores Editores / procesadores Formateadores Conversores Gestin de datos
Es tal la potencialidad de SGML que no es posible su explotacin con el software de red disponible en la actualidad
01/06/2012

2.

La alternativa: XML

01/06/2012

SGML
HTML
CDF

SGML
CDF EAD MathML HTML

EAD
MathML

SGML
XML

HTML
01/06/2012

10

El usurpador: HTML

HTML es, en realidad, un DTD SGML Problemas:


Define ms la presentacin que el contenido Escasas flexibilidad y extensibilidad No es fcilmente procesable por mquinas Problemas de internacionalizacin Estructura catica Interpretacin ambigua segn el software Slo tiene un uso: pginas Web

La convergencia: XHTML
11

01/06/2012

HTML
<table> <tr> <td>ttulo</td> <td>autor</td> <td>precio</td> </tr> <tr> <td>Pensar</td> <td>B. Ortega</td> <td>42</td> </tr> <tr> <td>La lea</td> <td>M. Lao</td> <td>53</td> </tr> </table>

XML
<libros> <libro> <titulo>ttulo</titulo> <autor>autor</autor> <precio>precio</precio> </libro> <libro> <titulo>Pensar</titulo> <autor>B. Oa</autor> <precio>42</precio> </libro> <libro> <titulo>La lea</titulo> <autor>M. Lao</autor> <precio>53</precio> </libro> </libro>

01/06/2012

12

Principales diferencias SGML/XML


Documentos XML well formed: sin DTD Instrucciones de procesamiento
<?xml version=1.0 encoding=ISO-8859-1 standalone=yes?>

Declaraciones de elementos. Modelos de contenido:


Conector & no permitido Prohibidas las exception No se utilizan los indicadores de minimizacin.

Uso generalizado de elementos vacos Secciones cdata


<Elemento_ASP> <![CDATA[ <FORM ACTION=<% = Request (SCRIPT_NAME) %> METHOD=POST> ]]> </Elemento_ASP>

Notation declarations
<!NOTATION GIF SYSTEM Iexplore.exe>

Los espacios en blanco, cambios de lnea o retornos son significativos


01/06/2012

13

Documentos XML: (1) Well-Formed

Cumplen estrictamente la especificacin (Versin 1.0)


Estructura jerrquica de los elementos

Etiquetas

Estrictamente jerrquica (rbol) Correctamente anidados No superposicin Slo un elemento raiz

Siempre etiquetas de inicio y de fin Case-sensitive Comienzo de GIs:

Elementos vacos: sintaxis especial


<img src=./>

Un carcter alfabtico no acentuado Signo de subrayado o guin bajo Sin espacios

Atributos

Valor de atributo entre comillas dobles () o simples () 14

01/06/2012

buena formacin (well formed XML document)


un elemento raiz etiquetas de principio y de final etiquetas vacas <nombre /> anidados correctos valores de atributos entre comillas distincin entre maysculas o minsculas (se pueden usar ambas, pero XML distingue entre ambas) caracteres admisibles (todos los nombres de las etiquetas y atributos deben empezar siempre con un carcter alfabtico no acentuado o con el signo subrayado o guin bajo y no pueden contener ningn espacio).

01/06/2012

15

instrucciones de procesamiento

<? Nombre_de_aplicacin instrucciones_para_la_aplicacin ?>

declaracin XML <?xml version=1.0 encoding=ISO-8859-1 ?>

standalone <?xml version=1.0 encoding=ISO-8859-1 standalone=yes ?> yes (DTD interno) no (DTD externo o referencia externa a entidades)
01/06/2012

16

secciones CDATA

<Pelicula> Tom & Jerry </Pelicula> ..... <Elemento_ASP> <FORM ACTION=<% = Request (SCRIPT_NAME) %>METHOD=POST> </Elemento_ASP>

<Pelicula><! [CDATA[ Tom & Jerry ]]></Pelicula> ..... <Elemento_ASP> <! [CDATA[<FORM ACTION=<% = Request (SCRIPT_NAME) %>METHOD=POST>]]> </Elemento_ASP> 17

01/06/2012

referencia de entidades

Carcter

Referencia textual

Referencia numrica

<
> &
01/06/2012

&lt;
&gt; &amp; &apos; &quot;

&#60;
&#62; &#38; &#39; &#34; 18

referencia de entidades

<COMENTARIO> El siguiente cdigo es legal: &lt;Pelcula&gt; Tom &amp; Jerry &lt;/Pelcula&gt; </COMENTARIO>

Comentarios
<!-- Este texto es un comentario -- > <!-- Esto es uncomentariopermitido -- > <!-- Esto es un --comentario--no permitido -- >
19

01/06/2012

Documentos XML: (2) Validacin y definicin


XML well formed + DTD = valid XML XML Schemas

Sintaxis XML Tipos de datos asociados a elementos (validacin de contenido) Modelo de datos abierto:

Combinacin lgica de atributos


xmlns=urn:schemas-microsoft-com:xml-data xmlns:dt=urn:schemas-microsoft-com:datatypes> <AttributeType name=id dt:type=string required=yes /> <ElementType name=nombre content=textOnly /> <ElementType name=persona content=mixed /> <attribute type=id /> <element type=nombre /> </ElementType> <ElementType name=documento content=eltOnly> <element type=persona /> </ElementType> </Schema> <Schema

vocabularios extensibles relaciones de herencia integracin de Namespaces

01/06/2012

20

3. Recursos

01/06/2012

21

Tan slo algunos recursos


Goldfarb, C.; Prescod, P. (1999) Manual de XML. Madrid [etc.]: Prentice Hall Traduccin del manual de Goldfarb Web del World Wide Web Consortium, donde se desarrollan, se oficializan y se distribuyen las especificaciones El sitio por excelencia Recursos para desarrolladores. Contiene la especificacin XML 1.0 comentada por Tim Bray Borradores, tecnologas descargables, tutoriales Buenos tutoriales, herramientas y demos Enlaces a herramientas XML

http://www.w3.org

http://www.oasis-open/cover/sgml-xml.html

http://www.xml.com

http://www.ibm.com/xml

http:www.microsoft.com/xml
http://www.xmlsoftware.com
01/06/2012

22

Вам также может понравиться