Вы находитесь на странице: 1из 11

Ayuda:Caracteres especiales

A partir de la versin 1.5 de MediaWiki, todos los proyectos usan la codificacin de caracteres Unicode (UTF-8). Para ver qu caracteres corresponden con un proyecto se le pide al navegador que ensee el cdigo fuente de la pgina y se ve:
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />

o (el que esta pgina tiene):


<meta http-equiv="Content-type" content="text/html; charset=utf-8" />

Ayuda de edicin Antes de comenzar La interfaz de Wikipedia Barra de herramientas de edicin Cmo se edita una pgina Creando un artculo Cmo empezarlo Cmo cambiarle el ttulo (1) (2) Manual de estilo Cmo referenciarlo(4) Cmo categorizarlo Cmo redactarlo mejor Cmo aadirle enlaces interlingsticos Cmo aadirle imgenes (5) No lo firmes (6) (7) Clases de artculos Los espacios de nombres La estructura de un artculo Modelos

Anexos Redirecciones Usando MediaWiki Cronologas Listas Tablas TeX LaTeX Plantillas Palabras mgicas Caracteres especiales Ms ayuda Preguntas idiomticas Transliteracin Enlaces tiles Dnde colaborar Recursos Recursos de dominio pblico Imgenes de dominio pbilico Ms recursos y herramientas Ejemplos de peticiones de permiso Varios caracteres que no forman parte del repertorio ASCII estndar resultan tiles incluso necesarios para las pginas Wiki, especialmente las pginas internacionales. En principio, si se usa la moderna codificacin UTF-8 no debera dar problemas, incluso permite en pginas escritas en varios idiomas simultneos poder leerse sin problemas. No importa si tienen caracteres rabes o chinos, todos estn incluidos. Si tienes tu sistema operativo actualizado para usar el UTF-8 podrs escribir sin problemas y podrs leer igualmente sin problemas. Si ves que queda alguna pgina antigua con cuadraditos en vez de letras acentuadas, aydanos a corregirlos. As, si ves esta serie de acentos: (aeiou acentuadas) en vez de cuadraditos o letras raras, es que puedes leer lo que est en UTF-8. Si necesitas ms informacin mira aqu: UTF-8 Esta pgina contiene recomendaciones sobre aquellos caracteres que se pueden utilizar con seguridad y cmo usarlos. Existen tres formas de ingresar un carcter no-ASCII en una pgina Wiki aparte de usar el UTF-8 que recomendamos:

Introduce el carcter directamente desde el teclado apropiado, o copindolo de alguna aplicacin tipo "mapa de caracteres" y luego pegndolo, o por medio de recursos

especiales que pueda ofrecer su sistema operativo, o programa de edicin de texto. El servidor web deber entonces ser configurado para informar de qu juego de caracteres de 8-bits se debe usar. Utiliza una entidad de referencia HTML conocida, como por ejemplo &agrave;. ste es el mtodo ms seguro y compatible, y no resulta ambiguo aun cuando el servidor no anuncia el uso de algn juego de caracteres especial, e incluso cuando el carcter no se muestra apropiadamente en algunos navegadores. Utiliza una entidad numrica de referencia HTML, como por ejemplo &#161;. Esto no se recomienda, ya que muchos navegadores interpretan incorrectamente estas entidades como referencias al juego de caracteres nativo. Sin embargo, sta es la nica forma de ingresar valores Unicode para los que no existe entidad alguna, como las letras del idioma turco. Note que debido a que los caracteres a los que apuntan los valores 128 al 159 no se usan tanto en ISO-8859-1 como en Unicode, las referencias en este rango como &#131; son invlidas y ambiguas, aun cuando sean usadas con frecuencia por varios sitios web.

Contenido
[ocultar]

1 Caracteres ISO-8859-1 2 Caracteres inseguros 3 Caracteres no-ISO posiblemente utilizables o 3.1 Signos de puntuacin con estilo 4 Letras griegas y smbolos matemticos 5 Otros smbolos comunes 6 Unicode 7 Vase tambin

[editar] Caracteres ISO-8859-1


Los siguientes caracteres del conjunto ISO-8859-1 (uno de los cdigos ASCII extendido) se pueden usar con seguridad en todas las pginas Wiki. La siguiente tabla lista el carcter en s, el cdigo para cada carcter en decimal y en hexadecimal, el nombre de la entidad HTML, y el nombre comn del carcter. Literal Hex 00A0 00A1 00A2 00A3 Dec 0160 0161 0162 0163 Carcter &nbsp; espacio que no produce saltos de lnea &iexcl; exclamacin de apertura &cent; signo de centavo &pound; signo de libra Entidad

00A4 00A5 00A7 00A8 00A9 00AA 00AB 00AC 00AE 00AF 00B0 00B1 00B4 00B5 00B6 00B7 00B8 00BA 00BB 00BF 00C0 00C1 00C2 00C3 00C4 00C5 00C6 00C7 00C8 00C9 00CA 00CB 00CC 00CD

0164 0165 0167 0168 0169 0170 0171 0172 0174 0175 0176 0177 0180 0181 0182 0183 0184 0186 0187 0191 0192 0193 0194 0195 0196 0197 0198 0199 0200 0201 0202 0203 0204 0205

&curren; &yen; &sect; &uml; &copy; &ordf; &laquo; &not; &reg; &macr; &deg; &plusmn; &acute; &micro; &para; &middot; &cedil; &ordm; &raquo; &iquest; &Agrave; &Aacute; &Acirc; &Atilde; &Auml; &Aring; &AElig; &Ccedil; &Egrave; &Eacute; &Ecirc; &Euml; &Igrave; &Iacute;

signo internacional de moneda signo de yen signo de seccin diresis signo de copyright indicador ordinal femenino comillas anguladas de apertura signo de negacin lgica signo de marca registrada raya alta signo de grado signo de ms/menos acento agudo signo de micro signo de fin de pargrafo punto medio (coma georgiana) cedilla indicador ordinal masculino comillas anguladas de cierre signo de interrogacin de apertura A con acento grave A con acento agudo A con acento circunflejo A con tilde A con diresis A con anillo Ligadura AE C cedilla E con acento grave E con acento agudo E con acento circunflejo E con diresis I con acento grave I con acento agudo

00CE 00CF 00D1 00D2 00D3 00D4 00D5 00D6 00D8 00D9 00DA 00DB 00DC 00DF 00E0 00E1 00E2 00E3 00E4 00E5 00E6 00E7 00E8 00E9 00EA 00EB 00EC 00ED 00EE 00EF 00F1 00F2 00F3 00F4

0206 0207 0209 0210 0211 0212 0213 0214 0216 0217 0218 0219 0220 0223 0224 0225 0226 0227 0228 0229 0230 0231 0232 0233 0234 0235 0236 0237 0238 0239 0241 0242 0243 0244

&Icirc; &Iuml; &Ntilde; &Ograve; &Oacute; &Ocirc; &Otilde; &Ouml; &Oslash; &Ugrave; &Uacute; &Ucirc; &Uuml; &szlig; &agrave; &aacute; &acirc; &atilde; &auml; &aring; &aelig; &ccedil; &egrave; &eacute; &ecirc; &euml; &igrave; &iacute; &icirc; &iuml; &ntilde; &ograve; &oacute; &ocirc;

I con acento circunflejo I con diresis N con tilde O con acento grave O con acento agudo O con acento circunflejo O con tilde O con diresis O con barra U con acento grave U con acento agudo U con acento circunflejo U con diresis doble s (alemn) a con acento grave a con acento agudo a con acento circunflejo a con tilde a con diresis a con anillo diptongo (ligadura) ae c cedilla e con acento grave e con acento agudo i co e con acento circunflejo e con diresis i con acento grave i con acento agudo i con acento circunflejo i con diresis n con tilde o con acento grave o con acento agudo o con acento circunflejo

00F5 00F6 00F7 00F8 00F9 00FA 00FB 00FC 00FF 20AB

0245 0246 0247 0248 0249 0250 0251 0252 0255 20AB

&otilde; &ouml; &divide; &oslash; &ugrave; &uacute; &ucirc; &uuml; &yuml; &dong;

o con tilde o con diresis signo de divisin o con barra u con acento grave u con acento agudo u con acento circunflejo u con diresis y con diresis dong

Estos caracteres son un subconjunto de los smbolos ms frecuentemente usados en Internet del juego de caracteres ASCII extendido, ISO 8859-1. Las pginas de Wikipedia son identificadas por el servidor como pginas con texto ISO-8859-1. Los caracteres mencionados anteriormente son un grupo seleccionado para mejorar la compatibilidad con otras mquinas. Por ejemplo, el Apple Macintosh se utiliza con frecuencia para su uso en Internet, no se encuentra limitado a ningn idioma en especial, y su juego de caracteres nativo (que no es ISO8859-1) contiene muchos de los caracteres internacionales. Varios navegadores para Macintosh traducen correctamente texto ISO en el juego de caracteres nativo, siempre y cuando los caracteres usados estn disponibles. As que la tabla descrita antes es un subconjunto de caracteres ISO-8859-1 que tambin se encuentran disponibles en el juego de caracteres nativo de Macintosh. El documento de cdigo estndar 1252 de Microsoft Windows es un conjunto ampliado de ISO-8859-1, as que estos caracteres tambin estn disponibles en mquinas Windows. Los juegos de caracteres latinos ms comunes aparte del ISO-8859-1 son el documento de cdigo MS-DOS 437 (pre-Windows), el Macintosh Roman, y otros conjuntos ISO como el ISO-8859-2. El nmero de mquinas pre-Windows MS-DOS con navegadores web es reducido y con frecuencia son mquinas dedicadas a un propsito especfico que no usaran Wikipedia de todas formas, as que es razonablemente seguro sacrificar la compatibilidad con aquellas mquinas a favor de los caracteres extranjeros necesitados. Otros conjuntos ISO por lo general estn orientados para ser ledos por otros navegadores que usan el mismo juego de caracteres en un mismo pas, y por lo tanto esas pginas deberan utilizar un juego de caracteres especfico a tal idioma. Estos caracteres pueden ingresarse bien sea usando referencias a entidades HTML conocidas como &agrave;, directamente por medio de algunos teclados, o por medio de cualquier tipo de recurso que est disponible al autor de pginas Wiki que necesite ingresar estos caracteres. Por ejemplo, autores Wiki que usan mquinas Windows pueden ingresar estos caracteres manteniendo pulsada la tecla Alt mientras que escriben el cdigo decimal de 4 dgitos correspondientes al carcter en el sector numrico del teclado. Es importante que todos los 4

dgitos (incluyendo el 0 del comienzo) se ingresen; usando un cdigo de 3 dgitos producir que se ingresen caracteres de la obsoleta codificacin 437. Autores Wiki que usan mquinas Macintosh deben tener cuidado de usar recursos especiales para ingresar estos caracteres en formato ISO-8859-1 en lugar de hacerlo con el juego de caracteres nativo, o bien puede usar las referencias a entidades HTML conocidas. Note que algunos usuarios de Windows pueden experimentar problemas con versiones del navegador Microsoft Internet Explorer que utilizan "Alt-Flecha Izquierda" y "Alt-Flecha Derecha" para el desplazamiento entre pginas. Estas combinaciones interfieren con el ingreso de cdigos que contienen los dgitos 4 y 6. En este caso use referencias a entidades HTML. Los caracteres de la tabla descrita pueden ser utilizados directamente como caracteres 8-bit en todas las pginas Wiki, y son suficientes para todas las pginas escritas principalmente en ingls, espaol, francs, alemn e idiomas que no requieren caracteres especiales aparte de aquellos (como el cataln). A pesar de su seguridad general, en este momento, no es posible utilizar estos caracteres en ttulos de pginas Wiki en la Wikipedia en ingls, aunque algunos de los Wikipedia Internacionales se encuentran configurados para aceptarlos.

[editar] Caracteres inseguros


Note en especial lo que hace falta aqu del juego de caracteres ISO-8859-1 completo: La barra vertical partida (0166=&brvbar;), el guion suave (0173=&shy;), los dgitos en superndice (0178=&sup2;, 0179=&sup3;), las fracciones comunes (0188=&frac14;, 0189=&frac12;, 0190=&frac34;), los caracteres eth y thorn islandeses (0208=&ETH;, 0240=&eth;, 0222=&THORN;, 0254=&thorn;), y el signo de multiplicacin (0215=&times;). Estos deberan considerarse inseguros (aparte existen sustitutos adecuados para muchos de ellos). Debe tenerse especial cuidado con aquellos caracteres que existen en el juego de caracteres nativo de algunas mquinas populares pero no en el conjunto mencionado anteriormente. No son seguros, aun cuando posiblemente usted los vea correctamente cuando los usa. Entre los caracteres que forman parte del documento de cdigo 1252 Windows pero no del ISO-8859-1 se encuentran el signo del euro (&euro;), la cruz y la doble cruz (&dagger;, &Dagger;), la vieta (&bull;), el signo de marca registrada (&trade;), los signos de puntuacin con estilo (ver ms adelante), el signo por mil (&permil;), algunas letras con acento carn de Europa Oriental, y los dgrafos oe. Entre los caracteres del juego de caracteres Macintosh Roman que no forman parte del ISO-8859-1 se encuentran la cruz y doble cruz, la vieta, el signo de marca registrada, algunos pocos smbolos matemticos como el infinito (&infin;) y el no-igual (&ne;), algunas letras griegas comnmente usadas como pi (&pi;), dgrafos (ligaduras) como oe y fl, signos de puntuacin con estilo, el signo de por mil, y algunos acentos como el breve, onogek y el carn. El lenguaje de etiquetas HTML 4.0 define entidades para algunos caracteres latinos no incluidos en el ISO-8859-1 y que son utilizados por idiomas populares, como el dgrafo OE (&OElig;, &oelig;), la Y mayscula con diresis (&Yuml;), y algunos caracteres de Europa Oriental con acentos como &scaron;. Estos tambin son inseguros; aun cuando si se ingresan como referencias a entidades HTML, puede que se muestren correctamente en algunas mquinas.

En resumen, no asuma que es seguro utilizar algn carcter especial solo porque se ve bien en su mquina. Utilice los caracteres de la tabla listada antes, y lea y entienda cmo usar los otros que se mencionan ms abajo.

[editar] Caracteres no-ISO posiblemente utilizables


Desde hace ya muchos aos la web est basada en el repertorio de caracteres Unicode. Se pueden tomar muchos caracteres de este conjunto extendido, ingresndolos ya sea como referencias a entidades HTML o directamente. Los navegadores web los reconocen e interpretan correctamente, quizs utilizando fuentes de carcter alternativas segn se requiera. Todos estos caracteres deben ser considerados menos seguros que los mencionados antes, pero solo en el sentido de que puede que no se muestren apropiadamente en algunas mquinas, aunque en forma de referencias a entidades HTML no resultan ambiguos, y preservan la integridad de los datos. Para muchos de estos, se encuentran disponibles sustitutos adecuados y arreglos, y deberan ser utilizados cuando la importancia de hacer el texto adecuado para usuarios de mquinas y software antiguo sobrepasa la importancia que puede tener una buena presentacin para aquellos con software ms reciente (a juicio del autor o editor).

[editar] Signos de puntuacin con estilo


Ausentes en el juego de caracteres ISO-8859-1, pero utilizados con frecuencia y presentes tanto en los conjuntos Macintosh Roman como en el documento de cdigo Windows 1252, y posteriormente incluidos en Unicode, existen algunos signos de puntuacin (comillas y rayas) apropiados para idiomas como el ingls y el espaol que poseen cierto estilo nico. Estos pueden ingresarse como referencias a entidades, y deberan mostrarse correctamente en la mayora de mquinas. Incluso algunos navegadores de modo texto son capaces de realizar las sustituciones apropiadas utilizando simples comillas y rayas de ASCII plano. Muchas de estas referencias no existan en versiones antiguas de HTML, por lo que es posible que no sean reconocidas por software poco reciente. Ya que utilizando estos caracteres se mantiene la integridad de los datos incluso en aquellas mquinas que no los muestran correctamente, se pueden considerar seguros de usar a menos que un despliegue adecuado en software antiguo sea crtico. Las comillas alemanas "low-9" son un caso similar, pero es menos frecuente que sean traducidas por software, y por lo tanto no son tan seguras. La siguiente tabla muestra estos caracteres precediendo a una "O" mayscula para mejor visibilidad: O O' O O O O &lsquo; &rsquo; &ldquo; &rdquo; &mdash; &ndash; comilla izquierda sencilla comilla derecha simple comilla izquierda doble comilla derecha doble raya larga raya corta

O &sbquo; comilla low-9 sencilla O &bdquo; comilla low-9 doble Muchos sitios web orientados a una audiencia de usuarios de Windows utilizan entidades tomadas del cdigo 1252 para estos caracteres: por ejemplo, utilizando &#151; para la raya larga. Esta no es una prctica aceptable, ya que se estara haciendo referencia en realidad al cdigo 151 de Unicode, que slo tiene un caracter de control. Con el propsito de asegurar la futura integridad de los datos y mxima compatibilidad, se deben reescribir estos caracteres a referencias como &mdash;.

[editar] Letras griegas y smbolos matemticos


Tradicionalmente para representar letras del alfabeto griego y otros smbolos matemticos en el entorno Windows era comn el uso de la tipografa Symbol. Con la adopcin generalizada de Unicode este mtodo es no slo obsoleto sino errneo. Para usar estos smbolos, ahora es necesario usar, como ya se dijo, entidades HTML o simplemente tipearlos (o copiarlos, ya que no suelen estar en los teclados). Las letras griegas maysculas y minsculas simplemente usan sus nombres completos como entidades. Estos caracteres deberan, por supuesto, ser utilizados nicamente para representar letras griegas ocasionales en texto principalmente latino. Texto realmente griego debera ser escrito utilizando un juego de caracteres griego para evitar archivos sobrecargados y de pobre respuesta. Aqu hay algunos ejemplos:

&alpha; &Gamma; &beta; &Lambda; &gamma; &Sigma; &pi; &Pi; &sigma; &Omega; &sigmaf; (sigma "final", nicamente en minscula)

Otros smbolos matemticos comunes:

< >

&lt; &rt; &ne; &prime; &le; &Prime; &ge; &part; &equiv; &int; &asymp; &sum; &infin; &prod; &radic;

Muchos de los smbolos en la fuente de carcter de Windows "Symbol" usados para interpretar smbolos matemticos (como los segmentos de corchetes expandibles) no estn presentes en muchas otras mquinas, y ni siquiera estn presentes en el Unicode 3.1 o como entidades HTML (aunque se encuentran planeados para Unicode 3.2). Estos son utilizados en productos como TtH para interpretar ecuaciones. No es posible hoy en da utilizar estos caracteres en pginas web de forma compatible para todos los lectores.

[editar] Otros smbolos comunes


Algunos caracteres como la vieta, el signo de la moneda euro, y el signo de marca registrada son casos especiales. Es muy factible que sean asimilados e interpretados de alguna manera en muchos navegadores. Debido a que son importantes para el comercio internacional, muchos sistemas los agregan a fuentes de carcter en alguna ubicacin no-estndar y los interpretan cuando se solicitan, o de lo contrario simplemente los interpreta en modos especiales que no requieren que se encuentren presentes en alguna fuente. Consulte la tabla a continuacin para ver cmo interpreta su navegador los siguientes smbolos: &bull; Vieta &euro; Signo de la moneda euro &trade; Signo de marca registrada Entre otros smbolos un poco menos comunes se encuentran los siguientes:

&dagger; &Dagger; &loz; &permil; &larr; &uarr; &rarr; &darr; &spades; &clubs; &hearts; &diams; &lsaquo; &rsaquo;

cruz doble cruz diamante signo por mil flecha hacia la izquierda flecha hacia arriba flecha hacia la derecha flecha hacia abajo pinta negra de espadas pinta negra de picas pinta negra de corazones pinta negra de diamantes comilla angulada sencilla de apertura comilla angulada sencilla de cierre

El uso de estos smbolos debe considerarse inseguro, excepto quiz en pginas orientadas a una audiencia especfica que muy probablemente utilice software bastante actualizado sobre mquinas populares.

[editar] Unicode
La codificacin de caracteres Unicode UCS-4 es la codificacin de caracteres oficial en HTML 4.0. Muchos navegadores, sin embargo, solo son capaces de cojer a personas que mantienen la vida en otro mundo del repertorio completo UCS-4. Por ejemplo, los cdigos &#1049; &#1511; &#1605; se despliegan en su navegador como , ,y ,los cuales idealmente deberan verse como la letra cirlica "I corta", la letra hebrea "qof", y la letra arbiga "mim", respectivamente. Es poco probable que su computador tenga todas esas fuentes y las muestre correctamente, aunque puede que muestre algunas de ellas. En cualquier caso, debido a que estos caracteres estn codificados de acuerdo al estndar, debern mostrarse correctamente en cualquier sistema que cumpla con el estndar y tenga disponibles los caracteres. Referencias a entidades numricas son la nica manera de ingresar estos caracteres en una pgina Wiki por el momento. Note que codificarlos utilizando decimal en lugar de hexadecimal (por ejemplo &#1049; en lugar de &#x419;) incrementar el nmero de navegadores en los que la referencia dar resultado. Vea tambin Unicode y HTML para consultar tablas de entidades de caracteres.

Вам также может понравиться