Anexo:Referencias a entidades de caracteres XML y HTML

En los documentos SGML, HTML y XML, las construcciones lógicas llamadas character data y attribute values consisten en secuencias de caracteres, en la cual cada carácter puede manifestarse directamente (es decir, representándose a sí mismo), o puede representarse mediante una serie de caracteres llamadas referencia de caracteres, de las cuales hay dos tipos: una referencia numérica de carácter y una referencia a entidades de caracteres. Este anexo lista las referencias a entidades de caracteres válidas en los documentos HTML y XML.

Una referencia de entidad de carácter hace referencia al contenido de una entidad nombrada. Las entidades son declaradas en una DTD, utilizando la sintaxis <!ENTITY nombre "valor">.

Formato editar

Una referencia de carácter numérica hace referencia a un carácter por su código Universal Character Set/Unicode, y usa el formato:

&#nnnn;

o

&#xhhhh;

donde nnnn es el código en base decimal, y hhhh es el código en base hexadecimal. La x debe ser minúscula en los documentos XML. La forma nnnn o hhhh puede ser cualquier número de dígitos y puede incluir ceros. La forma hhhh puede combinar mayúsculas y minúsculas, siendo las mayúsculas el estilo usual.

Por otro lado, una referencia a entidades de caracteres hace referencia a un carácter por su nombre en una entidad SGML que posee el carácter deseado como su reemplazo. La entidad debe estar ya predefinida (incluida dentro del lenguaje de marcado) o explícitamente declarada en una DTD. El formato es el mismo para cualquier entidad de referencia:

&name;

donde name es el nombre sensible a mayúsculas de la entidad. El punto y coma es obligatorio.

Estándares públicos de conjuntos entidades de caracteres editar

ISO Entity Sets
SGML proveyó un conjunto considerable de declaraciones de entidades para los caracteres más usados en la publicación occidental, para los sistemas de escritura latina, griega y cirílica. La American Mathematical Society también contribuyó para añadir símbolos matemáticos.
HTML Entity Sets
Las versiones tempranas de HTML construyeron pequeños conjuntos de caracteres, relacionados con los caracteres encontrados en el árbol de fuentes Western 8-bit.
MathML Entity Sets
El W3C desarrolló un conjunto de entidades de caracteres para MathML.
XML Entity Sets
El W3C MathML Working Group mantiene el conjunto público de entidades ISO, combinadas con las entidades MathML en el XML Entity Definitions for Characters. Este conjunto suple las necesidades en los documentos XHTML, MathML y las futuras versiones de HTML.
HTML5
HTML5 adopta las entidades XML como named character references, sin embargo, las reafirma sin referencia a sus fuentes y no las agrupa en conjuntos. Adicionalmente, la especificación de HTML5 provee mapeo entre nombre y cadena de caracteres Unicode con el uso de JSON.

Numerosos conjuntos de entidades se han desarrollado a partir de requerimientos particulares, y para scripts largos y cortos. Sin embargo, la llegada de Unicode ha mermado ampliamente su uso.

Entidades predefinidas en XML editar

La especificación de XML no utiliza el término "character entity" o "character entity reference". La especificación XML utiliza cinco "entidades predefinidas" representando caracteres especiales, y requiere que todos los procesadores de XML los utilicen. Las entidades también pueden ser declaradas explícitamente en el DTD[note 1]​, pero si se hace eso, el texto reemplazado debe ser el mismo que en su versión original. XML también permite otras entidades nombradas de cualquier tamaño para ser definidos en un entorno por documento.

La tabla siguiente lista cinco entidades predefinidas de XML:

  • La columna "Nombre" menciona el nombre de la entidad.
  • La columna "Carácter" muestra el carácter en sí mismo, para reproducir el carácter se utiliza el prefijo "&" y el sufijo ";": &nombre;. Por ejemplo, el carácter et se codifica como &amp; y se reproduce como &.
  • La columna "Punto de código Unicode" cita el carácter mediante el código estándar de notación UCS/Unicode "U+", que muestra el punto de carácter en hexadecimal. El equivalente decimal del carácter está escrito en el paréntesis.
  • La columna "Estándar" indica la primera versión de XML que incluye la entidad. La columna "Descripción" cita el carácter por su nombre común, casi siempre, una traducción de los asignados en la notación UCS/Unicode.
Nombre Carácter Punto de código Unicode Estándar Descripción
quot " U+0022 XML 1.0 comillas dobles
amp & U+0026 XML 1.0 símbolo et (&) o ampersand
apos ' U+0027 XML 1.0 apóstrofo
lt < U+003C XML 1.0 signo menor que
gt > U+003E XML 1.0 signo mayor que

Referencias de entidades de caracteres en HTML editar

La DTD de HTML4 define 252 entidades con un nombre, referencias que actúan como aliases mnemotécnicos para algunos caracteres de Unicode.[1]​ La especificación de HTML4 requiere el uso de DTDs estándar y no permite a los usuarios usar entidades adicionales.

En la tabla de abajo, La columna "Estándar" indica la primera versión del HTML DTD que define la referencia de la entidad del carácter. HTML 4.01 no provee ninguna referencia de caracteres nueva.

Para usar alguna de estas referencias en un documento HTML o XML, ingresa un ampersand (&) seguido por el nombre de la entidad y un punto y coma (;), por ejemplo, &amp; para el ampersand ("&").

Nombre Carácter Código Unicode (decimal) Estándar DTD[note 2] Subconjunto ISO antiguo[note 3] Descripción
quot " U+0022 (34) HTML 2.0 HTMLspecial ISOnum comillas inglesas
amp & U+0026 (38) HTML 2.0 HTMLspecial ISOnum ampersand
apos ' U+0027 (39) XHTML 1.0 HTMLspecial ISOnum apóstrofo
lt < U+003C (60) HTML 2.0 HTMLspecial ISOnum signo menos-que
gt > U+003E (62) HTML 2.0 HTMLspecial ISOnum signo más-que
nbsp U+00A0 (160) HTML 3.2 HTMLlat1 ISOnum espacio duro[note 4]
iexcl ¡ U+00A1 (161) HTML 3.2 HTMLlat1 ISOnum signo de exclamación de apertura
cent ¢ U+00A2 (162) HTML 3.2 HTMLlat1 ISOnum centavo
pound £ U+00A3 (163) HTML 3.2 HTMLlat1 ISOnum libra
curren ¤ U+00A4 (164) HTML 3.2 HTMLlat1 ISOnum signo de moneda
yen ¥ U+00A5 (165) HTML 3.2 HTMLlat1 ISOnum yen japonés, yuan chino
brvbar ¦ U+00A6 (166) HTML 3.2 HTMLlat1 ISOnum pleca cortada
sect § U+00A7 (167) HTML 3.2 HTMLlat1 ISOnum signo de sección
uml ¨ U+00A8 (168) HTML 3.2 HTMLlat1 ISOdia diéresis
copy © U+00A9 (169) HTML 3.2 HTMLlat1 ISOnum copyright
ordf ª U+00AA (170) HTML 3.2 HTMLlat1 ISOnum indicador ordinal femenino
laquo « U+00AB (171) HTML 3.2 HTMLlat1 ISOnum comillas españolas de apertura
not ¬ U+00AC (172) HTML 3.2 HTMLlat1 ISOnum negación lógica
shy   U+00AD (173) HTML 3.2 HTMLlat1 ISOnum guion blando
reg ® U+00AE (174) HTML 3.2 HTMLlat1 ISOnum marca registrada
macr ¯ U+00AF (175) HTML 3.2 HTMLlat1 ISOdia macron
deg ° U+00B0 (176) HTML 3.2 HTMLlat1 ISOnum grados
plusmn ± U+00B1 (177) HTML 3.2 HTMLlat1 ISOnum signo más-menos
sup2 ² U+00B2 (178) HTML 3.2 HTMLlat1 ISOnum 2 en superíndice
sup3 ³ U+00B3 (179) HTML 3.2 HTMLlat1 ISOnum 3 en superíndice
acute ´ U+00B4 (180) HTML 3.2 HTMLlat1 ISOdia acento grave
micro µ U+00B5 (181) HTML 3.2 HTMLlat1 ISOnum signo de micro
para U+00B6 (182) HTML 3.2 HTMLlat1 ISOnum párrafo
middot · U+00B7 (183) HTML 3.2 HTMLlat1 ISOnum punto medio
cedil ¸ U+00B8 (184) HTML 3.2 HTMLlat1 ISOdia cedilla
sup1 ¹ U+00B9 (185) HTML 3.2 HTMLlat1 ISOnum 1 en superíndicendice
ordm º U+00BA (186) HTML 3.2 HTMLlat1 ISOnum indicador ordinal masculino
raquo » U+00BB (187) HTML 3.2 HTMLlat1 ISOnum comillas angulares de cierre
frac14 ¼ U+00BC (188) HTML 3.2 HTMLlat1 ISOnum fracción 1/4
frac12 ½ U+00BD (189) HTML 3.2 HTMLlat1 ISOnum fracción 1/2
frac34 ¾ U+00BE (190) HTML 3.2 HTMLlat1 ISOnum fracción 3/4
iquest ¿ U+00BF (191) HTML 3.2 HTMLlat1 ISOnum Signo de apertura de interrogación
Agrave À U+00C0 (192) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula A con acento grave
Aacute Á U+00C1 (193) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula A con acento agudo
Acirc  U+00C2 (194) HTML 2.0 HTMLlat1 ISOlat1 letra latina A mayúscula con acento circunflejo
Atilde à U+00C3 (195) HTML 2.0 HTMLlat1 ISOlat1 letra latina A mayúscula con virgulilla
Auml Ä U+00C4 (196) HTML 2.0 HTMLlat1 ISOlat1 letra latina A mayúscula con diacrítico
Aring Å U+00C5 (197) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula A con anillo arriba
AElig Æ U+00C6 (198) HTML 2.0 HTMLlat1 ISOlat1 ligadura latina mayúscula AE
Ccedil Ç U+00C7 (199) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula A con acento grave
Egrave È U+00C8 (200) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula E con acento grave
Eacute É U+00C9 (201) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula E con acento agudo
Ecirc Ê U+00CA (202) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula E con acento circunflejo
Euml Ë U+00CB (203) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula E con diéresis
Igrave Ì U+00CC (204) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula I con acento grave
Iacute Í U+00CD (205) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula I con acento agudo
Icirc Î U+00CE (206) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula I con acento circunflejo
Iuml Ï U+00CF (207) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula I con diéresis
ETH Ð U+00D0 (208) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula Eth
Ntilde Ñ U+00D1 (209) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula N con virgulilla
Ograve Ò U+00D2 (210) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula O con acento grave
Oacute Ó U+00D3 (211) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula O con acento agudo
Ocirc Ô U+00D4 (212) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula O con acento circunflejo
Otilde Õ U+00D5 (213) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula O con virguilla
Ouml Ö U+00D6 (214) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula O con diéresis
times × U+00D7 (215) HTML 3.2 HTMLlat1 ISOnum signo de multiplicación
Oslash Ø U+00D8 (216) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula O con diagonal
Ugrave Ù U+00D9 (217) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula U con acento grave
Uacute Ú U+00DA (218) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula U con acento agudo
Ucirc Û U+00DB (219) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula U con acento circunflejo
Uuml Ü U+00DC (220) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula U con diéresis
Yacute Ý U+00DD (221) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula Y con acento agudo
THORN Þ U+00DE (222) HTML 2.0 HTMLlat1 ISOlat1 letra latina mayúscula Thorn
szlig ß U+00DF (223) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula Eszett
agrave à U+00E0 (224) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula a con acento grave
aacute á U+00E1 (225) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula a con acento agudo
acirc â U+00E2 (226) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula a con acento circunflejo
atilde ã U+00E3 (227) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula a con virguilla
auml ä U+00E4 (228) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula a con diéresis
aring å U+00E5 (229) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula a con anillo encima
aelig æ U+00E6 (230) HTML 2.0 HTMLlat1 ISOlat1 ligadura latina minúscula ae
ccedil ç U+00E7 (231) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula c con cedilla
egrave è U+00E8 (232) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula e con acento grave
eacute é U+00E9 (233) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula e con acento agudo
ecirc ê U+00EA (234) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula e con acento circunflejo
euml ë U+00EB (235) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula e con diéresis
igrave ì U+00EC (236) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula i con acento grave
iacute í U+00ED (237) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula i con acento agudo
icirc î U+00EE (238) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula i con acento circunflejo
iuml ï U+00EF (239) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula i con diéresis
eth ð U+00F0 (240) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula Eth
ntilde ñ U+00F1 (241) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula n con virgulilla
ograve ò U+00F2 (242) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula o con acento grave
oacute ó U+00F3 (243) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula o con acento agudo
ocirc ô U+00F4 (244) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula o con acento circunflejo
otilde õ U+00F5 (245) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula o con virgulilla
ouml ö U+00F6 (246) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula o con diéresis
divide ÷ U+00F7 (247) HTML 3.2 HTMLlat1 ISOnum Óbelo
oslash ø U+00F8 (248) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula o con diagonal
ugrave ù U+00F9 (249) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula u con acento grave
uacute ú U+00FA (250) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula u con acento agudo
ucirc û U+00FB (251) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula u con acento circunflejo
uuml ü U+00FC (252) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula u con diéresis
yacute ý U+00FD (253) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula y con acento agudo
thorn þ U+00FE (254) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula Thorn
yuml ÿ U+00FF (255) HTML 2.0 HTMLlat1 ISOlat1 letra latina minúscula y con diéresis
OElig Œ U+0152 (338) HTML 4.0 HTMLspecial ISOlat2 ligadura latina mayúscula OE
oelig œ U+0153 (339) HTML 4.0 HTMLspecial ISOlat2 ligadura latina minúscula oe
Scaron Š U+0160 (352) HTML 4.0 HTMLspecial ISOlat2 letra latina mayúscula S con carón
scaron š U+0161 (353) HTML 4.0 HTMLspecial ISOlat2 letra latina minúscula s con carón
Yuml Ÿ U+0178 (376) HTML 4.0 HTMLspecial ISOlat2 letra latina mayúscula Y con diéresis
fnof ƒ U+0192 (402) HTML 4.0 HTMLsymbol ISOtech letra latina minúscula f con cola
circ ˆ U+02C6 (710) HTML 4.0 HTMLspecial ISOpub acento circunflejo
tilde ˜ U+02DC (732) HTML 4.0 HTMLspecial ISOdia virgulilla
Alpha Α U+0391 (913) HTML 4.0 HTMLsymbol letra griega mayúscula Alpha
Beta Β U+0392 (914) HTML 4.0 HTMLsymbol letra griega mayúscula Beta
Gamma Γ U+0393 (915) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Gamma
Delta Δ U+0394 (916) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Delta
Epsilon Ε U+0395 (917) HTML 4.0 HTMLsymbol letra griega mayúscula Epsilon
Zeta Ζ U+0396 (918) HTML 4.0 HTMLsymbol letra griega mayúscula Zeta
Eta Η U+0397 (919) HTML 4.0 HTMLsymbol letra griega mayúscula Eta
Theta Θ U+0398 (920) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Theta
Iota Ι U+0399 (921) HTML 4.0 HTMLsymbol letra griega mayúscula Iota
Kappa Κ U+039A (922) HTML 4.0 HTMLsymbol letra griega mayúscula Kappa
Lambda Λ U+039B (923) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Lambda
Mu Μ U+039C (924) HTML 4.0 HTMLsymbol letra griega mayúscula Mu
Nu Ν U+039D (925) HTML 4.0 HTMLsymbol letra griega mayúscula Nu
Xi Ξ U+039E (926) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Xi
Omicron Ο U+039F (927) HTML 4.0 HTMLsymbol letra griega mayúscula Omicron
Pi Π U+03A0 (928) HTML 4.0 HTMLsymbol letra griega mayúscula Pi
Rho Ρ U+03A1 (929) HTML 4.0 HTMLsymbol letra griega mayúscula Rho
Sigma Σ U+03A3 (931) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Sigma
Tau Τ U+03A4 (932) HTML 4.0 HTMLsymbol letra griega mayúscula Tau
Upsilon Υ U+03A5 (933) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Upsilon
Phi Φ U+03A6 (934) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Phi
Chi Χ U+03A7 (935) HTML 4.0 HTMLsymbol letra griega mayúscula Chi
Psi Ψ U+03A8 (936) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Psi
Omega Ω U+03A9 (937) HTML 4.0 HTMLsymbol ISOgrk3 letra griega mayúscula Omega
alpha α U+03B1 (945) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula alpha
beta β U+03B2 (946) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula beta
gamma γ U+03B3 (947) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula gamma
delta δ U+03B4 (948) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula delta
epsilon ε U+03B5 (949) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula epsilon
zeta ζ U+03B6 (950) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula zeta
eta η U+03B7 (951) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula eta
theta θ U+03B8 (952) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula theta
iota ι U+03B9 (953) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula iota
kappa κ U+03BA (954) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula kappa
lambda λ U+03BB (955) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula lambda
mu μ U+03BC (956) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula mu
nu ν U+03BD (957) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula nu
xi ξ U+03BE (958) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula xi
omicron ο U+03BF (959) HTML 4.0 HTMLsymbol NUEVO letra griega minúscula omicron
pi π U+03C0 (960) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula pi
rho ρ U+03C1 (961) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula rho
sigmaf ς U+03C2 (962) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula final sigma
sigma σ U+03C3 (963) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula sigma
tau τ U+03C4 (964) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula tau
upsilon υ U+03C5 (965) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula upsilon
phi φ U+03C6 (966) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula phi
chi χ U+03C7 (967) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula chi
psi ψ U+03C8 (968) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula psi
omega ω U+03C9 (969) HTML 4.0 HTMLsymbol ISOgrk3 letra griega minúscula omega
thetasym ϑ U+03D1 (977) HTML 4.0 HTMLsymbol "NUEVO" símbolo griego theta
upsih ϒ U+03D2 (978) HTML 4.0 HTMLsymbol "NUEVO" letra griega minúscula Upsilon con gancho
piv ϖ U+03D6 (982) HTML 4.0 HTMLsymbol ISOgrk3 símbolo griego Pi
ensp U+2002 (8194) HTML 4.0 HTMLspecial ISOpub en (tipografía)[note 4]
emsp U+2003 (8195) HTML 4.0 HTMLspecial ISOpub em (tipografía)[note 4]
thinsp U+2009 (8201) HTML 4.0 HTMLspecial ISOpub espacio delgado[note 4]
zwnj   U+200C (8204) HTML 4.0 HTMLspecial NEW RFC 2070 zero-width non-joiner
zwj   U+200D (8205) HTML 4.0 HTMLspecial NEW RFC 2070 zero-width joiner
lrm   U+200E (8206) HTML 4.0 HTMLspecial NEW RFC 2070 marca izquierda-a-derecha
rlm   U+200F (8207) HTML 4.0 HTMLspecial NEW RFC 2070 marca derecha-a-izquierda
ndash U+2013 (8211) HTML 4.0 HTMLspecial ISOpub en dash
mdash U+2014 (8212) HTML 4.0 HTMLspecial ISOpub em dash
lsquo U+2018 (8216) HTML 4.0 HTMLspecial ISOnum comilla simple de apertura
rsquo U+2019 (8217) HTML 4.0 HTMLspecial ISOnum comilla simple de cierre
sbquo U+201A (8218) HTML 4.0 HTMLspecial "NUEVO" comilla simple baja de apertura
ldquo U+201C (8220) HTML 4.0 HTMLspecial ISOnum comilla doble de apertura
rdquo U+201D (8221) HTML 4.0 HTMLspecial ISOnum comilla doble de cierre
bdquo U+201E (8222) HTML 4.0 HTMLspecial "NUEVO" comilla doble baja de cierre
dagger U+2020 (8224) HTML 4.0 HTMLspecial ISOpub daga
Dagger U+2021 (8225) HTML 4.0 HTMLspecial ISOpub doble daga
bull U+2022 (8226) HTML 4.0 HTMLspecial ISOpub viñeta[note 5]
hellip U+2026 (8230) HTML 4.0 HTMLsymbol ISOpub elipsis horizontal
permil U+2030 (8240) HTML 4.0 HTMLspecial ISOtech signo de por mil
prime U+2032 (8242) HTML 4.0 HTMLsymbol ISOtech prima (minutos, pies)
Prime U+2033 (8243) HTML 4.0 HTMLsymbol ISOtech prima doble (segundos, pulgadas)
lsaquo U+2039 (8249) HTML 4.0 HTMLspecial ISO proposed comilla angular simple de apertura[note 6]
rsaquo U+203A (8250) HTML 4.0 HTMLspecial ISO proposed comilla angular simple de cierre[note 6]
oline U+203E (8254) HTML 4.0 HTMLsymbol "NUEVO" línea superior
frasl U+2044 (8260) HTML 4.0 HTMLsymbol "NUEVO" diagonal de fracción
euro U+20AC (8364) HTML 4.0 HTMLspecial "NUEVO" símbolo de euro
image U+2111 (8465) HTML 4.0 HTMLsymbol ISOamso letra gótica mayúscula I
weierp U+2118 (8472) HTML 4.0 HTMLsymbol ISOamso letra manuscrita mayúscula P
real U+211C (8476) HTML 4.0 HTMLsymbol ISOamso letra gótica mayúscula R
trade U+2122 (8482) HTML 4.0 HTMLsymbol ISOnum marca registrada
alefsym U+2135 (8501) HTML 4.0 HTMLsymbol "NUEVO" símbolo alef[note 7]
larr U+2190 (8592) HTML 4.0 HTMLsymbol ISOnum flecha hacia la izquierda
uarr U+2191 (8593) HTML 4.0 HTMLsymbol ISOnum flecha hacia arriba
rarr U+2192 (8594) HTML 4.0 HTMLsymbol ISOnum flecha hacia la derecha
darr U+2193 (8595) HTML 4.0 HTMLsymbol ISOnum flecha hacia abajo
harr U+2194 (8596) HTML 4.0 HTMLsymbol ISOamsa flecha hacia la izquierda-derecha
crarr U+21B5 (8629) HTML 4.0 HTMLsymbol "NUEVO" flecha hacia abajo con esquina hacia la izquierda
lArr U+21D0 (8656) HTML 4.0 HTMLsymbol ISOtech flecha doble hacia la izquierda
uArr U+21D1 (8657) HTML 4.0 HTMLsymbol ISOamsa flecha doble hacia arriba
rArr U+21D2 (8658) HTML 4.0 HTMLsymbol ISOnum flecha doble hacia la derecha
dArr U+21D3 (8659) HTML 4.0 HTMLsymbol ISOamsa flecha doble hacia abajo
hArr U+21D4 (8660) HTML 4.0 HTMLsymbol ISOamsa flecha doble hacia izquierda-derecha
forall U+2200 (8704) HTML 4.0 HTMLsymbol ISOtech para todo
part U+2202 (8706) HTML 4.0 HTMLsymbol ISOtech derivada parcial
exist U+2203 (8707) HTML 4.0 HTMLsymbol ISOtech existe
empty U+2205 (8709) HTML 4.0 HTMLsymbol ISOamso conjunto vacío; véase también U+8960, ⌀
nabla U+2207 (8711) HTML 4.0 HTMLsymbol ISOtech nabla (operador diferencial vectorial)
isin U+2208 (8712) HTML 4.0 HTMLsymbol ISOtech elemento de
notin U+2209 (8713) HTML 4.0 HTMLsymbol ISOtech no es un elemento de
ni U+220B (8715) HTML 4.0 HTMLsymbol ISOtech contiene a
prod U+220F (8719) HTML 4.0 HTMLsymbol ISOamsb productorio
sum U+2211 (8721) HTML 4.0 HTMLsymbol ISOamsb suma integral
minus U+2212 (8722) HTML 4.0 HTMLsymbol ISOtech signo de menos
lowast U+2217 (8727) HTML 4.0 HTMLsymbol ISOtech operador asterisco
radic U+221A (8730) HTML 4.0 HTMLsymbol ISOtech signo radical
prop U+221D (8733) HTML 4.0 HTMLsymbol ISOtech proporcional a
infin U+221E (8734) HTML 4.0 HTMLsymbol ISOtech infinito
ang U+2220 (8736) HTML 4.0 HTMLsymbol ISOamso ángulo
and U+2227 (8743) HTML 4.0 HTMLsymbol ISOtech operador «Y»
or U+2228 (8744) HTML 4.0 HTMLsymbol ISOtech operador «O»
cap U+2229 (8745) HTML 4.0 HTMLsymbol ISOtech intersección
cup U+222A (8746) HTML 4.0 HTMLsymbol ISOtech unión
int U+222B (8747) HTML 4.0 HTMLsymbol ISOtech integral
there4 U+2234 (8756) HTML 4.0 HTMLsymbol ISOtech signo de «por lo tanto»
sim U+223C (8764) HTML 4.0 HTMLsymbol ISOtech operador virgulilla
cong U+2245 (8773) HTML 4.0 HTMLsymbol ISOtech congruente a
asymp U+2248 (8776) HTML 4.0 HTMLsymbol ISOamsr aproximado a
ne U+2260 (8800) HTML 4.0 HTMLsymbol ISOtech signo de inecuación
equiv U+2261 (8801) HTML 4.0 HTMLsymbol ISOtech idéntico a
le U+2264 (8804) HTML 4.0 HTMLsymbol ISOtech menor o igual a
ge U+2265 (8805) HTML 4.0 HTMLsymbol ISOtech mayor o igual a
sub U+2282 (8834) HTML 4.0 HTMLsymbol ISOtech subconjunto de
sup U+2283 (8835) HTML 4.0 HTMLsymbol ISOtech superconjunto de
nsub U+2284 (8836) HTML 4.0 HTMLsymbol ISOamsn no es un subconjunto de
sube U+2286 (8838) HTML 4.0 HTMLsymbol ISOtech subconjunto de o igual a
supe U+2287 (8839) HTML 4.0 HTMLsymbol ISOtech superconjunto de o igual a
oplus U+2295 (8853) HTML 4.0 HTMLsymbol ISOamsb signo de suma inscrita
otimes U+2297 (8855) HTML 4.0 HTMLsymbol ISOamsb signo de multiplicación inscrito
perp U+22A5 (8869) HTML 4.0 HTMLsymbol ISOtech operador de falsedad
sdot U+22C5 (8901) HTML 4.0 HTMLsymbol ISOamsb operador de punto
lceil U+2308 (8968) HTML 4.0 HTMLsymbol ISOamsc techo izquierdo
rceil U+2309 (8969) HTML 4.0 HTMLsymbol ISOamsc techo derecho
lfloor U+230A (8970) HTML 4.0 HTMLsymbol ISOamsc piso izquierdo
rfloor U+230B (8971) HTML 4.0 HTMLsymbol ISOamsc piso derecho
lang U+2329 (9001) HTML 4.0 HTMLsymbol ISOtech paréntesis angular de apertura
rang U+232A (9002) HTML 4.0 HTMLsymbol ISOtech paréntesis angular de cierre
loz U+25CA (9674) HTML 4.0 HTMLsymbol ISOpub losange
spades U+2660 (9824) HTML 4.0 HTMLsymbol ISOpub pica[note 5]
clubs U+2663 (9827) HTML 4.0 HTMLsymbol ISOpub trébol[note 5]
hearts U+2665 (9829) HTML 4.0 HTMLsymbol ISOpub corazón[note 5]
diams U+2666 (9830) HTML 4.0 HTMLsymbol ISOpub diamante[note 5]

Entidades que representan caracteres especiales en XHTML editar

Las DTDs de XHTML declaran explícitamente 253 entidades (incluyendo las 5 ya predefinidas de XML 1.0), por lo que son expandidas en un solo carácter, son referidas informalmente como entidades de caracteres. Éstas (con la excepción de &apos;) tienen los mismos nombres y representan los mismos caracteres que las 252 referencias de entidades de caracteres en HTML. Además, como una ventaja de XML, los documentos XHTML referenciar la entidad predefinida &apos;, el cual no forma parte del grupo anterior. Entidades adicionales de cualquier tamaño pueden ser definidas por documento. Sin embargo, la usabilidad de las referencias de entidades en XHTML es afectada por la forma en que el documento es procesado:

  • Si el documento es leído por un analizador sintáctico HTML, entonces solo las 252 entidades de caracteres HTML pueden ser usadas confiablemente. El uso de &apos; o alguna entidad propia no será soportado y puede producir resultados inesperados.
  • Si el documento es leído por un analizador sintáctico XML que no lee entidades externas, entonces solo las 5 entidades de caracteres XML pueden ser usadas con seguridad, aunque otras entidades pudiesen ser usadas si son declaradas en una DTD interna.
  • Si el documento es leído por un analizador sintáctico XML que lee entidades externas, las 5 entidades de caracteres XML pueden ser usadas con seguridad. Las otras 248 entidades HTML pueden ser usadas siempre y cuando la DTD de XHTML sea accesible por el analizador mientras el documento es analizado. Otras entidades pueden ser usadas si se declaran en una DTD interna.

Debido al caso especial de &apos; ya mencionado, solo &quot;, &amp;, &lt; y &gt; funcionarán en todas las situaciones.

Notas editar

  1. Las referencias normativas hacia el RFC 2070 (hallada en DTDs que definen las entidades de caracteres para HTML o XHTML) es histórica; este RFC (junto con otros RFCs relacionados con partes diferentes de la especificación HTML) se volvió obsoleta en favor del RFC 2854, el cual define el MIME type "text/html" y referencia directamente a la especificación W3C para el contenido HTML actual.
  2. DTD: el FPI de las DTDs donde las entidades anteriores son definidas son obtenidas de una de las siguientes tres entidades:
    • HTMLlat1 refiere a:
      • PUBLIC "-//W3C//ENTITIES Latin 1//EN//HTML" in HTML (la DTD es definida implícitamente, no es necesario especificar la URI);
      • PUBLIC "-//W3C//ENTITIES Latin 1 for XHTML//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent" en XHTML 1.0;
    • HTMLsymbol refiere a:
    • HTMLspecial refiere a:
  3. Subconjunto ISO antiguo: son subconjuntos documentados de caracteres antiguos usados en codificaciones heredadas antes de la unificación en la norma ISO 10646.
  4. a b c d Espacios: un fondo azul es usado para mostrar el ancho de cada espacio.
  5. a b c d e hace referencia a la viñeta rellenada, en contraposición a la hueca.
  6. a b Propuestos por ISO: estos caracteres fueron estandarizados en la norma ISO 10646 después del lanzamiento de HTML 4.0.
  7. alefsym: 'alef symbol' no es el mismo que U+05D0 'letra hebrea alef', aunque el mismo glifo sea usado para mostrar ambos caracteres.

Referencias editar

  1. «Character entity references in HTML 4» (en inglés). W3C. Consultado el 27 de septiembre de 2018. 

Enlaces externos editar