Existen algunos caracteres reservados que no podemos utilizar en nuestros documentos XML, pues se usan en la sintaxis de XML.
Por ejemplo, los caracteres "<", ">", "&", etc.
Para solucionar estos podemos utilizar las referencias de entidad.
Las referencias de entidad en XML proporcionan un mecanismo de substitución textual. En XML se definen las siguientes referencias de entidad:
Entidad | Sustitución |
---|---|
< | < |
> | > |
& | & |
' | ' |
" | " |
XML también soporta referencia de carácter en donde una letra se reemplaza con un carácter equivalente en Unicode. Se trata de cadenas de la forma &#nnn donde nnn es el número decimal Unicode del carácter a insertar o &#xnnn donde nnn sería el número hexadecima Unicode.
Por ejemplo para incluir el símbolo de copyrigt "©" en un documento XML debemos utilizar ©, o ©.
XML permite que se puedan definir nuevas entidades. Algunas (parsed entities) pueden contener texto y etiquetas XML, mientras que otras (unparsed entities) sirven para almacenar cualquier tipo de datos (imágenes, sonidos...). Este tipo de entidades se deben definir en una DTD.