Diferencia entre revisiones de «UTF-16»

Contenido eliminado Contenido añadido
Tatumbo (discusión · contribs.)
Tatumbo (discusión · contribs.)
mSin resumen de edición
Línea 7:
* Es capaz de representar cualquier carácter Unicode.
* Utiliza símbolos de logitud variable: 1 o 2 [[Palabra_(informática)|palabras]] de 16 bits por carácter Unicode (2 o 4 bytes). La unidad de información es la [[Palabra_(informática)|palabra]] de 16 bits.
* Está optimizado para representar caracteres en el ''plano básico multilíngüemultilingüe'' o BMP; caracteres en el rango U+0000 a U+FFFF. El BMP contiene la gran mayoría de caracteres y sistemas de escritura en uso en la actualidad. Cuando se limita al plano básico multilíngüemultilingüe, UTF-16 puede ser considerado una forma de codificación con símbolos de tamaño fijo (16 bits).
* No superposición: Los símbolos de 1 palabra (16 bits) utilizan un subconjunto de valores que no puede utilizarse en símbolos de 2 palabras (32 bits).
 
Línea 16:
 
== Descripción ==
En UTF-16 cada punto de código entre 0 y FFFF se codifica, sin cambios, utilizando 16 bits. Este rango se corresponde con el ''plano básico multilíngüemultilingüe'' de Unicode, por lo que la gran mayoría de los caracteres de uso común se codifican con 16 bits.
 
Los caracteres de los planos adicionales, se codifican mediante 32 bits. La codificación no se hace de forma directa, es decir, el código final no es el valor del punto de código. UTF-16 define un formato de transformación para estos casos denominado ''pares subrogados''.