Diferencia entre revisiones de «ISO/IEC 10646»
Contenido eliminado Contenido añadido
m Robot: Reemplazo automático de texto (-prohibe +prohíbe, -prohibo +prohíbo) |
m Correcciones menores PR:CEM. |
||
Línea 1:
El [[Normalización|estándar]] internacional '''[[International Organization for Standardization|ISO]]/[[International Electrotechnical Commission|IEC]] 10646''' define el '''Conjunto de Caracteres Universal''' (denominado también en [[idioma inglés|inglés]] como: '''Universal Character Set''' - UCS) como un sistema [[codificación de caracteres]] en varios [[octeto]]s. Contiene cerca de cien mil [[Carácter (informática)|caracter]]es abstractos, cada uno de ellos identificado de forma precisa por un número [[entero]] denominado '''punto de código''' ('''code point'''). Se
En este conjunto se encuentran los diversos caracteres (letras, números, símbolos, ideogramas, logogramas, etc.) procedentes de muchos [[lenguaje]]s, [[Escritura|scripts]],etc así como las diversas tradiciones de puntuación existentes en todos los idiomas del mundo, representadas en los códigos únicos UCS. Es de pensar que la inclusión de nuevos caracteres es constante, haciendo que el conjunto esté permanentemente en estado de actualización.
Línea 12:
La primera enmienda a la edición original del UCS se definió como '''[[UTF-16]]''', y era una extensión del UCS-2, para representar códigos punto fuera del BMP. En la actualidad existen una zona especial de códigos punto denominada '''S''' (Special) en el BMP que permanece sin asignar a caracteres. El UCS-2 no permite emplear valores de código para estos puntos de código, pero UTF-16 permite el empleo de los mismos en pares. Cada par consiste en un "elemento-RC" (una [[tupla]] de dos octetos que forman un R-octeto y un C-octeto de una secuencia total de cuatro octetos que se asocia a una celda en el espacio de códigos asignados a caracteres). El estándar Unicode ha adoptado también el UTF-16, pero en la terminología de Unicode, la mitad-alta de la zona de elementos se denomina "sustituciones altas" y la mitad inferior de la tabla se denomina "sustituciones bajas".
Otra codificación es la '''[[UCS-4]]''' que emplea un carácter único entre 0 y (
== Historia de la ISO 10646==
|