Diferencia entre revisiones de «ISO/IEC 10646»
Contenido eliminado Contenido añadido
Revertidos los cambios de 190.51.39.166 a la última edición de MetsBot con monobook-suite |
Sin resumen de edición |
||
Línea 5:
Desde el año [[1991]], el [[Unicode Consortium]] ha venido trabajando con el organismo ISO con el objeto de desarrollar el ''[[Unicode|The Unicode Standard]]'' ("Unicode") y el ISO/IEC 10646 conjuntamente. El repertorio, el nombre de los caracteres, los puntos de código de la versión 2.0 de Unicode hacen un ajuste perfecto con las siete primeras publicaciones de la ISO/IEC 10646-1:1993. Tras la publicación de Unicode 3.0 en febrero de [[2000]], se fueron introduciendo nuevos caracteres en el UCS vía el ISO/IEC 10646-1:2000.
El conjunto UCS tiene cerca de 1,1 millones de código punto, pero sólo los primeros 65.536 (la '''[[Asociación de caracteres unicode]]''', o BMP) han entrado en uso antes del año [[2000]]. Esta situación comenzó a cambiar cuando [[República Popular China]] (RPC) solicitó en el año 2000 que los
== Formas de codificar el "Conjunto Universal de Caracteres" ==
El ISO 10646 define diversos "''formas de codificación''" de caracteres para el conjunto universal de caracteres (''Universal Character Set''). La más simple es la denominada, '''UCS-2''' que emplea un ''valor de código'' simple (definido como uno o más números representando un código punto) entre 0 y 65,535 para cada carácter, y permite
La primera enmienda a la edición original del UCS se definió como '''[[UTF-16]]''', y era una extensión del UCS-2, para representar códigos punto fuera del BMP. En la actualidad existen una zona especial de códigos punto denominada '''S''' (Special) en el BMP que permanece sin asignar a caracteres. El UCS-2 no permite emplear valores de código para estos puntos de código, pero UTF-16 permite el empleo de los mismos en pares. Cada par consiste en un "elemento-RC" (una [[tupla]] de dos octetos que forman un R-octeto y un C-octeto de una secuencia total de cuatro octetos que se asocia a una celda en el espacio de códigos asignados a caracteres). El estándar Unicode ha adoptado también el UTF-16, pero en la terminología de Unicode, la mitad-alta de la zona de elementos se denomina "sustituciones altas" y la mitad inferior de la tabla se denomina "sustituciones bajas".
|