Wikipedia:Café/Archivo/Técnica/Actual




Unicode, el idioma vietnamita y el artículo Thich Nhat HanhEditar

Hola, usuarios y expertos del área técnica. Espero se encuentren bien de salud. Les escribo por sugerencia del bibliotecario Taichi, y lo hago para comentarles una particularidad que se presenta con el nombre del artículo Thich Nhat Hanh.

Y el punto en cuestión lo hallé también en el área de discusion del artículo en la enWikipedia. Y es que en mi computador, el artículo de esWikipedia me aparece siempre: «Nhâ´t», con un tilde que separa Nhâ de la letra t. En parte a ello se refiere el usuario en el talk:

== Correct Unicode characters for "Nhất" ==

Can change somebody the characters of his name, from "Nhâ´t" to "Nhất". Looks like currently it is "â" with "combining acute", whereas in fact it should be a fully composed "ấ". Stefanhanoi (talk) 20:20, 30 April 2019 (UTC)

En fin, que me llama poderosamente la atención ver «Nhâ´t» en vez de «Nhat», como aparece el nombre del biografiado en todos sus libros en español, lo cual resulta confuso para los usuarios, y es una diferencia de proporciones. Por eso, respetuosamente, creo que convendría chequear, cómo está apareciendo realmente el nombre del artículo en diferentes dispositivos. ¿Hay algún problema atribuible al texto Unicode y las dobles tildes? Desde ya, les quedo muy agradecido si pueden verificar este aspecto.

Muy atentamente,--NewAngus (discusión) 00:55 28 jun 2020 (UTC)

Hola NewAngus, no es un problema del título sino de las fuentes que estás usando en tu sistema. El mismo caracter con fuentes distintas se pueden mostrar de modos diferentes; por ejemplo:
Estas cuatro fuentes son las que usa el sistema para mostrar los títulos. Si no usas Linux, posiblemente no tengas instalada una fuente 'Linux Libertine' y en su lugar verás una serif genérica. Si usas Google Chrome en Windows con las fuentes que trae por defecto, verás que la opción con 'Georgia' es la que se ve mal, pues dicha fuente de Microsoft Corporation no es compatible con tales caracteres. Si usas Mozilla Firefox seguramente no tengas ese problema con 'Georgia', pues a diferencia de Chrome este navegador usará 'Times' en aquellos caracteres que falten en la anterior. En cualquier caso con 'Times' o con serif deberías ver bien el caracter siempre que tengas instaladas fuentes Unicode. Entonces puedes: a) tratar de instalar la fuente 'Linux Libertine' (descarga aquí), b) buscar e instalar una fuente 'Georgia' alternativa y compatible con los caracteres Unicode del idioma vietnamita (no será la oficial y ni siquiera sé si existe tal alternativa), c) desinstalar completamente las fuentes 'Georgia' para llegar al título en formato 'Times' (no recomiendo quedar sin fuentes 'Georgia' pues son bastante comunes), o d) desligar el título de 'Georgia' escribiendo un estilo personalizado como el siguiente en tu common.css:
.mw-body h1, .mw-body-content h1, .mw-body-content h2 { font-family: 'Linux Libertine','Times',serif!important; }
Recomiendo a) o d) por ese orden. Un saludo. -- Leoncastro (discusión) 02:53 28 jun 2020 (UTC)

DigresiónEditar

Al margen de las tipografías, ¿no conviene usar caracteres totalmente compuestos, en vez de este híbrido de un carácter compuesto combinado con un diacrítico? Estoy de acuerdo con lo que dice Stefanhanoi arriba. --angus (msjs) 21:30 28 jun 2020 (UTC)
@Angus, desde MediaWiki 1.5 los títulos se almacenan en formato UTF-8 (véase meta:Help:Special characters), por lo que los caracteres Unicode deben descomponerse antes de almacenarse. En este caso lo puedes descomponer en dos partes (â + ´) o en tres partes (a + ^ + ´), y lo más efectivo es lo primero. -- Leoncastro (discusión) 21:58 28 jun 2020 (UTC)
Leoncastro, ¿podés explicar cómo se llega de "los títulos se almacenan en formato UTF-8" a "los caracteres Unicode deben descomponerse"? ¿Por qué no se puede usar un carácter totalmente compuesto como U+1EA5 (en UTF-8, E1 BA A5)? --angus (msjs) 06:53 29 jun 2020 (UTC)
A ver Angus, para entender eso requerirá que se comprendan ciertos aspectos técnicos, por lo que pido disculpas de antemano si la siguiente explicación incomoda al resto de lectores. En UTF-8 los caracteres se almacenan en unidades de byte (ocho bits), que representados en hexadecimal esto significa un rango de 00 a FF. El caracter U+1EA5 está formado por un word (dieciseis bits), y pertenece al rango UTF-16. Ambos son caracteres Unicode, pero cada uno tiene una longitud de almacenamiento diferente. Aunque es posible almacenar un word (16 bits) en el sitio de dos bytes (2 × 8 bits), esto es un error cuando el intérprete va a leer los datos en secuencias de bytes, pues produce que el procesador trate cada mitad del word de manera separada; es decir, que en lugar de leer 1EA5 (ấ), leerá de forma independiente 1E (▲) y A5 (Ñ). Para evitar esto, en el estándar UTF-8 se han definido una serie de sencillas reglas para poder dividir los caracteres Unicode en secuencias de bytes. Así, el caracter U+1EA5 en UTF-16 equivale a la secuencia en bytes E1 BA A5 en UTF-8.
Esos tres bytes son precisamente los que se están almacenando para el título. No hay más que copiar la dirección del artículo para comprobarlo. Esta dirección muestra la siguiente ruta codificada: https://es.wikipedia.org/wiki/Th%C3%ADch_Nh%E1%BA%A5t_H%E1%BA%A1nh; donde puede verse la secuencia.
Ahora bien, una vez explicado el sistema de codificación, vamos al sistema de representación. Pues los archivos de fuentes no almacenan los más de cien mil caracteres definidos en el estándar Unicode (que si no recuerdo mal alberga un espacio para definir hasta un par de millones), sino que en gran parte de los casos realizan la combinación de varios caracteres sencillos para representar un caracter compuesto. Esto se realiza en la fuente mediante unas tablas que vinculan determinadas secuencias o caracteres compuestos a determinadas combinaciones de letras. La secuencia E1 BA A5 se descodifica como U+1EA5, cuyo valor está vinculado a la combinación â + ´. La otra opción, que sería a + ^ + ´, se obtendría de la combinación U+0061 + U+0302 + U+0301, que en UTF-8 generaría una secuencia mucho más compleja que los tres bytes ya mencionados. La forma en cómo estas combinaciones se procesan para su visualización depende únicamente del tipo de fuente usado, pues tienen que estar predefinidas en las tablas de vinculación o de lo contrario se muestran como caracteres separados (que es lo que sucede con 'Georgia').
Entonces no es que no se pueda usar el caracter compuesto U+1EA5; sí se puede usar, y precisamente es el que se está usando. Otra cosa es cómo lo componen las fuentes para representarlo. Las soluciones las he explicado más arriba en mi primer comentario: preferiblemente instalar Linux Libertine o aplicar un parche al estilo. Saludos. -- Leoncastro (discusión) 12:23 29 jun 2020 (UTC)
Leoncastro: ajá, ya entendí lo que pasa. No es exactamente lo que ponés acá arriba, pero tu primera respuesta es totalmente acertada. Voy a poner una división para no distraer con esta digresión.
En resumen: el carácter usado en el título es totalmente compuesto (U+1EA5 es LATIN SMALL LETTER A WITH CIRCUMFLEX AND ACUTE; la combinación â + ´ sería U+00E2 U+0301), pero la tipografía, al no tener un glifo dedicado a esa particular combinación de letra + diacríticos, lo representa como la secuencia â + ´ (y sin el kerning necesario) (o quizás sea el navegador "inteligente" el que reemplaza uno por otro). O sea, un problema puramente de la tipografía, como bien dijiste, y sin nada que ver con codificaciones o normalizaciones de Unicode. Gracias. --angus (msjs) 14:22 29 jun 2020 (UTC)

Ayuda con plantilla selección de baloncestoEditar

La plantilla {{selección de baloncesto}} incluye automáticamente el nombre selección de baloncesto. Esto genera problemas en casos de artículos como Selección de básquetbol de Argentina o Selección de básquetbol de Chile que tanto oficialmente (fuentes primarias) como a nivel de fuentes secundarias, son conocidas como selecciones de básquetbol y no de baloncesto. Por tanto, los artículos ha sido renombrados, pero el nombre que viene dado por la plantilla no se puede cambiar. Por tanto dentro de lo posible, me gustaría requerir que la plantilla sea modificada, para que las selecciones puedan ser llamadas de baloncesto o de básquetbol según cúal sea el uso predominante en funtes primarias y secundarias.SFBB (discusión) 19:26 28 jun 2020 (UTC)

Resuelto el tema de la plantilla {{Ficha de selección de baloncesto}}. El título de la ficha será el mismo título del artículo (sin coletilla, si la tuviese). Aunque hay tantas otras cosas por resolver en esos artículos... CC: SFBB. -- Leoncastro (discusión) 21:27 28 jun 2020 (UTC)
Muchas gracias. SFBB (discusión) 11:39 29 jun 2020 (UTC)

Wikidata weekly summary #422Editar

Tech News: 2020-27Editar

16:30 29 jun 2020 (UTC)

Edité una página y aun salen los banners de que necesita referenciaEditar

Hola. He creado una página que entiendo tiene todas las referencias de webs internacionales, y aun así salen los banners. Solicito ayuda. — El comentario anterior sin firmar es obra de Claprd (disc.contribsbloq). --Леон Поланко говорит вам и слушает вас 02:08 30 jun 2020 (UTC)

¿Que dicen dichos banners? ¿Y cuál es la página en cuestión? --Леон Поланко говорит вам и слушает вас 02:09 30 jun 2020 (UTC)
esta es la pagina https://es.wikipedia.org/wiki/In%C3%A9s_P%C3%A1ez_Nin_(Chef_Tita) los banners cuestionan la calidad de la información.
Claprd (disc. · contr. · bloq.): no son banners, son plantillas de mantenimiento, el artículo fue creado aparentemente con redacción promocional y no neutral, de todas maneras podrías contactar con el usuario AntoFran (disc. · contr. · bloq.), que fue quién le colocó al artículo las mencionadas plantillas. --Леон Поланко говорит вам и слушает вас 02:15 30 jun 2020 (UTC)
Gracias le contactaré de inmediato. quité todo lo preomocional haciendo el artículo, puedes verlo. gracias. — El comentario anterior sin firmar es obra de Claprd (disc.contribsbloq). --Леон Поланко говорит вам и слушает вас 02:17 30 jun 2020 (UTC)
Continúan saliendo las plantillas de mantenimiento. Y está arreglado todo lo que se me ha pedido. No sé que más hacer pues le he escrito directo también a quines las pusieron. Claprd

HE ESCRITO DOS ARTÍCULOS Y A AMBOS LE HAN PUESTO UNA PLANTILLA DE DESTRUIR EL USUARIO MIGUEALCAN SIN RAZÓN ALGUNA PUES AMBAS PÁGINAS FUERON HECHAS EXACTAMENTE IGUAL QUE OTRAS DE PERSONALIDADES SIMILARES Y CON LAS REFERENCIAS Y CATEGORÍAS SOLICITADAS. Necesito ayuda de algún editor de WIKIPEDIA que revise esta acción abusiva.

Por otro lado conozco al editor que puso la plantilla, de hecho lo tengo en las redes sociales. Me parece injusto de su parte pues parece que tiene intenciones personales para hacerlo y eso va en contra de la comunidad de wikipedia.

Las páginas con la plantilla son: Ines Páez Nin Y Josué Guerrero Rojas — El comentario anterior sin firmar es obra de Claprd (disc.contribsbloq). --Леон Поланко говорит вам и слушает вас 01:04 2 jul 2020 (UTC)

Claprd (disc. · contr. · bloq.): el usuario que colocó las plantillas aún no las ha retirado, ni nadie ha retirado las plantillas, por eso es que aún aparecen en el artículo. Puedes contactar en su discusión al usuario que colocó las plantillas para preguntarle si ya podría ser factible que se retiren las plantillas al artículo. Te recomiendo que escribas en la discusión de dicho usuario. --Леон Поланко говорит вам и слушает вас 01:07 2 jul 2020 (UTC)

¡Cuestión!Editar

Hola, me gustaría saber si esta versión de Wikipedia tiene un script o otra herramienta que le permita automatizar la traducción de los parámetros de las plantillas de fuentes. Edmond Dantès d'un message? 20:50 30 jun 2020 (UTC)

  No existe. Usuario Sin Identidad (discusión) 09:59 1 jul 2020 (UTC)

¿Cómo citar en es.Wikipedia referencias en Wikidata?Editar

¿Cómo citar en es.Wikipedia referencias en Wikidata?

En inglés, hay en:Template:Cite Q. Lo utilizco como <ref>{{cite Q|Q5682}}<!-- elemento en Wikidata para Miguel de Cervantes. -->.</ref>

Yo podría traducir la documentación pero necesitaría ayuda con el software.

(Traduje de francés en inglés, y me gustaríar traducirlo también en español, pero no me gusta usar "Plantilla:Obra citada" para las referencias.) Gracias, DavidMCEddy (discusión) 18:42 1 jul 2020 (UTC)

A la vista de los múltiples problemas que se declaran en la propia plantilla, yo no importaría esa plantilla a otro proyecto. Especialmente porque no se hace ningún tratamiento si en Wikidata los datos no están en el idioma adecuado. No creo que sea bueno traer más problemas a este proyecto. Además, precisamente tu ejemplo de uso <ref>{{cite Q|Q5682}}</ref> no sirve para referenciar ninguna fuente, pues solamente enlaza al artículo de Miguel de Cervantes, a la colección de todas sus obras en Open Library, y al elemento asociado en Wikidata. Un mal ejemplo que nos permite vislumbrar el mal uso que se dará a esa plantilla. En todo caso debería limitarse su uso para enlazar a obras concretas (publicaciones científicas o libros) como los ejemplos de la documentación (que por lo menos hacen referencia a una obra determinada). -- Leoncastro (discusión) 19:05 1 jul 2020 (UTC)
Sí, eso era un muy mal ejemplo. Un mejor ejemplo es un 2015 artículo de Sophia Fay, citado en ambos en:Julia Cagé y fr:Julia Cagé como referencia [1] en inglés y “4” en francés. El código MediaWiki es lo siguiente:
  • {{cite Q|Q96951729}} en inglés, y
  • {{Bibliographie|Q96951729}} en francés.
Favor de observar que ambas referencias apuntan al mismo elemento de Wikidata: Q96951729.
Para hacer más leíble el lenguaje de marcado MediaWiki, agrego comentarios como los siguientes:
  • {{cite Q|Q96951729}}<!-- Julia et Agathe Cagé, les sœurs douées [Julia et Agathe Cagé, talented sisters], 2015 article by Sophie Fay-->.
  • {{Bibliographie|Q96951729}}<!-- Julia et Agathe Cagé, les sœurs douées, Article 2015 de Sophie Fay-->.</ref>
Como dije, ustedes pueden ver estos ejemplos como referencia [1] en en:Julia Cagé y “4” en fr:Julia Cagé.
He estado usando elementos de Wikidata como este de forma rutinaria en Wikipedia y Wikiversity en inglés durante un par de años. Si solo voy a usar una sola referencia en un artículo, puede ser menos trabajo usar la plantilla de citas estándar. Sin embargo, si lo uso en más de un artículo, se vuelve menos trabajo crear el elemento Wikidata y luego citarlo cada vez en esta manera. Además, creo que hay una manera de encontrar todos los lugares en los proyectos de Wikimedia que usan un elemento específico de Wikidata, aunque no puedo encontrar ahora cómo hacerlo.
¿Pueda ser mejor traducir fr:Modèle:Bibliographie que parece un poco diferente y que no menciona tantas problemas como en en:Template:Cite Q?
Gracias, DavidMCEddy (discusión) 20:21 4 jul 2020 (UTC)
Parece muy interesante hacer una base de datos bibliográfica en Wikidata accesible desde cualquier artículo o proyecto, pero si un artículo largo tiene ochenta referencias, todas codificadas así, corregir o revisar la bibliografía del mismo puede ser completamente imposible. Me imagino cotejar listas interminables de números, accediendo a Wikidata cada vez, para identificar si una referencia concreta es la que queremos suprimir o sustituir o si es la que acabamos de añadir, es un paso atrás en la comprensión visual del código en un artículo. Haría falta una herramienta paralela en línea que permita visualizar el texto de la referencia en lugar de esa caterva de números. Un saludo, --PePeEfe (discusión) 07:25 5 jul 2020 (UTC)
Coincido con PePeEfe, me parece demasiado precipitado el uso de esa codificación sin tener las herramientas adecuadas. Además, que la versión en francés no mencione los problemas no significa que estos hayan desaparecido por arte de magia; seguirá siendo un problema cuando los datos no están en el idioma adecuado. -- Leoncastro (discusión) 12:04 5 jul 2020 (UTC)
Pues a mí me parece fundamental tener esta plantilla cuanto antes. En vez de citaciones mal hechas (la inmensa mayoría de las citaciones acá en eswiki) poder tener una cita a un trabajo concreto, completamente identificado, con control de autoridad y con toda su información correspondiente, además de dinámico (los enlaces a los autores siempre que existan, por ejemplo, o información acerca del status del paper, si fue retractado (!)), sin los errores que nadie se preocupa de solucionar. Pero no espero nada tampoco. --Ninovolador (discusión) 18:14 5 jul 2020 (UTC)
Yo tampoco lo veo. Quizás más que nada por el tema del vandalismo o ediciones erráticas que nadie detecta en Wikidata (que son muchas, especialmente en etiquetas, algo menos en statements y casi nada en sitelinks) y su propagación masiva silenciosa. Que empiecen a aparecer chistes ya no solo en los artículos sino en las referencias que sostienen su contenido puede llevar a cierto descrédito. Demasiada incertidumbre. Que sí, que puede haber vandalismos aquí también, en la bibliografía local... pero no es lo mismo. A medio plazo veo más útil algo en este sentido (cite Q)c omo sustitución más que como transclusión. Como alternativa intermedia podría crearse un parámetro "Q" extra en las plantillas de cita actuales que complete información susceptible de aparecer a posteriori: basada principalmente en sitelinks (enlace a artículo de revista cuando se cree, por ejemplo) o identificadores externos (issn si la publicación no tuviera uno cuando se crea la cita; doi para enlaces a versiones en línea, etc). El Q ése de Wikidata podría enlazarse además como identificador único en las citas, de manera similar a como hacemos con JSTOR, DOI o ISSN. Cosas así. Saludos. strakhov (discusión) 20:40 8 jul 2020 (UTC)
El parámetro |id= acepta cualquier cosa. Por ejemplo:
{{Cita publicación |título=Ejemplo |autor=Leoncastro |año=2020 |id=[[:d:Q14944328|Q14944328]] }}
Leoncastro (2020). Ejemplo. Q14944328. 
Si se quiere que el enlace aparezca de forma automática solamente indicando el Q —como se hace con JSTOR, DOI o ISSN, y que me parece una buena idea—, será necesario crear un parámetro dedicado. ¿Q?, ¿wikidata? Saludos. -- Leoncastro (discusión) 21:06 8 jul 2020 (UTC)

Mostrar simbolos cuneiformes en articulos.Editar

La página de Sumeria intenta mostrarnos como se escribía Sumeria en simbolos cuneiformes. Wikipedia utiliza Unicode para representar las letras cuneiformes, lamentablemente como mi computadora no tiene descargados los simbolos, mi navegador simplemente me muestra un cuadrado con el codigo Unicode correspondiente.

Es posible indicar al navegador que descargue los simbolos si el usuario no los tiene. Como son inútiles más allá del contexto de esta página, lo ideal sería descargar nada más los simbolos que se van a mostrar, ya que el alfabeto completo pesa unos 2.4 megabytes. Esta optimización no sé si será posible de implementar, lo cual puede dificultar la implementación de esta mejora. Sin embargo, si logramos solucionar este problema, muchisimos otros artículos se beneficiaran de ello, incluso se puede implementar de tal manera que impacte a todas las wikipedias, lo cual puede tener un efecto significativo en wikis de otro lenguaje. Aunque inicialmente lo ideal sería impactar nada más un solo lenguaje y un solo artículo.

Una fuente cuneiforme está disponible en http://oracc.museum.upenn.edu/downloads/CuneiformComposite-1001.zip Sé como indicarle al navegador que descargue en HTML con la regla CSS @font-face y un estilo css font-family. Pero no sé como implementaría este tipo de cambios en wikipedia, tendría que ponerme a leer su codigo fuente.

Escribo acá para recordarme en un futuro de trabajar en esto, pero si alguien quiere ayudar, también es bienvenido. — El comentario anterior sin firmar es obra de TZubiri (disc.contribsbloq). 12:38 3 jul 2020‎ PePeEfe (discusión) 12:15 3 jul 2020 (UTC)

¿No sería más sencillo usar imágenes como Archivo:EB9 China cuneiform lion.png o Archivo:Code of Hammurabi 75.jpg para ilustrarlo?. --PePeEfe (discusión) 12:15 3 jul 2020 (UTC)

Sí, son buenos complementos visuales, pero el la convención en wikipedia es mostrar los simbolos junto al nombre en la primer oración del artículo como en https://es.wikipedia.org/wiki/Al%C3%A1. Alguien agrego los simbolos a la página https://es.wikipedia.org/wiki/Sumeria y a muchas otras, así que la solución es o implementar la fuente unicode, o eliminar los simbolos del artículo.--TZubiri (discusión) 00:01 4 jul 2020 (UTC)

O se pone la plantilla de {{Caracteres especiales}}, como se hace en el resto de artículos que muestran caracteres especiales. -- Leoncastro (discusión) 00:15 4 jul 2020 (UTC)

Accesorio: wikiEdEditar

¡Hola! Empleo esta herramienta para edición y he notado que en Opera ya no funciona el resaltado de referencias. Uso Firefox para mi usuario RoyFocker y Opera para este (RoyFokker) y esta es una herramienta muy útil cuando se revisan artículos más largos y complejos como el que estoy mirando ahora. ¿Alguno sabe si se puede arreglar o sustituir de alguna forma? Gracias. Roy 14:38 3 jul 2020 (UTC)

Hola RoyFocker, wikEd, como algunas otras herramientas que todavía tenemos en las preferencias, se han ido quedando obsoletas. Si lo que te interesa es principalmente el resaltado de sintaxis, la barra de herramientas por defecto ya lo incorpora, por lo que no necesitas esa herramienta. Si te interesaba también por alguna otra función, puedes preguntarle a su creador Cacycle. Saludos. -- Leoncastro (discusión) 16:15 3 jul 2020 (UTC)

Wikidata weekly summary #423Editar

Tech News: 2020-28Editar

20:17 6 jul 2020 (UTC)

Control de autoridadesEditar

¡Saludos! Hace tiempo me percaté de que muchas páginas que han sido traducidas desde otras Wikipedias no poseen el {{Control de autoridades}}. Últimamente me he dedicado a colocar dicha plantilla en los artículos que otros usuarios traducen, pero me pregunto, ¿es correcto colocarla en artículos traducidos? He leído las políticas de la plantilla pero me queda esa duda, por lo que prefiero preguntar por acá para asegurarme. Muchas gracias. --Benjamín Pérez Vera (discusión) 00:50 8 jul 2020 (UTC)

El control de autoridades se pone en todos los artículos, excepto en biografías, donde se pone NF.--SRuizR   00:54 8 jul 2020 (UTC)
Muchas gracias por la ayuda! --Benjamín Pérez Vera (discusión) 00:57 8 jul 2020 (UTC)
En los traducidos, además, habría que colocar, si no la tuviera, la plantilla {{Traducido ref}} en la sección de enlaces externos para atribuir la misma. Geom (discusión) 22:00 10 jul 2020 (UTC)
No es necesario siempre Geom. La atribución se puede realizar también mediante el resumen de edición o en la discusión con la plantilla {{Traducido de}}. Véase Ayuda:Cómo traducir un artículo#Derechos_de_autor. -- Leoncastro (discusión) 22:20 10 jul 2020 (UTC)

Editing news 2020 #3Editar