Proyecto: GeoLinks editar

(o Red de enlaces estables para títulos cambiantes)

Motivación editar

Uno de los problemas más serios que he encontrado en el estado actual de todas las Wikipedias es la asignación de títulos de página únicos a los sitios geográficos.

Es un caso particular de nombres que requieren desambiguación, pero llevado a un extremo impensable muchas veces. Basta echar un vistazo a Wikipedia:Zona de pruebas/Títulos ambiguos para corroborarlo. Y es que por motivos históricos, por homenajes, por falta de nombres o por la simple libertad a la hora de bautizar un lugar, estos nombres se reutilizan hasta el cansancio. Y como cada página de wikipedia necesita un nombre único, surge el conflicto.

Al crear la primera página generalmente no hay problemas. Éstos aparecen cuando una segunda página (o una enésima) disputa el "derecho a usar el mismo título". Y el trabajo duro es cambiar todas las páginas en las que se usa ese título como enlace. Es como querer erigir algo sobre arena que las olas alcanzan de vez en cuando.

¿Por qué la oficina de correos o las telefónicas pueden ubicar cada rincón del planeta y nosotros no podemos todavía asignar algunos títulos sin "agarrarnos de los pelos"? Porque nuestros títulos estan cumpliendo una doble función: Ser informativos (texto del título) y ser una dirección única, un enlace. A veces esta función se cumple sin problemas, como en el los nombres raros

... ciudad de [[Cayafate]] ...

otras requieren enlazar y agregar un poco de cosmética al enlace para que no se vea tan mal en el texto, aunque el título no se pueda "maquillar",

... ubicado en la [[provincia de Córdoba (Argentina)]]...

y otras podrían a llegar a ser un verdadero "castigo"

... nació en la localidad de [[Argentina (Provincia de Santiago del Estero, Argentina)]] ...

Propuesta editar

Estas dos funciones, enlace y titulado de páginas, gracias a los redireccionamientos se podrían separar de manera que la función más conflictiva, los enlaces, se organizen según un esquema que haya demostrado más eficacia.

Si se desea que los enlaces tengan estabilidad, se podría asignarles valores únicos e inamovibles. Existen varios sistemas para la asignación de identificadores únicos, a saber:

  • Generación de valores de difícil repetición, generalmente por algun proceso matemático
    • GUID o Global Unique IDentifier
    • Funciones hash MD4, MD5
  • Asignación de identificadores por una única autoridad central
    • Códigos ISO para países, lenguas
  • Asignación de identificadores por jerarquías en niveles

Los sistemas de numeración posicionales como nuestro sistema decimal son quizás el ejemplo más contundente de reutilización de símbolos/nombres/títulos con un sistema jerárquico (unidades, decenas, centenas, ...). De los tres sistemas, considero el último como el más ventajoso para nuestro propósito. La división política de los países es una clara organización jerárquica en la que no surgen los conflictos que tenemos en el espacio horizontal de nombres de Wikipedia. No hay dos provincias de Córdoba ni en Argentina ni en España, ni problemas con que haya una Argentina dentro de Santiago del Estero dentro de Argentina.

De manera que si creamos un sistema jerárquico en el que cada lugar en el mundo tenga un espacio natural reservado, luego será cuestión de que cada punto del árbol nos lleve a la página correcta, se titule como se titule.

Imitando una híbrido entre los dominios de internet y nombres geográficos abreviados, las siguientes páginas especiales podrían servir como un sistema de directorio muy conciso

[[geo:ar]]			Argentina (ar = Código ISO)
[[geo:ar.se]]		  	  \_ Provincia de Santiago del Estero (se = Código wiki)
[[geo:ar.se.ag]]		       \_ Departamento Aguirre
[[geo:ar.se.ag.arg]]	         	    \_ Localidad de Argentina

[[geo:ar]]			Argentina
[[geo:ar.cb]]		  	  \_ Provincia de Córdoba (Argentina)

[[geo:es]]			España
[[geo:es.cb]]		  	  \_ Provincia de Córdoba (España)

el contenido de la página http://es.wikipedia.org/wiki/geo:ar.cb podría ser

#REDIRECT [[Provincia de Córdoba (Argentina)]]
o
#REDIRECT [[Provincia de Córdoba, Argentina]]
o 
#REDIRECT [[Provincias de Argentina: Córdoba]]

o el que refleje las convenciones de títulos del momento.

Y el último ejemplo podría reescribirse de manera más abreviada como

... nació en la ciudad de [[geo:ar.se.arg|Argentina]] ...

sin tener que preocuparnos si por el motivo que fuere cambia el título de alguna de estas páginas.

El aspecto externo de este esquema podría ser indistingible del actual salvo por un pequeño detalle. Al ser una página redireccionada, al llegara a la página aparecerá el mensaje

(Redireccionado desde geo:ar.cb)

lo cual puede parecer un poco críptico, innecesario o simplemente feo.

Afortunadamente existe una alternativa para que no aparezca esta información. Agregando w: a la redirección

#REDIRECT [[w:Provincia de Córdoba (Argentina)]]

se trata esto como un enlace interproyectos y no aparece la información de redirección. La mala noticia es que nuestra w: apunta a la wikipedia inglesa. El wikcionario, sin embargo esta bien configurado para apuntar a nuestra Wikipedia. Habría que tocar el mismo archivo de configuración y ya tendríamos solucionado este detalle.

Esa es la idea básica. Otros detalles importantes a la hora de implementar una solución así serían:

  • Elegir una política para la asignación de estos espacios de nombres jerárquicos. A modo de ejemplo, elegí un espacio de nombres llamado "geo:". Bien podría haberse llamado "geop" (de geopolítico), y reservar geo para regiones naturales, ríos, montañas. Estas decisiones deberían tomarse con el mayor de los consensos y precauciones, ya que se pretende una red "persistente", que no se deba cambiar porque se olvidó un detalle.
  • En cada nivel, definir una política de códigos de acuerdo a las necesidades, intentando reutilizar códigos existentes o estándar. Por ejemplo, en Argentina, para las 24 provincias un código de 2 letras podría alcanzar, pero quizás China requiera código más largos.
  • En los casos en que no existan códigos estandarizados, los habitantes de cada región podrían ser los más idóneos para proponer códigos, de acuerdo a las costumbres y abreviaturas de uso común de cada lugar. Por ejemplo, BUE y BA son casi sinónimos de Buenos Aires en Argentina.
  • Recordar que esta implementación puede convivir perfectamente con el sistema de enlaces actual, de manera que su adopción puede ser progresiva.

Espero no haber mareado con detalles demasiado técnicos, este es un problema bastante complejo y ésta es la solución menos compleja y más wiki que se me ocurre de momento.

Esta solución sería aplicable a otras familias de datos que estén debidamente jerarquizadas o codificadas. De hecho ya existe una implementada por software: el espacio de nombres ISBN*, para los libros. Se podrían "indexar" estrellas, asteroides, álbumes (códigos UPC/EAN) y muchas otras páginas, aunque considero prioritario sistematizar y consolidar las referencias geográficas.

Como siempre, me encantaría escuchar sus opiniones, de toda índole. Mientras tanto, me permitiré hacer algunas pruebas con un poco de la geografía que me es más familiar, para ver si la teoría se puede llevar a la acción sin mayores problemas. Desde luego, quedan invitados a participar en ello también :) Saludos --Pybalo 06:37 25 sep, 2004 (CEST)

Comentarios editar

Personalmente me parece una buena propouesta, sin embargo veo dificil que se pueda popularizar entre los colaboradores. A muchos les parecerá un poco intimidante o dificil de recordar. —¿Cual era el código de la ciudad de Córdoba en España? ... Mejor enlazó a Córdoba (España) que es donde recuerdo que está., pensarán muchos y al fin y al cabo esto es un wiki, en el que se supone que se escriben páginas web de una forma amigable. Si hay que consultar una tabla de códigos muchos se cortarán de hacerlo. ManuelGR 16:33 25 sep, 2004 (CEST)

Bien. Facilitaría el asunto que este código geográfico apareciece en el artículo destino? He visto que algunas ciudades tienen una plantilla en las que se incluyen sistemáticamente latitud, longitud, código internacional telefónico, código internacional de aeropuertos, ¿código geográfico wiki?... Por otra parte, no ocultar la redirección podría ser una técnica mnemotécnica aceptable, no?
Sería factible usar bots para unificar los estilos de enlaces?
Dependiendo de lo únicos que sean los nombres, se podrían también elegir otros esquemas de códificación que sean más recordables, a riesgo de que existan dos Córdobas en España (en Argentina existen muchas localidades que se llaman igual)
geo:es.Córdoba --Pybalo

Creo que sería mucho trabajo, aún apoyado por bots. Además no resuelve el asunto de las convenciones de títulos, sólo facilitaría —enormemente, eso sí— el cambio de una convención a otra. Pero nuestro problems no es el cambio de convención, si no que no tenemos convención o tenemos varias simultáneamente.--Sanbec 14:15 29 sep, 2004 (CEST)

Sí le veo ventajas, pero sí que es mucho trabajo. Deberíamos probar con los países en los que ya hay un código de poblaciones.

Hay programas que utilizan el código postal para diferenciar las localidades (también hay grafiteros que firman con el código postal de su barrio :). En España los códigos postales tienen cinco cifras. Las dos primeras indican la provincia (por orden alfabético según el nombre de la provincia en castellano), con unas pocas excepciones, debido a pueblos que en el momento de la implantación recibían el correo desde una provincia vecina. Los municipios pequeños tienen un sólo código postal, pero las ciudades grandes están repartidas en varios CP, por lo que no hay una relación unívoca municipio-código postal. Que yo recuerde los números de CP de un mismo municipio son consecutivos. Lo que no creo que ocurra es que un mismo código postal abarque dos municipios distintos. Aunque se dan casos de barrios que se independizan y obtienen municipios propios.
El otro código que se utiliza para las provincias es el de las matrículas. Se empleaba el mismo para los automóviles (ya no), y para los barcos (en las provincias con mar). Consiste en una clave de una o dos letras. Salvo en el caso de Gerona/Girona, que cambió de GE a GI, creo que todas las demás provincias tenían una clave unívoca.--erri4a 02:49 26 oct, 2004 (CEST)


En España se suele utilizar el código INE de 11 digitos que existe para cada núcleo de población y disminados y que se recoge en el Nomenclator (relación de todas las unidades poblacionales del país, más de 76.000). Así mismo es común en los Sistemas de Información Geográfica el uso de esta codificación del Instituto Nacional de Estadística como campo ID o clave principal a la hora de georreferenciar datos en la cartografía. Un ejemplo de código INE sería el siguiente:

  • Núcleo de población: OGARRIO
  • Coordenadas: UTM ED50 30T 456254 4793010
  • Código INE: 39067000401

Este código se descompondría en:

39 Código perteneciente a la provincia de CANTABRIA.
39067000000 Código perteneciente al municipio de RUESGA.
39067000400 Código perteneciente a la entidad singular de OGARRIO.
39067000401 Código perteneciente al núcleo de población de OGARRIO.
39067000499 Código perteneciente al poblamiento diseminado.

También está el código geográfico que es muy similar al del INE pero que se utiliza menos. En otros países existe una codificación similar a la del INE.

De todas formas comprendo que para gente neofita esto pueda resultarles cuando menos engorroso.

Para más información sobre este tipo de codificación visitar la página del Instituto Geográfico Nacional

--Tony Rotondas 18:12 31 oct, 2004 (CET)