Wikipedia:Sistemas de categorización


La categorización es una herramienta provista por el software MediaWiki que permite almacenar artículos y otras páginas dentro de categorías, que reúnen a varios artículos o páginas de características similares. Las categorías tienen a su vez subcategorías (más específicas) y supercategorías (más generales), permitiendo navegar de lo general a lo concreto y viceversa, a través de una estructura de árbol. Ayudan a los lectores a conocer qué artículos existen sobre un determinado tema, incluso sin saber de antemano si ya existen o con qué nombre aparecen.

A lo largo del desarrollo de Wikipedia en español diversos usuarios han enfocado la categorización desde puntos de vista diversos y, en ocasiones, hasta mutuamente incompatibles. Se muestran a continuación los principales.

Métodos empleadosEditar

Árboles de categoríasEditar

En un principio, el árbol de categorías de Wikipedia se estructuró de modo semejante al sistema de Clasificación Decimal Universal (CDU); un sistema muy flexible y efectivo para clasificar y ordenar fondos bibliográficos. No obstante, la implantación del proyecto incluyó algunas notables diferencias:

  • Al no requerirse el uso de fichas físicas ni tejuelos y dado que el propio software podía encargarse de la localización de cada elemento, no se asoció cada categoría a un identificador numérico. Las categorías se identifican directamente por su nombre natural.
  • Como consecuencia de lo anterior, no existe un límite superior al número de subcategorías que «cuelgan» directamente de una categoría.
  • No se han incluido las funcionalidades complejas del sistema CDU, como los signos de coordinación o extensión para la grupación de conceptos. En éste sentido, el sistema de Wikipedia es más bien similar al Sistema Dewey de clasificación, predecesor más simple del sistema CDU.


Ventajas:

Un árbol de categorías no entrelazado es, obviamente, mucho más símple de crear y fácil de mantener que otro más complejo (aunque susbsista la dificultad de definir lo que «entra» o «no entra» en cada categoría). Además, es mucho más sencillo mantener —si así se desea— la transitividad en las categorizaciones.[1]

Inconvenientes:

Los sistemas de clasificación empleados en bibliotecas están dirigidos a ubicar y recuperar objetos físicos almacenados en estantes. Esto hace que se prime la unicidad en la ubicación de un elemento, lo que no tiene sentido en un almacenamiento virtual en el que no existe una limitación previa al número de rutas de búsqueda posibles.


Árboles de ramas entrelazadasEditar

La posibilidad técnica de crear múltiples rutas para llegar hasta un mismo elemento propició la creación de «árboles» cuyas ramas confluían a distintas alturas y en distintos nodos. Esta especie de red —aunque, a la postre, jerárquica— es la forma de categorización más frecuente en Wikipedia y constituye el estándar de facto del proyecto.


Ventajas:

Se aprovecha la posibilidad técnica de ordenar una misma categoría según varios criterios y rutas de búsqueda.

Inconvenientes:

Es más fácil caer en la tentación de ramificaciones excesivamente prolijas, creando situaciones en las que «los árboles no dejen ver el bosque».

Su mantenimiento resulta más complejo que el de un árbol no ramificado.

Es casi imposible mantener la transitividad en las categorizaciones.[1]


Sistemas de etiquetasEditar

Con el tiempo, muchos wikipedistas comenzaron a introducir categorías «transversales» a los criterios de ordenación jerárquica. Así por ejemplo, la Categoría:mujeres del siglo XX no responde a ningún factor directamente relacionado con aquello que hace relevante a una biografía, pero su introducción directa como elemento generador de subcategorías —por el cruce con otras— multiplica el entrelazamiento y la complejidad de los sistemas en árbol.

Para soslayar estos inconvenientes, se ha propuesto el uso de herramientas como CatScan, que permiten —hasta cierto punto— emplear elementos de álgebra relacional para la navegación entre categorías.


Ventajas:

Es un sistema útil para quienes busquen extraer información estadística del árbol de categorías; por ejemplo: obtener una lista de biólogos de etnia gitana, o de matemáticos de religión budista.

En principio, es mucho más sencillo agregar nuevas categorías, ya que no hay que preocuparse por su interrelación con las categorías previamente existentes.

Inconvenientes:

Plantea la necesidad de utilizar un software externo.

Exigiría, de implantarse como estándar, la revisión completa del árbol de categorías de Wikipedia (que, en realidad, dejaría de ser tal árbol).


Posibles desarrollosEditar

Si bien cada uno de los enfoques expuestos tiene sus propias ventajas e inconvenientes, el uso no-coordinado de todos ellos supone un problema cuando, como es el caso de las categorías, se trata de «ordenar algo». Como es evidente, muchas personas trabajando en poner orden con criterios de ordenación distintos no hacen, por fuerza, que el resultado sea más ordenado. Por lo tanto, es de esperar que la comunidad aborde en algún momento la decisión de cuál (o cuáles) son sus criterios preferidos de ordenación y cuál debe ser, en su caso, la relación entre ellos.

  • Una de las opciones es elegir un único criterio fundamental, sea éste la categorización (transitiva o no) en árboles simples, la categorización en árboles entrelazados o la categorización por etiquetas.
  • Otra sería repartir el trabajo entre el sistema de categorías y el proyecto Wikidata, manteniendo las categorizaciones en árbol (en cualquiera de sus dos modalidades) y dejando a Wikidata las operaciones de unión e intersección mediante etiquetas.
  • Y, finalmente, cabe la opción híbrida de mantener un sistema de árbol pero definir una serie de etiquetas especiales que puedan ser utilizadas como categorías sin servir de semilla para subcategorizaciones.

Cualquiera de éstas decisiones, por supuesto, requeriría un amplio trabajo de análisis y búsqueda de consenso, que no está claro que, hoy por hoy, estemos dispuestos a realizar.

NotasEditar

  1. a b Para el concepto de transitividad en la categorización, véase Wikipedia discusión:Propuesta de política de categorías

Véase tambiénEditar