Usuario:Benjavalero/Replacer

Replacer es una herramienta en línea cuyo objetivo es proporcionar una interfaz sencilla que ayude a corregir los errores ortográficos o de estilo más comunes en la Wikipedia, y está disponible en https://replacer.toolforge.org.

Revisión manual (no automática)Editar

Esta herramienta no es un bot que realiza ediciones de modo automático de acuerdo a ciertas reglas. Al contrario, nace de la necesidad de una revisión manual por parte de un humano para los casos que no se pueden automatizar debido a la existencia de falsos positivos.

Por ejemplo, la palabra geografia es incorrecta en español (falta la tilde) pero es correcta en catalán o portugués. Debemos por tanto evitar la tentación de los reemplazos masivos. Incluso en casos evidentes de ortografía incorrecta, podría tratarse de una cita en un texto antiguo. En cualquier caso, estos reemplazos obligan a un visto bueno previo por parte de un usuario.

Al revisar una página, cada uno de los potenciales reemplazos se muestra de manera independiente, permitiendo elegir entre distintas alternativas o dejarlo como está en caso de duda o de falso positivo.

Finalmente, en caso de que haya algún reemplazo que hacer, el botón «Guardar cambios» toma estos reemplazos y los aplica en la página de la Wikipedia.

La edición se realiza en nombre del usuario que ha iniciado sesión en la herramienta, que debe corresponderse con un usuario registrado de la Wikipedia.

Por otra parte, el botón «Guardar sin cambios» marca la página como revisado sin cambios y no volverá a ofrecerse para su revisión hasta que vuelva a haber cambios en el mismo.

Tipos de reemplazosEditar

Actualmente la herramienta maneja distintos tipos de reemplazos, junto con las sugerencias de corrección:

  • Ortografía. Palabras con ortografía potencialmente incorrecta. Se extraen de Wikipedia:Corrector_ortográfico/Listado. Cada subtipo se corresponde con el término a corregir.
  • Compuestos. Expresiones con más de una palabra con ortografía potencialmente incorrecta. Se extraen de Usuario:Benjavalero/ComposedMisspellings. Cada subtipo se corresponde con la expresión a corregir.
  • Fechas. Fechas con formato incorrecto, en particular con el mes en mayúscula.

Falsos positivosEditar

Hay ciertas secciones de una página en las que se suelen detectar la mayoría de los falsos positivos, y por tanto nos interesa tenerlas en cuenta para ignorar los reemplazos que estén contenidas en ellas.

Por ejemplo una cita en español antiguo o un parámetro propio de la Wikipedia que no acepta diacríticos. Entre otras, la herramienta tiene en cuenta las siguientes secciones:

  • Comentarios HTML: <!-- españa -->
  • Nombres de archivos: [[File:españa.png|España]]
  • Etiquetas XML completas, e. g. para citas o código fuente: <math>LaTeX</math>
  • Plantillas completas, e. g. para citas o coordenadas: {{Cita|Texto}}
  • Textos entrecomillados: «In Paris»
  • Textos en cursiva: ''online''
  • Valores de algunos parámetros: {{... | índice = españa | ...}}
  • Categorías: [[Categoría:Jennifer Lopez]]
  • Etiquetas XML: <span style="color:salmon;">
  • Nombres de plantillas: {{Album|...}}
  • Parámetros de plantillas: {{...| pais = España | ...}}
  • URL: http://www.monografias.com
  • Enlaces internos sufijados: [[brasil]]eño
  • Enlaces internos con alias: [[Taiwan|Taiwán]]

La herramienta también tiene en cuenta falsos positivos comunes, e. g. Los Angeles Lakers. La lista de estos falsos positivos se mantiene en la página Usuario:Benjavalero/FalsePositives.

Tilde diacrítica en «solo» y pronombres demostrativosEditar

Posiblemente el término más polémico dentro del listado de errores ortográficos sea el adverbio «solo», que tradicionalmente se ha escrito con tilde diacrítica para distinguirlo del adjetivo, y que desde 2010 la RAE recomienda[1]​ escribir siempre sin tilde, y en casos de ambigüedad reordenar la frase. En menor medida también ocurre con los pronombres demostrativos «este», «ese» y «aquel», y sus derivados. Puesto que es una recomendación, esto implica que la versión con tilde no se considera incorrecta. Algo parecido ocurre también con «setiembre».

Estos términos aparecen entre los errores potenciales más habituales, y a la hora de revisar una página aleatoria pueden estorbar a algunos usuarios. Sin embargo muchos usuarios sí deciden revisar estas ocurrencias y reemplazarlas. Finalmente, he decidido:

  • No incluir estos términos en la lista de falsos positivos.
  • Añadir algunos posibles verdaderos positivos a la lista de errores compuestos, e. g. «un sólo».

IndexaciónEditar

Las entradas de errores potenciales que se añaden a los listados no repercuten de inmediato en la herramienta. Esto se hace para evitar consultas masivas a la Wikipedia.

La herramienta indexa periódicamente el contenido de la Wikipedia (sin conexión) para buscar reemplazos en las nuevas ediciones. Por tanto los contadores de reemplazos pueden no estar actualizados. Para cada página encontrada:

  • Solo se indexan las páginas de tipo «Artículo» o «Anexo»
  • Se ignoran las páginas que redirigen a otras
  • Se ignoran las páginas marcadas para ser borradas (plantilla Destruir) y aquellas con muchos defectos (plantilla Copyedit).

Si una página se ha modificado después de su última revisión en la herramienta, esta volverá a indexarse, por lo que es posible que algunos falsos positivos ya revisados vuelvan a aparecer en el listado, en el caso en que su ubicación en el texto haya cambiado y por tanto la herramienta no tenga forma de saber si es un reemplazo nuevo o no.

Errores y sugerenciasEditar

La herramienta está en constante mantenimiento. Ya no tanto en errores (afortunadamente) pero sí en optimización e inclusión de nuevos reemplazos y falsos positivos, que faciliten aún más la revisión.

La herramienta ha sido desarrollada (y es mantenida) por benjavalero. El código fuente de la herramienta está disponible en GitHub.

Cualquier sugerencia y corrección es bienvenida tanto en la propia página de discusión Usuario discusión:Benjavalero/Replacer como en el gestor de incidencias de GitHub.

Puede resultar llamativo que el nombre de la herramienta esté en inglés. Inicialmente la herramienta se planteó para usarse con distintos idiomas, y de hecho no sería muy complicado adaptarla a otra lengua, como ya se ha hecho con el gallego.

Enlaces externosEditar


ReferenciasEditar