Wikipedia discusión:Corrector ortográfico

Discusiones activas

Comentario de agosto de 2010Editar

El corrector no funciona con el beta!. Ni con el skin Vector.--D96  @¿¿que??@ 15:23 21 ago 2010 (UTC)

Pues no lo entiendo, con este títere utilizo Vector y no tengo problema alguno, ¿hay alguien más con problemas? ¿te funciona con monobook? saludos! El mago de la Wiki   Hablémoslo 19:10 21 ago 2010 (UTC)

AnexosEditar

Me da la impresión que la herramienta del correcto no funciona en artículos anexos. Es así? --Edwod2001 (discusión) 13:58 20 sep 2010 (UTC)

GramáticaEditar

Se podría añadir está herramienta o crear otra con la capacidad de detectar errores gramaticales en las diferentes páginas de wikipedia. Saludos. Juan Miguel (discusión) 03:56 30 nov 2010 (UTC)

Aún/aunEditar

El corrector marca como incorrecta la forma "aun" siempre, aunque cuando equivale a "incluso" se escribe sin acento. —résped ¿sí? 16:08 23 dic 2010 (UTC)

Así es, si bien, cuando se pasa el ratón por encima de la palabra aparece una aclaración: "aún (cuando pueda sustituirse por todavía)". Si no es suficiente y son demasiados los "falsos positivos", entonces se elimina del listado, no hay problema. ¿Alguna otra opinión? Poco2 16:29 23 dic 2010 (UTC)
Prefiero algún "falso positivo" a que se queden sin corregir los errores (cuando pueda sustituirse por todavía). Antón Francho (si me quieres decir algo) 20:27 2 ene 2011 (UTC) P.D. Con mi mayor respeto, he añadido el acento que faltaba en tu aclaración.

IriaEditar

"Iria" en mayúscula es un nombre propio de persona, pido a ver si se puede poner para que no sea una falta. -- Vivaelcelta {discusión  · contribuciones} 16:34 8 ene 2011 (UTC)

Es un nombre poco frecuente. Doy por hecho que son más los errores reales que los falsos positivos, y por ello abogo por dejarlo como está. También incluimos formas como "ultimo", que un corrector convencional aceptará (1. persona singular de ultimar), pero nosotros marcamos como error, dado que un verbo conjugado en primera persona es muy poco frecuente y, por otro lado, son muchos los que olvidan el acento en último. Poco2 17:18 8 ene 2011 (UTC)

FerrariEditar

Cuando aparece este nombre en algún artículo, el corrector lo marca como erróneo y propone como cambio "cs". Tal cual. ¿Es un error mío o es así? Adrgs (disc. · contr. · bloq.) 21:59 2 feb 2011 (UTC)

  Corregido (mañana estará activo) era un error en el listado, gracias y saludos, Poco2 22:16 2 feb 2011 (UTC)

¿Bug?Editar

Hola. Llevo usando el corrector, además del Twinkle y el Monobook suite (lo digo por si hay algún problema de compatibilidad) desde hace varios meses, y hasta ahora no había tenido ningún problema. Desde hace algunos días, el Twinkle me daba algún fallo, en el sentido de que no me llegaba a salir (como si estuviese desactivado) en algunas páginas, pero se solucionaba con recargar la misma una o dos veces, por lo que no le di importancia. Pero desde hoy mismo, el corrector ortográfico también me falla, ya que en algunos artículos me marca todas las palabras como "incorrectas", resalta absolutamente todas en artículos como Telecinco. El problema, es que en artículos un poco grandes (como Telecinco) me bloquea todas las pestañas de Wikipedia (uso Google Chrome) durante varios minutos (dependiendo del tamaño del artículo, en Telecinco me llegó a los 10 minutos), llegando a consumir 300 mb de memoria RAM y usando el 80% de la CPU sólo con esa pestaña. Se hace difícil el mantenimiento así, por lo que antes de desactivar todo, me gustaría saber si a alguien más le pasa. Gracias de antemano, un saludo.   Adriansm (Dímelo a la cara) 12:24 2 mar 2011 (UTC)

Te doy un repro (o séase, un "me pasa también"). El artilugio en estos momentos marca todas o al menos un 90% de las palabras en los artículos como erróneas y en las páginas bastante largas consigue colgar el navegador (todos, IE9, Safari, Opera, Chrome, Firefox, lo cual es de por sí impresionante para un sistema potente como el mío de 4 núcleos). Quizá pueda deberse a la transición a la nueva versión de Wiki. Por ahora, te recomiendo desactivarlo hasta que se solvente el problema. --Linfocito ~ Salu2 desde Colombia. 16:36 2 mar 2011 (UTC)
Hola. Tengo el mismo bug con el corrector. A ver si se arregla pronto... De hecho, me he fijado en que palabras pequeñas como preposiciones y artículos en femenino plural, no los resalta. Bueno, espero que pronto esté arreglado. Un saludo. **Kingpowl** (discusión) 16:41 2 mar 2011 (UTC)

Tilde diacríticaEditar

¿Hay alguna opinión y/o consenso sobre la inclusión de palabras con tilde diacrítica en esta lista? Lo digo por la presencia de aun, sin tilde, que produce muchos "falsos positivos". Saludos, Gons (¿Digame?) 18:10 4 mar 2011 (UTC).

Disregard, hice una búsqueda rápida de diacrítico/a, pero no de aun, así que no había leído que ya hablastéis del tema... Gons (¿Digame?) 18:13 4 mar 2011 (UTC).
En realidad, creo que hay un problema importante de "falsos positivos"; la cantidad de palabras listadas donde varias opciones son correctas que hay ahora (acabo de ver impulso / impulsó) hace que esta herramienta pierda su eficacia. Creo que solo se deberían listar palabras con faltas de ortografía. Escarlati - escríbeme 11:53 17 mar 2011 (UTC)
¿Qué ventaja presentaría entonces esta herramienta con respecto, por ejemplo, al corrector del navegador? ¿no crees que términos como "ultimo" que si bien sí existen, deberían detectarse como positivos, dado que la cantidad de falsos positivos serían ínfima con respecto a la cantidad de errores que se detectan?. El término impulso sí me parece demasiado frecuente como para añadirlo en la lista de errores, pero muchos otros sí me parecen adecuados, y precisamente ahí radica el beneficio de la herramienta. Poco2 19:33 17 mar 2011 (UTC)
Por eso: hablo de términos que son muy frecuentes, como impulso, que lo es bastante, y están proliferando últimamente mucho estos términos correctos y con una cierta frecuencia de uso, hasta tal punto que yo he tenido que quitarme el corrector porque la mayor parte de los términos que señala son en realidad correctos, y entorpece la tarea de corregir ortografía en lugar de ayudar. Escarlati - escríbeme 18:00 18 mar 2011 (UTC)
Ok, entonces estoy de acuerdo contigo. ¿De qué términos estamos hablando?, Poco2 18:54 18 mar 2011 (UTC)

SegúnEditar

Hola, « junio 330 a.C. (según el ...» muestra seg como abreviación de segundo y sugiere «s».--Jeruus (discusión) 02:13 28 dic 2011 (UTC)

Aquí no, no entiendo porqué.--Jeruus (discusión) 02:23 28 dic 2011 (UTC)
He tratado de explicar el motivo aquí. Saludos, Poco2 09:21 28 dic 2011 (UTC)

Fábula, Fabular, y derivadosEditar

Al parecer no reconoce el verbo Fabular y sus formas, muestra un falso positivo, ya que reconoce el verbo como si quisiera escribir Fábula. --  ●Dark Bane●™]»»…♠♠ (Tu me diras)-Contribuciones 09:27 3 ene 2012 (UTC)

HolaEditar

Yo es que prefiero no tocar nada, que me conozco :) El caso es que el corrector marca como error "cafe" cuando está dentro de la palabra cafeína, supongo que ahora también lo hará :P Saludetes. --Ensada mensajes aquí 01:40 7 feb 2012 (UTC)

Ay, que en las discus no va XD Se puede ver aquí :) --Ensada mensajes aquí 01:42 7 feb 2012 (UTC)
Hola Ensada. Es una limitación técnica de los navegadores web cuando interactúan con el corrector y no puede ser solucionado; puedes leerlo aquí. --Linfocito B ~ Salu2 desde Colombia. 18:29 7 feb 2012 (UTC)

FuncionamientoEditar

No se que tan complejo sea, solo quiero comentar que sería útil que funcione dentro del MediaWiki QuickEdit 2.4 porque generalmente cuando hay varios errores hay que abrir la página en una pestaña y el editor en otra,también sería muy útil que las remarque dentro del editor (como hace el WikiEd)--  Esceptic0 | ✉ ✍. 02:39 27 jun 2012 (UTC)

PropuestaEditar

Actualmente el corrector sólo funciona en los artículos y anexos, pero hay páginas de Wikipedia que deben estar escritas correctamente, como las de tipo wikipedia. Por eso propongo ampliar el campo de actuación del corrector a: Wikipedia, Plantilla, Ayuda, Wikiproyecto... --Vivaelcelta {discusión · contribuciones} 12:51 7 sep 2012 (UTC)

  A favor Y, salvo que alguien me desmienta, también en las paginas de discusión. Una enciclopedia debería estar bien escrita por completo. Saludos, Gons (¿Digame?) 23:08 17 may 2013 (UTC).

Otras propuestasEditar

¿Qué opinan señores y señoras?

  • Paréntesis. En español, como sabrán seguro, se inicia dentro del paréntesis con minúscula (salvo donde corresponda mayúscula por la palabra en sí). Podriamos poner (A, (B, (C... y así todo el abecedario. También se podría poner con los "dos puntos", aunque crearía más falsos positivos, porque hay más excepcions.
  • Ordinales. Como podéis ver en el enlace, la forma correcta de usarlos en español es 1.º, 2.ª, 3.er y, de paso, N.º. Podriamos también incluirlos en la lista, para sustituir 1o, 2ª o No. Este último punto habría que asegurarse que es técnicamente posible.

Quedo a la espera. Saludos, Gons (¿Digame?) 23:06 17 may 2013 (UTC).

  A favor Además, también cambiaría los puntos suspensivos que se hayan introducido con tres caracteres de punto por el solo carácter « … », aunque sería deseable en ese caso que este carácter apareciera en la lista de caracteres especiales bajo la caja de edición. --Benjavalero (discusión) 12:47 11 mar 2014 (UTC)

ToolserverEditar

Hello everybody. As you might know, the Toolserver will soon die. I moved the spellcheck scripts to Tool Labs. So please change the script: the new URL to checkArticle.php is: http://tools.wmflabs.org/spellcheck/es/checkArticle.php . Thank you. --APPER (discusión) 23:35 31 oct 2013 (UTC)

  Hecho --Taichi 02:04 1 nov 2013 (UTC)

ProblemasEditar

Buenos días. Tengo un problema en el que el corrector ortográfico no funciona. Tal vez sea porque el script no fue correctamente editado. Gracias. --Tomyeze (discusión) 16:46 2 nov 2013 (UTC)

  Resuelto aquí; tras el cambio anterior faltaba el nombre del parámetro con la página a corregir. - José Emilio –jem– Tú dirás... 13:16 7 nov 2013 (UTC)

No funcionaEditar

A día 6 de noviembre --Jakeukalane (discusión) 13:57 6 nov 2013 (UTC)

  Resuelto aquí; tras el cambio anterior faltaba el nombre del parámetro con la página a corregir. - José Emilio –jem– Tú dirás... 13:16 7 nov 2013 (UTC)

MusicaEditar

Hola... se me hace que le falta resaltar la palabra 'musica/Musica', ya que la correcta es 'música/Música'. Saludos, Giliofelix (responder) 16:38 4 abr 2014 (UTC)

Bueno, no hace falta en el listado, solo no lo está resaltando. Giliofelix (responder) 16:44 4 abr 2014 (UTC)

¿Certificar la ortografía?Editar

Como se ve por la discusión, el corrector automático trae problemas, porque el rojo dificulta la lectura inútilmente, sobre todo en palabras comunes, como aun y voces verbales del tipo ultimo, ultimó, dejo, etc. Además, palabras escritas de manera anticuada abundan en las citas literarias (hasta hace un siglo la preposición a se escribía a menudo á, etc.). Hay otros problemas, como el del doble acento: Oscar vs. Óscar (ambos existen), exégeta vs. exegeta (=), o apellidos como Perez (hay quien lo escribe sin tilde) o Martin vs. Martín. - Pregunta: ¿no se podría introducir un parámetro de certificación? Es decir, cuando abrimos una página poder indicar que la propuesta de corrección es superflua? Es como introducir una corrección de erratas, pero marcar la palabra para que el corrector la ignore entraña un problema técnico: ¿disponer de un carácter invisible o un formato distinto, mejor si es invisible? Gracias.--Sever Juan (discusión) 22:00 5 abr 2014 (UTC)

Ayuda con el funcionamiento del corrector en la wikipedia en gallegoEditar

Hola, necesito un poco de ayuda para mejorar el funcionamiento de este corrector que tenemos instalado en la wikipedia en gallego, pregunto aquí porque si alguien puede ayudarme un poco con la parte técnica. El caso es que en esta página he realizado una prueba de funcionamiento y he detectado dos cosas que no me "cuadran":

  • en la lista de palabras a revisar tenemos incluído el texto "la||a" pero en el texto de prueba que he indicado detecta "La" y lo marca como incorrecto pero no marca "la", ¿porqué?
  • en los últimos días parece que no hace caso a las nuevas palabras que se añaden al listado, se puede comprobar en el historial la inclusión de canica y gobierno pero no se detectan en la página de prueba. ¿Esto también pasa en es.wiki?

Si alguien entiende algo de cómo funciona y cómo debe actualizarse el corrector y puede echar un vistazo a la instalación en gl.wiki para echarnos una mano se lo agradecería. Saludos, --Elisardojm (discusión) 19:11 12 may 2014 (UTC)


Hola, Elisardojm. Copio mi respuesta aquí y en gl.wiki porque resultará igualmente útil en ambos proyectos. Para poder aclarar tus dudas he tenido que investigar el código del corrector en Labs, e incluso hacer unas pruebas más específicas con modificaciones de su código en mi propia cuenta de Labs; afortunadamente el corrector está programado en PHP, mi lenguaje habitual, y por eso he podido profundizar en ello. Realmente ha sido interesante e instructivo averiguar o deducir las soluciones que ha buscado otro programador (en algunos casos creo que mejorables, pero yo tampoco me libraría de críticas si se revisara mi trabajo).

Antes de nada hay que explicar cómo funciona el corrector; trataré de hacerlo sin meterme en demasiados detalles técnicos.

Cuando el corrector lee el texto de la página a corregir, y antes de contrastarlo con la lista de palabras «erróneas», primero hace un filtrado de todos los caracteres que no sean letras, dejando espacios en su lugar (llamo a esta operación R0), y a continuación intenta eliminar tanto las palabras de una (sea R1) como de dos letras (sea R2). Es decir, de entrada, y aunque no parece estar documentado oficialmente, la intención del programador es claramente no considerar las palabras ni de una ni de dos letras, por lo que no serviría de nada que estén en el listado. Ahora bien; dije «intenta eliminar» y no «elimina» porque, en el código, la expresión regular usada para ejecutar R1 y R2 puede «traducirse» así: «sustituir los bloques de texto que consten de un espacio (en adelante, E1), un carácter (R1)/dos caracteres (R2) cual(es)quiera (ya solo pueden ser letras, pues R0 se hace antes) y otro espacio (en adelante, E2), por un espacio».

El problema es que esos bloques se delimitan una sola vez al principio y sin solapamiento entre ellos; por lo tanto, cuando dos palabras de una letra aparecen consecutivamente, por ejemplo en «y a veces...», se detecta la «y» y se toma su E2, pero al quedar dentro de ese bloque, ese espacio ya no puede funcionar como E1 para «a»; el resultado es que «a» no es afectada por R1, ni eliminada. Siguiendo el razonamiento, si hubiera una tercera palabra de una letra consecutiva, sí se detectaría, pero una cuarta no, etc. Exactamente lo mismo pasa con las series de palabras consecutivas de dos letras en R2. La alternancia entre palabras de una y dos letras no causa problema y todas son eliminadas, porque primero se completa R1 y solo con el texto resultante se hace R2, formándose nuevos bloques. Otra consecuencia interesante de esto es que si hay una palabra de una o dos letras exactamente al comienzo o al final del wikitexto, tampoco es eliminada, porque le faltaría su E1 o su E2, respectivamente (lo segundo es casi imposible que suceda, porque al final debería haber categorías, e incluso si hay una frase, esta debería terminar en punto, que por R0 quedaría convertido en espacio, y ya tendríamos el E2).

Sigamos. Una vez depurado el texto de entrada con esos reemplazos y otros menores que ya no vienen al caso aquí, se divide el texto final palabra por palabra dividiendo por los espacios, y, atención, se eliminan los duplicados de la lista de palabras resultante, lo cual implica que cada palabra solo aparecerá una vez (lo llamo A1), pero las variantes que solo cambian en el uso de mayúsculas o minúsculas sí estarán por separado (A2), ya que por defecto PHP trabaja con distinción de casos. Ahora, con esa lista final, vamos contrastando para cada palabra si, pasada a minúsculas, está en la lista de errores «normal», o si, tal cual, está en la lista de errores «cs» (con distinción de mayúsculas). Si hay coincidencia, se devuelve la indicación para que esa palabra sea marcada con la corrección sugerida asociada, y, como es una indicación referida simplemente a la palabra, sin especificar posiciones ni contextos, será válida para cualquier aparición de esa palabra en el wikitexto (esto explica A1); además, habrá indicaciones propias para las posibles variantes con distinción de caso (por A2), necesarias para que se marquen correctamente. Esas indicaciones son las que llegan al navegador a través del código Javascript del accesorio y hacen que aparezcan las marcas en fondo rojo.

Una vez explicado todo esto, estamos en condiciones de analizar los casos «extraños» en el texto actual de tu prueba (añado enlace permanente para dejar el contexto adecuado en consultas futuras):

  • «la» (en minúsculas): En «en la Junta», el «la» no se elimina en R2 por ir detrás de otra palabra de dos letras, con lo que pasa a la comparación con el listado; como sí tenemos «la||a» en él, se genera una indicación para todos los «la» del texto, con lo cual se marcan los otros dos «la», independientemente de su contexto (pero no los «La», por A2). El segundo «la», que también va detras de «en», también habría causado por sí solo que todos los «la» quedaran marcados, pero el tercero no, conforme a todo lo expuesto.
  • «La» (en mayúsculas): En «no en La Isla», el «La» sí se elimina en R2 por ser la tercera palabra consecutiva de dos letras, conforme se ha explicado. Las demás «La» del texto también se eliminan normalmente, al no tener palabras de dos letras delante. Por ello, no pasa a la comparación y no se genera la indicación.

Y por eso los «la» se marcan y los «La» no se marcan. Puedes probar a hacer cambios y verás que todos los resultados podrán explicarse con lo que he dicho.

En cuanto a las palabras añadidas recientemente, la explicación es más sencilla y obvia: los ficheros con las listas de palabras a corregir en cada idioma se actualizaron por última vez el 30 de abril a las 4 h UTC, cuando en teoría se actualizan a diario. En es.wiki no lo hemos notado porque no ha habido cambios desde entonces. Imagino que se deberá a algún problema en el crontab (gestor de tareas programadas de Linux), pero eso solo puede aclararlo el programador.

Y anticipándome a la siguiente pregunta: ¿soluciones? Personalmente yo eliminaría al menos el R2 y tal vez el R1, ya que realmente no veo sus beneficios, y sí las complicaciones para hacer que funcionen siempre, sin los «agujeros» que he explicado. Así se podrían admitir y gestionar sin problemas las palabras de dos ¿y una? letras, en cualquier posición. Y ya puestos, se podrían analizar otras posibles mejoras y optimizaciones (me resulta particularmente sorprendente en lo negativo la duplicación total del código entre idiomas, que complica cualquier mantenimiento futuro). Todo esto podría conseguirse: preferiblemente, por intervención directa del programador, previa explicación a él de los problemas de los reemplazos y del crontab; alternativamente, proponiéndole que me añadiera a mí como gestor de la herramienta spellcheck en Labs, de forma que yo mismo podría acceder y modificar su código y el crontab; y en última y muy poco deseable instancia, si el programador no pudiera o no quisiera hacer nada, por copiado y modificación y ejecución por mí mismo de la herramienta y el crontab en mi cuenta/herramienta de Labs (o creándome una nueva herramienta), y cambiando los enlaces en nuestras Wikipedias. En cualquier caso, el primer paso sería contactar con el programador. Ya me comentarás, seguiré atento al asunto. - José Emilio –jem– Tú dirás... 11:31 19 may 2014 (UTC)

Lo primero de todo, muchísimas gracias Jem por tu esfuerzo y estupendo análisis, con el se aclara un poco el funcionamiento "extraño" que tiene algunas veces el corrector. Lo que no entiendo es por qué el corrector pretende ignorar las palabras de una y dos letras, esto para nosotros es un problema porque hay bastantes casos en los que necesitamos realmente corregir palabras con estas longitudes. Lo único que se me ocurrre es que se "salte" esas palabras para mejorar el rendimiento y así no ralentizar en exceso la carga de las páginas. Pero sería interesante preguntarle al programador sobre este tema. Tema a parte es que la eliminación de esas palabras sea incorrecta, si tienen que eliminarse por motivos de rendimiento tienen que eliminarse en todos los casos porque de otra forma una palabra incorrecta se detecta en unos casos y en otros no y esto provoca que se desconfíe del correcto funcionamiento del programa.
Estoy de acuerdo contigo en que se debe contactar con el programador pero el problema es que yo no sé alemán y mi inglés no llega para explicar algo que medio-entiendo, ¿quién se podría encargar de tratar con el para ver si se pueden solucionar estos problemas y que arregle el crontab? Saludos, --Elisardojm (discusión) 00:52 22 may 2014 (UTC)
Aquí va una posible explicación resumida de los problemas y soluciones en inglés, que puedes retocar, para dejarle al programador (según lo que hemos hablado en IRC), Elisardojm. Seguiré al tanto de las novedades.

Hi. We've noted a couple of problems with the Spellchecker (verifíquese si es el nombre «oficial» que le da al accesorio) in eswiki and glwiki. First of all, the lists of words aren't being updated since April 30 (perhaps there is a problem with your crontab in Labs?); and second, the behaviour for words with one or two letters is problematic. After analysing the code in Labs, we've seen that such words are supposedly being removed before the comparison with the wrong words list, but, in fact, in the way the regex is built, when a series of consecutive one or two-letter-words appears, the even ones (second, fourth and so) aren't removed, as the first space for the regex is already used as the last space for the previous word. Also, as spaces are needed, the words aren't removed if they are the very first thing in the wikitext (or the very last, but this would be almost impossible in real wikis). We think it would be easier and better to just remove those replacement regexs and allow such words, or at least two letter words, as this is not documented, there are cases of use for them in glwiki, and we don't see a real performance problem there. If you need help with this or the tool maintenance in general, -jem- offers himself to help from his Labs account. Thanks in advance and we wait for your answer.

- José Emilio –jem– Tú dirás... 19:49 25 may 2014 (UTC)
Ya ha respondido APPER y se ha solucionado todo, muchas gracias -jem-!! Comenta que se olvidó de cambiar el crontab cuando se cambió el sistema del toolserver y que ahora ya está activo. Sobre el problema de las palabras de una y dos letras comenta que ha quitado esas limitaciones para gl y es, y ahora todo funciona genial. Comenta además que si quieres te puede añadir como "mantenedor" de la herramienta, tu dirás.
Bueno pero esto no es todo, esta era la parte urgente, ahora viene la parte buena -jem- :). Ya desde hace mucho tiempo me di cuenta de que el corrector parece que no funciona en páginas de tamaño medio y grandes. Mira por ejemplo esta página, en el apartado de obra, debería marcar en rojo las palabras "La", y otras (como se puede ver en la página de pruebas), como hace en la página de prueba, sin embargo no se marca ninguna palabra incorrecta en todo el artículo. ¿Esto es debido a que el corrector no se activa en páginas que superan un determinado tamaño por motivos de rendimiento o algo así? ¿O quizás es porque hay demasiados errores en la página? En la página de prueba he metido un error entre comentarios wiki y por la razón que sea ya no me marcó ninguno :) Me da la impresión de que si un error se repite más de X veces entonces ya no marca nada...Saludos, --Elisardojm (discusión) 12:25 2 jun 2014 (UTC)

Corrector ortográfico y los falsos positivos.Editar

Hola, Quería preguntar si hay alguna forma de quitar el fondo rojo de la palabras que están bien escritas -creo que se denomina "falsos positivos"-, y que son correctas según el sentido del texto, o el idioma utilizado dentro de otro idioma.--Jesús (discusión) 23:09 7 feb 2016 (UTC)

Jesús: En términos generales y por ahora, no, pero hay algunas formas de paliar/reducir algo el problema. Más detalles en mi respuesta a Rauletemunoz unos hilos más abajo. - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)

Información obsoletaEditar

Parece que la información en Wikipedia:Corrector ortográfico#Problemas técnicos y limitaciones se ha quedado obsoleta. No veo que el corrector marque las palabras con caracteres ASCII como "según". Afortunadamente parece que la información sobre ese problema ya no es relevante. Sugiero eliminarla del artículo (yo no puedo hacerlo porque aún no estoy autoconfirmado). Alonso (discusión) 13:04 5 may 2016 (UTC)

Alonso: El problema persiste y nunca ha desaparecido, pero hay que señalar que únicamente se da en los artículos donde aparecen tanto la palabra errónea (positivo correcto, p. ej. «seg») como la palabra que genera el falso positivo por prolongación de la anterior que empieza con un carácter especial (p. ej. «según»). Véase el artículo Segundo. Habría que mejorar la explicación, pero lo ideal sería revisar el código PHP en Toolforge para hacer que detecte y devuelva otro tipo de indicación asociada a esas palabras para que el Javascript local no marque el falso positivo. Es algo que plantearé y probablemente abordaré más adelante. - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)

Añadir palabraEditar

Añadir palabra al corrector. Palabra a corregir pins correcto pines. --Jcfidy (discusión) 05:44 3 ago 2017 (UTC)

  Añadida como puedes ver. Gracias por avisar. Saludos. Antón Francho (si me quieres decir algo) 19:02 13 ago 2017 (UTC)

Sólo/soloEditar

Creo que ocurre lo mismo que en el caso de "aún". Regularmente marca como error, como falso positivo, las redacciones en que se usa "sólo" de manera correcta. Ej: sólo puede hacer referencia. No sé si hay acción posible al respecto. Saludos GinkgoBiloba (discusión) 05:11 28 oct 2017 (UTC)

  No, la RAE ya no reconoce la palabra sólo, actualmente se debe de utilizar siempre la palabra sin tilde. Jcfidy (discusión) 08:21 28 oct 2017 (UTC)

Error en el código fuenteEditar

Me parece se debe revisar el código fuente del corrector, pues para el caso de la palabra "capitanía" arroja falto positivo, piensa que es "capitan". Ver el artículo Virreinato de Nueva España -- oSepu   (Discusión) 20:34 20 may 2018 (UTC)

Es decir el tilde lo está tomando como fin de palabra -- oSepu   (Discusión) 23:20 3 jun 2018 (UTC)
Hola, oSepu. Es una limitación técnica/error ya conocido que se explica aquí. Solo sucede porque la palabra que genera el positivo correcto, «capitan» sin tilde, también aparece en el artículo, concretamente en una cita de este apartado. Sería bueno comprobar si en el castellano antiguo original efectivamente no hay tilde; de ser así, de momento no hay solución, aunque en un futuro se podría plantear tanto omitir el contenido de las citas al procesar el texto como excluir explícitamente las palabras susceptibles de falso positivo que se detecten en el procesamiento. Es algo que plantearé y probablemente abordaré más adelante. - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)

Página con muchos erroresEditar

Buenos días a todos. En pro del Wiktionary inglés, hemos publicado una página que busca palabaras que nos faltan, pero que puede servir también como fuente de errores ortográficos en es.wikipedia - cuentan entre los errores más comunes rehizo, pelicula, despúes, produjó, agsto, posteriomente (170+ veces). He aquí la lista. Como se ve, la palabra más común que nos faltaba era antitanque. Vamos bastante bien en en.wikt en tema del idioma español - tenemos más de 85.000 palabras "bases", sin mencionar los 666.000 de páginas de conyugaciones, plurales o formas de adjectivos. Sin embargo, siempre buscamos a más palabras y a más usuarios. Espero que nuestra página os pueda servir en algo. Un saludo desde en.wikt. --Harmonicaplayer (discusión) 08:05 21 jun 2018 (UTC)

Validación de datosEditar

¿Habría alguna manera de validar datos correctos que aparecen en sombreado rojo? Es decir, por poner un ejemplo, en el artículo Pelotón aparece el término «Company of Heroes» y «Heroes» en rojo porque no lleva tilde. ¿No se podría poner algún tipo de código (yo que sé, no sé de informática, por decir algo, «<Heroes>») para validar este falso positivo? Creo que me he explicado peor que el Pato Donald ebrio.   Rauletemunoz 15:58 16 ago 2018 (UTC)

Hola, Rauletemunoz. Te he entendido bien, pero lo que pides no es sencillo. Cualquier marca en el wikitexto del artículo podría ser confusa para los lectores y editores no avisados, y además tendríamos que conseguir que no produjera efectos en la visualización normal de la página (y con lo de <Heroes>, por ejemplo, es obvio que sí hay un efecto porque los símbolos se ven). Sería preferible trabajar en el código del corrector, ya fuese en la herramienta de Toolforge o en el Javascript local, o en la propia lista de errores. Desde luego como primera opción se podría añadir en el listado que «Heroes» es una alternativa aceptable, como se hace en otros casos susceptibles de falso positivo, para que al menos al pasar el puntero se sepa que puede ser correcto, y sería plausible que en un futuro esos casos de varias opciones se marcaran en un color más suave. Otras opciones a evaluar podrían ser omitir casos en mayúscula (a riesgo de algunos falsos negativos también), omitir texto enlazado y enlazar en este caso porque Company of Heroes existe, o introducir listas de excepciones globales de varias palabras (más complejo porque por ahora el corrector solo trabaja con palabras individuales, pero no imposible). Lo que sí me parece impractible es introducir excepciones (o, como tú las llamas, validaciones) específicas para cada aparición en un artículo, porque con el continuo cambio e incluso eliminación de los wikitextos no habría forma de «anclar» cada caso a una posición numérica (ya fuese de orden de aparición o de número de carácter) y el mantenimiento sería inviable. Todo esto está entre las ideas que preveo plantear y abordar en un futuro junto a otros proyectos... de momento esto te puedo decir, aunque podemos profundizar el debate aquí o en IRC, si lo deseas. Saludos, - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)
Vale, a ver si lo he entendido bien -jem-, ¿podríamos de alguna manera decirle al corrector que no ponga en rojo palabras como «fábrica» (establecimiento para fabricar) y fabrica (del verbo fabricar) o, al menos, ponerlas más suaves si pueden ser correctas como este ejemplo? Por cierto, un saludo, que hace tiempo que no hablamos.   Rauletemunoz 22:36 18 ago 2018 (UTC)
Sí, Rauletemunoz, esa es una de las posibilidades que caben si se trabaja a fondo en el código. Para ello, lógicamente, tendríamos que ser estrictos a la hora de redactar el texto de la sugerencia (tooltip) para que se puedan identificar claramente los casos en que hay varias opciones: ahora normalmente se separan con comas y no habría que tener en cuenta lo que pueda estar entre paréntesis, así que podría bastar fijar eso como norma estricta y confiar en que los usuarios estén atentos a cumplirla. Por otra parte, ese cambio y todos los demás que se puedan plantear supondrían en principio separarnos del código original/común, que en teoría está en uso también en las Wikipedias en alemán, gallego y persa, por lo que habría que evaluar bien nuestros recursos y nuestros objetivos, y quizás hablar con el autor, APPER, y con las respectivas comunidades. Finalmente... otro saludo para ti y que hablemos con más frecuencia :). - José Emilio –jem– Tú dirás... 23:00 24 ago 2018 (UTC)
Volver a la página de proyecto «Corrector ortográfico».