Diferencia entre revisiones de «Lematización»

Contenido eliminado Contenido añadido
Aosbot (discusión · contribs.)
m Mantenimiento de Control de autoridades
mSin resumen de edición
Línea 1:
La '''lematización''' es un proceso [[Lingüística|lingüístico]] que consiste en, dada una [[Flexión (lingüística)|forma flexionada]] (es decir, en plural, en femenino, conjugada, etc), hallar el lema correspondiente. El [[Lema (lingüística)|lema]] es la forma que por convenio se acepta como representante de todas las formas flexionadas de una misma palabra. Es decir, el lema de una palabra es la palabra que nos encontraríamos como entrada en un diccionario tradicional: singular para sustantivos, masculino singular para adjetivos, infinitivo para verbos. Por ejemplo, ''decir'' es el lema de ''dije'', pero también de ''diré'' o ''dijéramos''; ''guapo'' es el lema de ''guapas''; ''mesa'' es el lema de ''mesas''.
 
Lematizar implica estandarizar, desambiguar, segmentar y, en caso de usar programas de lematización automática, también etiquetar.<ref>{{Cita publicación|url=http://revistas.pucp.edu.pe/index.php/lexis/article/view/23084|título=Corpus Básico del Español de Chile ©: metodología de procesamiento y análisis|apellidos=Castillo Fadić|nombre=María Natalia|fecha=2020-12-21|publicación=Lexis|volumen=44|número=2|páginas=483–523|fechaacceso=2021-03-08|issn=0254-9239|doi=10.18800/lexis.202002.004}}</ref>
 
La lematización puede realizarse automáticamente mediante programas de [[Morfología lingüística|análisis morfológico]]. Hay diversos grados de lematización posible: podemos hacer una lematización puramente morfológica, o bien hacer una lematización sintáctica que tenga en cuenta el contexto en el que aparece la palabra. Por ejemplo, en un análisis morfólogico la palabra ''ama'' tendría dos lemas: el sustantivo ''ama'' y el verbo ''amar''. Sin embargo, en un contexto sintáctico (es decir, en una oración), podemos desambiguarlo y optar por un único lema. Así, en ''El ama de llaves abrió la puerta'', ''ama'' es sustantivo, mientras que en ''María ama a Pedro'', ''ama'' es del verbo ''amar''. Para poder hacer este tipo de lematización es necesario, por lo tanto, hacer [[Analizador sintáctico|un análisis sintáctico]].