Diferencia entre revisiones de «Corpus lingüístico»

Contenido eliminado Contenido añadido
CEM-bot (discusión · contribs.)
m Pequeñas correcciones WP:CEM.
PODA (discusión · contribs.)
m →‎Corpora mono-/ bi- y multilingües: correcciones várias de estilo, ortografía, gramática y ortotipografía
Línea 1:
Un '''corpus lingüístico''' es un conjunto amplio y estructurado de ejemplos reales de uso de la lengua. Estos ejemplos pueden ser textos (lolos más comúncomunes), o muestras orales (generalmente transcritas). Un corpus lingüístico es un conjunto de textos relativamente grande, creado independientemente de sus posibles finesformas deo usousos. Es decir, en cuanto a su estructura, variedad y complejidad, un corpus debe reflejar una lengua, o su modalidad, de la forma más exacta posible y,; en cuanto a su uso, preocuparse de que su representación sea real. Los córpora tienen similitudes con los textos porque están compuestos por ellos;, por otro lado, no son textos en sí, porque, a diferencia de los mismos, no tiene sentido analizarlos en su totalidad. Un texto tiene un principio y un fin, y es, cohesivo y coherente en mayor o menor grado, cohesivo y coherente, mientras que un corpus carece de tales características por no poseer una estructura, sino sólo una composición. Por esta razón conviene analizar un corpus recurriendo a herramientas y metodología propias.
 
Debido a su tamaño, accesibilidad, información lingüística y enciclopédica, muy alta fiabilidad y otras particularidades, la complicación de los córpora hahan llegado a ser uno de los principales, si no el principal, método e instrumento de la investigación de la lengua en la lingüística general.<ref name=Mikelionienė>{{cita web | autor=Jurgita Mikelionienė |url = http://www.kalbos.lt/zurnalai/03_numeris/10.pdf | título = KOMPIUTERINĖ LINGVISTIKA. Palyginamojo tekstyno kūrimo principai, problemos ir panaudojimo galimybės. | obra = STUDIES ABOUT LANGUAGES. 2002. NO. 3 | fechaacceso = 7 de abril de 2015 }}</ref>
 
La necesidad de trabajar las muestras recogidas de forma eficaz y económica (teniendo en cuenta su enorme extensión), ha alentado el desarrollo de una de las ramas con más futuro de la lingüística contemporánea: [[Lingüística_computacional|la lingüística computacional]]. Actualmente los córpora se recogen y almacenan de manera electrónica.
 
== Aplicación de los córpora ==
Los córpora lingüísticos se utilizan para hacer análisis estadísticos y contrastar hipótesis sobre el área que estudian. Este tipo de córpora cada vez cuenta con más partidarios, y gracias al estudio de la lengua que estos córpora ofrecen, algunos postulados lingüísticos que contaban con un gran respaldo dentro de la comunidad lingüística, han sido puestos en duda.<ref name=Pérez>{{cita web | autor=Chantal Pérez Hernández |url = http://elies.rediris.es/elies18/22.html | título = El corpus en los estudios lingüísticos | obra = Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento | fechaacceso = 6 de abril de 2015 }}</ref>
 
Se llama [[lingüística de corpus]] a la subdisciplina de la [[lingüística]] que estudia la lengua a través de estas muestras. Este tipo de aproximación choca con el enfoque [[Noam Chomsky|chomskiano]] que tiende a estudiar la lengua a través de la intuición lingüística del hablante. Esta subdisciplina, dado el volumen de datos que maneja, suele asociarse con la [[lingüística computacional]], según esta última se acerca a las aplicaciones del [[procesamiento de lenguaje natural]].
Línea 32:
*'''Accesibilidad'''
 
En cuanto a la representabilidadrepresentatividad, la pregunta esencial es ¿qué es lo que debe reflejar un corpus? No basta sólo con decir que éste debe reflejar el idioma o su variabilidad, porque esta respuesta no es informativa. Por tanto conviene descomponerdisgregar la representabilidadcomposición en cuatro esferas de uso: el habla, la escritura, la audición y la lectura, y, además, tomar en cuenta el número de usuarios de cada esfera. Los córpora oportunistas y representativos a menudo se relacionan como etapas distintas de composición de un único corpus: al principio se crea un corpus representativo y luego, de acuerdo con ciertas proporciones, se seleccionan córpora para un corpus equilibrado.
 
== Tipos de Córpora ==
Línea 66:
 
==== Corpora mono-/ bi- y multilingües ====
Córpora multilingüesmonolingües permiten investigaciones sobre una lengua, mientras que corpora bi- o multilingües recogen ejemplos de más de una lengua. De los córpora multilingües se diferenciandistinguen tres diferentes subtipos:
 
===== Corpora comparativos =====