Diferencia entre revisiones de «Algoritmo de agrupamiento»

Contenido eliminado Contenido añadido
Xqbot (discusión · contribs.)
m r2.7.3) (Bot: Añadiendo nl:Clusteranalyse
Sin resumen de edición
Línea 1:
Un '''algoritmo de agrupamiento''' (en inglés, '''''clustering''''') es un procedimiento de agrupación de una serie de [[Vector (programación)|vectores]] de acuerdo con un criterio. deEsos cercaníacriterios son por lo general distancia o similitud. Esta cercanía se define en términos de una determinada función de [[distancia]], como la [[distancia euclídea|euclídea]], aunque existen otras más robustas o que permiten extenderla a [[variables discretas]]. La medida más utilizada para medir la similitud entre los casos es las matriz de correlación entre los nxn casos.
 
Generalmente, los vectores de un mismo grupo (o ''clústers'') comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripción sintética de un conjunto de datos multidimensional complejo. De ahí su uso en [[minería de datos]]. Esta descripción sintética se consigue sustituyendo la descripción de todos los elementos de un grupo por la de un representante característico del mismo.
Línea 8:
 
Las técnicas de agrupamiento encuentran aplicación en diversos ámbitos.
* En [[biología]] para clasificar animales y plantas.
 
* En [[medicina]] para identificar enfirmedades
* En [[marketing]] para identificar personas con habitos de compras similares
* En [[teoría de la señal]] pueden servir para eliminar ruidos.
 
== Algoritmos ==
 
Existen diversasdos grandes técnicas depara el agrupamiento. Se dividen en dos grandesde categoríascasos:
 
* Agrupamiento jerárquico, que puede ser aglomerativo o divisivo.
* Jerárquicas, que construyen una jerarquía de grupos escindiéndolos iterativamente.
* DeAgrupamiento particionamientono jerárquico, en los que el número de grupos se determina de antemano y las observaciones se van asignando a los grupos en función de su cercanía. Existen los m{etodos de k-mean y k-medioid.
 
Existen diversas implementaciones de algoritmos concretos. Por ejemplo, el de las [[k-medias]], de particionamiento. Es uno de los más antiguos pero uso extendido a pesar de sus carencias y falta de robustez.