Centralidad de cercanía

En análisis de redes sociales, la centralidad de cercanía, o simplemente cercanía (en inglés, closeness), es una medida de centralidad basada en las ideas de Bavelas (1950), definida formalmente por Beauchamp (1965) y Sabidussi (1966), con aplicaciones en redes de comunicación,^[1] y luego popularizada porFreeman (1979).^[2] Es la más conocida y utilizada de las medidas radiales de longitud. Se basa en calcular la suma o bien el promedio de las distancias geodésicas (o longitudes de los caminos más cortos) desde un nodo hacia todos los demás.^[3] Note que mientras mayor sea la «distancia» entre dos vértices, menor será la «cercanía» entre estos. Por lo tanto, la cercanía se define como el inverso multiplicativo de la «lejanía» entre dos vértices.^[4]

Definición formal

En lo que sigue, se define formalmente un grafo como un par ordenado $G=(V,E)$ , donde $V$ es su conjunto de nodos o vértices y $E$ su conjunto de aristas. El número de vértices se denota como $n=|V|$ .

Formalmente, para un grafo (dirigido o no dirigido), sea $d(u,v)$ la distancia geodésica entre los nodos $u$ y $v$ , la cercanía $C_{C}(u)$ de un nodo $u\in V$ se define como:^[5]

C_{C}(u)={\frac {1}{\sum _{v\in V}d(u,v)}}

Note que en algunas referencias $d(u,v)$ puede cambiar por $d(v,u)$ .^[6]

Sea $S$ la matriz de distancias de la red, es decir, aquella matriz cuyos elementos $(i,j)$ corresponden a la distancia geodésica desde el nodo $i$ hasta el nodo $j$ , entonces una definición alternativa es la siguiente:

C_{C}(i)={\frac {1}{\sum _{j=1}^{n}(S)_{ij}}}

Para normalizar esta medida, se considera el mayor valor posible que podría asumir la medida para un nodo. Si el grafo no admite bucles, entonces un nodo a lo más puede conectarse directamente a los $n-1$ nodos restantes; si admite bucles (y asumimos que no es un multigrafo), entonces podrá conectarse directamente con los $n$ nodos de la red. Por lo tanto, la medida normalizada queda definida formalmente, para ambos casos, respectivamente:

C_{C}(u)={\frac {n-1}{\sum _{v\in V}d(u,v)}}\,\,\,

o bien

\,\,\,C_{C}(u)={\frac {n}{\sum _{v\in V}d(u,v)}}

En una red de flujo esta medida se puede interpretar como el tiempo de llegada a destino de algo que fluye a través de la red.^[7] También puede interpretarse como la rapidez que tomará la propagación de la información desde un nodo a todos los demás.^[8] La cercanía mide de alguna forma la accesibilidad de un nodo en la red. Este concepto es utilizado también de manera similar en topología, donde se define como un espacio métrico.

Note que en un grafo disconexo, la cercanía de todos los vértices será siempre igual a 0, dado que siempre existirá algún otro nodo para el cual la distancia geodésica con él resulta infinita. Por lo tanto, la centralidad de cercanía tiene la desventaja de que solo se puede aplicar, en el caso de redes no dirigidas, sobre grafos conexos o componentes conexos, y para redes dirigidas, sobre componentes fuertemente conexos.^[5]

Variantes de la cercanía

En lugar de considerar la suma de las distancias geodésicas de un nodo hacia todos los demás, existe una variante que se enfoca únicamente en hallar la menor de estas distancias geodésicas. La excentricidad de un nodo es la mayor distancia entre ese nodo y cualquier otro del grafo. El centro de Jordan refiere al subconjunto de nodos con menor excentricidad dentro del grafo. Este centro puede encontrarse fácilmente a partir de la matriz de distancias del grafo, seleccionando aquellos nodos que comparten el menor valor máximo de sus respectivas filas en la matriz.^[5] Un concepto relacionado muy antiguo, al menos desdeSylvester (1882), es el de centroide, más apropiado específicamente para árboles.^[9] La idea es que para cada nodo del árbol, se considera el peso de cada una de sus ramas o caminos que parten desde dicho nodo, donde el peso de una rama es su número de aristas. El nodo se queda con el mayor de los pesos resultantes de entre todas sus ramas. El centroide corresponde así al subconjunto de nodos que comparten el peso final más pequeño.^[5]

La medida tradicional de cercanía asume que la propagación de información siempre se da en la red a través del camino más corto. Este modelo puede no ser el más realista para algunos tipos de escenarios de comunicación. Por ello han surgido algunas variantes de esta medida como la denominada cercanía por camino aleatorio (en inglés, random-walk closeness centrality), introducida por Noh y Rieger (2004) y que considera caminos aleatorios para acceder de un nodo a los demás, en lugar de escoger siempre el camino más corto.^[10]

En grafos disconexos

Existen algunas variantes de la cercanía que permiten trabajar con grafos disconexos. Si la red no es un componente fuertemente conexo,Beauchamp (1965) propuso usar la suma del recíproco de las distancias en lugar del recíproco de la suma de las distancias, con la convención de que $1/\infty =0$ , esto es, que las distancias entre actores inaccesibles sea cero, en lugar de infinito:

H(u)=\sum _{u\neq v}{\frac {n-1}{d(u,v)}}

A esta medida actualmente se le conoce como centralidad armónica (harmonic centrality, en inglés).^[11] Esta medida respeta el principio general propuesto por Marchiori y Latora (2000), que dice que en grafos con distancias infinitas la media armónica se comporta mejor que la media aritmética, utilizada por la medida de cercanía tradicional.^[12] Esta idea es similar al factor de potencial de mercado propuesto por Harris (1954),^[13] que actualmente se conoce como «acceso al mercado» (market access, en inglés).^[14]

Esta idea ha reaparecido varias veces en la literatura, usualmente sin el factor de normalización $n-1$ , por ejemplo por Dekker (2005) para grafos no dirigidos, bajo el nombre de centralidad valorada (valued centrality, en inglés).^[15] Fue axiomatizada por Garg (2009)^[16] y propuesta nuevamente por Opsahl (2010) como solución para redes con componentes disconexos.^[17] Sus axiomas también fueron estudiados por Boldi y Vigna (2014).^[18]

Otra alternativa natural, siguiendo las ideas de Lin (1976), es considerar únicamente los nodos accesibles desde o hacia el nodo cuya centralidad se está midiendo.^[19] Sea $J_{u}$ el número de actores dentro del rango de influencia de $u$ (o accesibles desde o hacia $u$ , dependiendo de si se desea trabajar con aristas de salida o de llegada en un grafo dirigido, respectivamente), se puede definir la siguiente variante de la centralidad de cercanía:

C_{C}^{*}(u)={\frac {J_{u}/(n-1)}{\sum _{v\in V}d(u,v)/J_{u}}}

donde $J_{u}/(n-1)$ es la proporción de nodos accesibles en el componente conexo, y ${\textstyle \sum _{v\in V}d(u,v)/J_{u}}$ es la distancia media de los nodos a $v$ .^[5]

Una alternativa más distinta es la de Dangalchev (2006), quien propone la siguiente medida de vulnerabilidad en las redes:^[20]

C_{DC}(i)=\sum _{j=1}^{n}2^{-(S)_{ij}}

donde $S$ es nuevamente la matriz de distancias.

Índices de prestigio

Para redes dirigidas, la cercanía y sus variantes se suelen centrar en caminos desde un nodo dado. Sin embargo, también puede ser útil considerar los caminos hacia dicho nodo. A las medidas de centralidad que consideran este último tipo de caminos se les suele también llamar medidas o índices de prestigio.^[5]

A partir de ideas de Lin (1976), el prestigio de proximidad $P_{P}(u)$ de un nodo $u\in V$ se define como:

P_{P}(u)={\frac {I_{u}/(n-1)}{\sum _{v\in D(u)}d(v,u)/I_{u}}}={\frac {I_{u}^{2}}{(n-1)\sum _{v\in D(u)}d(v,u)}}

donde $D(u)$ es el dominio de influencia del nodo $u$ , es decir, el conjunto de actores que pueden acceder a dicho actor, $I_{u}=|D(u)|$ es la cardinalidad del dominio de influencia de $u$ , $I_{u}/(n-1)$ es la proporción de nodos de la red que están en el dominio de influencia de $u$ , y ${\textstyle \sum _{v\in D(u)}d(v,u)/I_{i}}$ es la distancia media a la que los nodos del dominio de influencia están de $u$ .^[5]

Note que el prestigio de proximidad se puede aplicar sobre redes disconexas.^[5]Mackenzie (1966) y Arney (1973) también propusieron medidas similares.^[21]^[22]

Por otra parte,Harary (1959) define el estatus neto de un actor $u\in V$ , que definiremos $P_{E}(u)$ , como:^[23]

P_{E}(u)=\sum _{v\in V}d(u,v)-\sum _{v\in V}d(v,u)

donde la primera sumatoria es el estatus de $v$ , y la segunda sumatoria el contraestatus de $v$ .

Otro índice de prestigio conocido es la centralidad de vector propio, la que para cada actor considera no solo su propio prestigio, sino también el de los actores que apuntan a este. Bajo este criterio, un actor es más prestigioso en la medida que los actores relacionados con él son también más prestigiosos.^[5]

Véase también

Referencias

↑ Beauchamp, M. A. (1965). «An improved index of centrality». Systems Research and Behavioral Science 10 (2): 161-163. doi:10.1002/bs.3830100205.
↑ Freeman, L.C. (1979). «Centrality in networks: I. Conceptual clarification». Social Networks 1: 215-239. doi:10.1016/0378-8733(78)90021-7.
↑ Sun, J.; Tang, J. (2011). «A survey of models and algorithms for social influence analysis». En Charu C. Aggarwal, ed. Social network data analytics (Nueva York: Springer): 177-214. doi:10.1007/978-1-4419-8462-3.
↑ Sabidussi, G. (1966). «The centrality index of a graph». Psychometrika 31 (4): 581-603. doi:10.1007/BF02289527.
↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ Wasserman y Faust, 2013, «Centralidad y prestigio», pp. 191-240.
↑ «networkx.algorithms.centrality.closeness_centrality». NetworkX. Consultado el 9 de diciembre de 2021.
↑ Borgatti, S. P. (2005). «Centrality and network flow». Social Networks 27: 55-71. doi:10.1016/j.socnet.2004.11.008.
↑ Newman, M.E.J. (2005). «A measure of betweenness centrality based on random walks». Social Networks 27: 39-54. doi:10.1016/j.socnet.2004.11.009.
↑ Sylvester, J. J. (1882). «On the geometrical forms called trees». Johns Hopkins University Circle 1: 202-203.
↑ Noh, J. D.; Rieger, H. (2004). «Random walks on complex networks». Phys. Rev. Lett. 92 (11). doi:10.1103/PhysRevLett.92.118701.
↑ Rochat, Y. Closeness centrality extended to unconnected graphs: The harmonic centrality index. Applications of Social Network Analysis, ASNA 2009.
↑ Marchiori, M.; Latora, V. (2000). «Harmony in the small-world». Physica A 285 (3-4): 539-546. Bibcode:2000PhyA..285..539M. S2CID 10523345. arXiv:cond-mat/0008357. doi:10.1016/s0378-4371(00)00311-3.
↑ Harris, C. D. (1954). «The narket as a factor in the localization of industry in the United States». Annals of the Association of American Geographers 44 (4): 315-348. JSTOR 2561395.
↑ Gutberlet, T. (2014). «Cheap coal versus Market access: The role of natural resources and demand in Germany's industrialization». Working Paper.
↑ Dekker, A. (2005). «Conceptual distance in social network analysis». Journal of Social Structure 6 (3).
↑ Garg, M. (2009). Axiomatic foundations of centrality in networks. S2CID 117717919. doi:10.2139/ssrn.1372441.
↑ Opsahl, T. (20 de marzo de 2010). «Closeness centrality in networks with disconnected components». Consultado el 19 de octubre de 2021.
↑ Boldi, P.; Vigna, S. (2014). «Axioms for centrality». Internet Mathematics 10 (3–4): 222-262. doi:10.1080/15427951.2013.865686.
↑ Lin, N. (1976). Foundations of social research. Nueva York: McGraw-Hill.
↑ Dangalchev, Ch. (2006). «Residual closeness in networks». Physica A 365 (2): 556-564. doi:10.1016/j.physa.2005.12.020.
↑ Mackenzie, K. D. (1966). «The information theoretic entropy function as a total expected participation index for communication network experiments». Psychometrika 31: 249-254. doi:10.1007/BF02289511.
↑ Arney, W. R. (1973). «A refined status index for sociometric data». Sociological Methods and Research 1 (3): 329-346. doi:10.1177/004912417300100304.
↑ Harary, F. (1959). «Status and contrastatus». Sociometry 22 (1): 23-43. doi:10.2307/2785610.

Bibliografía

Wasserman, Stanley; Faust, Katherine (2013) [1994]. Análisis de redes sociales: Métodos y aplicaciones. Madrid: Centro de Investigaciones Sociológicas. ISBN 978-84-7476-631-8. OCLC 871814053.

Datos: Q28401153

[Beauchamp1965-1] Beauchamp, M. A. (1965). «An improved index of centrality». Systems Research and Behavioral Science 10 (2): 161-163. doi:10.1002/bs.3830100205.

[Fre79-2] Freeman, L.C. (1979). «Centrality in networks: I. Conceptual clarification». Social Networks 1: 215-239. doi:10.1016/0378-8733(78)90021-7.

[JJ11-3] Sun, J.; Tang, J. (2011). «A survey of models and algorithms for social influence analysis». En Charu C. Aggarwal, ed. Social network data analytics (Nueva York: Springer): 177-214. doi:10.1007/978-1-4419-8462-3.

[Sabidussi1966-4] Sabidussi, G. (1966). «The centrality index of a graph». Psychometrika 31 (4): 581-603. doi:10.1007/BF02289527.

[WF13.c5-5] ↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ Wasserman y Faust, 2013, «Centralidad y prestigio», pp. 191-240.

[6] «networkx.algorithms.centrality.closeness_centrality». NetworkX. Consultado el 9 de diciembre de 2021.

[Bor05-7] Borgatti, S. P. (2005). «Centrality and network flow». Social Networks 27: 55-71. doi:10.1016/j.socnet.2004.11.008.

[New05-8] Newman, M.E.J. (2005). «A measure of betweenness centrality based on random walks». Social Networks 27: 39-54. doi:10.1016/j.socnet.2004.11.009.

[9] Sylvester, J. J. (1882). «On the geometrical forms called trees». Johns Hopkins University Circle 1: 202-203.

[10] Noh, J. D.; Rieger, H. (2004). «Random walks on complex networks». Phys. Rev. Lett. 92 (11). doi:10.1103/PhysRevLett.92.118701.

[11] Rochat, Y. Closeness centrality extended to unconnected graphs: The harmonic centrality index. Applications of Social Network Analysis, ASNA 2009.

[12] Marchiori, M.; Latora, V. (2000). «Harmony in the small-world». Physica A 285 (3-4): 539-546. Bibcode:2000PhyA..285..539M. S2CID 10523345. arXiv:cond-mat/0008357. doi:10.1016/s0378-4371(00)00311-3.

[13] Harris, C. D. (1954). «The narket as a factor in the localization of industry in the United States». Annals of the Association of American Geographers 44 (4): 315-348. JSTOR 2561395.

[14] Gutberlet, T. (2014). «Cheap coal versus Market access: The role of natural resources and demand in Germany's industrialization». Working Paper.

[15] Dekker, A. (2005). «Conceptual distance in social network analysis». Journal of Social Structure 6 (3).

[16] Garg, M. (2009). Axiomatic foundations of centrality in networks. S2CID 117717919. doi:10.2139/ssrn.1372441.

[17] Opsahl, T. (20 de marzo de 2010). «Closeness centrality in networks with disconnected components». Consultado el 19 de octubre de 2021.

[18] Boldi, P.; Vigna, S. (2014). «Axioms for centrality». Internet Mathematics 10 (3–4): 222-262. doi:10.1080/15427951.2013.865686.

[19] Lin, N. (1976). Foundations of social research. Nueva York: McGraw-Hill.

[20] Dangalchev, Ch. (2006). «Residual closeness in networks». Physica A 365 (2): 556-564. doi:10.1016/j.physa.2005.12.020.

[21] Mackenzie, K. D. (1966). «The information theoretic entropy function as a total expected participation index for communication network experiments». Psychometrika 31: 249-254. doi:10.1007/BF02289511.

[22] Arney, W. R. (1973). «A refined status index for sociometric data». Sociological Methods and Research 1 (3): 329-346. doi:10.1177/004912417300100304.

[23] Harary, F. (1959). «Status and contrastatus». Sociometry 22 (1): 23-43. doi:10.2307/2785610.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]