Análisis de chirpty

Datapolitik.
7 min readNov 23, 2020

--

Luces y sombras del algoritmo para visualizar círculos de interacción en Twitter.

Últimamente es muy común encontrar en Twitter imágenes que representan los “círculos de interacción” de alguna cuenta. David Álvarez, por ejemplo, publicó un hilo de Twitter en el que analizaba los círculos de interacción de algunos políticos españoles.

Círculos de interacción de @Duiker101, creador de chirpty, generados por su aplicación

Pero, ¿qué representan estas imágenes y de dónde vienen?

En este post trataremos de explicar la teoría que justifica este tipo de visualización y las luces y las sombras del algoritmo más comúnmente utilizado para generarla, chirpty.

En principio fue el número de Dunbar

A principio de los 90s, el antropólogo inglés Robín Dunbar propuso un límite superior para el número de relaciones sociales estables que puede mantener una persona humana. Concretamente 150, valor que hoy se conoce como el número de Dunbar. Dicho así, parece un número mágico o sacado al azar, pero no lo es. Estudiando las relaciones sociales entre primates, Dunbar encontró una relación entre el tamaño medio de los grupos sociales que forman y el tamaño medio de sus cerebros, más en concreto, del neocórtex. Extrapolando esta tendencia, el número de relaciones sociales que una persona humana puede mantener dado el tamaño de su neocórtex es aproximadamente de unas 150. Varias evidencias empíricas soportan esta teoría.

Es evidente que, las relaciones sociales que mantiene una persona no serán todas de la misma intensidad. De acuerdo con esta observación de sentido común, la teoría de Dunbar afirma que la red de interacciones sociales de una persona humana está organizada jerárquicamente. Podemos visualizarlas como una serie de capas concéntricas. En las capas más internas están las relaciones más estrechas, o con carga emocional más fuerte, en las capas exteriores las relaciones cada vez más débiles, o con menor carga emocional. En la teoría de Dunbar es central la hipótesis de que la frecuencia con la que contactamos a otra persona es un proxy de la intensidad emocional que nos une a ella. Es esto lo que permite hacer mediciones y descubrir cómo se organizan estas capas. Midiendo las interacciones sociales de varias personas en varios contextos, se ha llegado a afirmar que las capas se organizan con cierta regularidad según la progresión: 5, 15, 50, 150.

Representación gráfica de las capas en las que se organiza la red de relaciones estables de una persona humana.

Recientemente, investigadores del grupo de Sistemas Complejos de la Universidad Carlos III de Madrid, en colaboración con el propio Dunbar, han propuesto un modelo matemático que logra reproducir las regularidades observadas, asumiendo que nuestra capacidad para mantener relaciones es limitada — por el tamaño del neocórtex — y que diferentes tipos de relaciones requieren diferentes esfuerzos.

Conociendo esta teoría ya no resulta tan arbitraria la idea de visualizar las interacciones que mantiene un perfil de Twitter según círculos concéntricos y, además, ahora podemos imaginar que los distintos círculos representan distintos grados de proximidad.

Pero, estábamos hablando de relaciones sociales offline ¿qué tiene esto que ver con Twitter?

Los medios sociales online no hacen que se expanda nuestra red social

La promesa implícita de las tecnologías de comunicación en red era que abrirían el paso a un mundo de interacciones sociales que era intrínsecamente ilimitado. Por otra parte, la teoría de Dunbar nos dice que existen vínculos cognitivos que limitan nuestra capacidad de mantener relaciones estables. Dado el evidente contraste entre estas dos posturas, no es sorprendente que tanto Dunbar como otros sociólogos y antropólogos se pusieron a estudiar las interacciones sociales online para verificar si la teoría se seguiría aplicando en este nuevo entorno.

Ya en 2015 Dunbar y colaboradores publicaron un estudio titulado de manera elocuente “La estructura de las redes sociales online refleja las del mundo offline”. En él estudiaban varios datasets de interacciones — como likes o shares, algo distinto al simple seguirse o “ser amigo” — en Facebook y en Twitter y, a través de un análisis estadísticos de los datos, concluían que:

  1. El tamaño total de las redes de interacciones de un individuo online es algo menor que las redes de interacciones offline;
  2. La estructura por capas se mantiene prácticamente idéntica.

La única diferencia sustancial en la organización jerárquica de la red de interacciones sociales online es la existencia de una capa aún más interna, es decir de relaciones aún más estrechas, que solo incluye un individuo. Los mismos resultados también fueron obtenidos por otros investigadores.

Mucho se podría debatir acerca de estos resultados, pero por lo que nos interesa aquí, nos basta con decir que existen evidencias de que las redes de interacciones sociales online también tienen una estructura organizada por capas concéntricas y que la frecuencia de interacción es un proxy para la intensidad de dicha relación.

Los números mágicos de chirpty

A la luz de lo anterior, resulta más que apropiada la idea de visualizar las interacciones online de una cuenta de Twitter en círculos concéntricos y que cuanto más interior es un círculo, más intensas son las relaciones con los individuos que lo componen. Esto es exactamente lo que hace chirpty, vamos a ver cómo.

El algoritmo que utiliza es público y está en GitHub, así que podemos analizarlo. Además el autor, Simone Masiero (aka Duiker101), ha publicado en su blog personal una explicación detallada de cómo reproducir su aplicación, así que la tarea es aún más fácil. Es decir, para una persona con los conocimientos apropiados, la aplicación no es una caja negra y se puede estudiar su funcionamiento, algo que es muy de agradecer.

Para generar la imagen, primero la aplicación define tres círculos de un tamaño fijado. Cuenta cuantas interacciones — likes, respuestas y retuits — el perfil analizado ha tenido con cada cuenta con la que ha interactuado, pesando cada tipo de interacción de una manera distinta, ordena las cuentas de manera decreciente para rellenar los círculos y finalmente genera la imagen.

El tamaño fijo de los círculos es el primer problema. Para empezar, los números elegidos — 8, 15, 26 — nada tienen que ver con los tamaños observados empíricamente ni mantiene el factor de escala observado entre capas. Son totalmente arbitrarios. Además, cosa más importante aún, es verdad que las capas en las que se organiza la red social de un individuo tienen un tamaño más o menos regular, pero esto solo es así estadísticamente, es decir, cuando observamos muchas redes y promediamos. Cada individuo tendrá una estructura de su red social que diferirá más o menos de los valores promedio. Al fijar el tamaño de cada círculo la aplicación nos impide ver estas diferencias entre persona y persona. Esto nos lleva a situaciones paradójicas como la que obtenemos al analizar la red de Pedro Sánchez. Como podemos observar en la imagen publicada por David Álvarez, en el tercer círculo nos encontramos con menos cuentas que las que están en el segundo. ¿Quiere decir esto que Pedro Sánchez tiene más relaciones estrechas que débiles a diferencia de todo el resto del mundo? Absolutamente no, de hecho es justamente lo contrario. El total de interacciones de Pedro Sánchez en Twitter no da para rellenar los tres círculos de tamaño fijado. El resultado es que la aplicación está distribuyendo mal las interacciones dentro de los círculos.

Círculos de interacción de @sanchezcastejon, imagen públicada por @dalvarez37 en Twitter.

La segunda observación tiene que ver con el peso de cada interacción. En Twitter podemos interactuar de tres maneras distintas: like, respuestas, y retuits. Las tres interacciones pueden funcionar de proxy de distintas tipologías de relaciones, pero sobre todo, con respecto a la teoría de Dunbar que justifica la representación en capas, se diferencian entre sí por la inversión de recursos que necesitan, indicando así diferentes intensidades en las relaciones. En chirpty, justamente, se les asignan pesos distintos, respectivamente 1, 1.1, 1.3. Como afirma el propio autor en su Blog, estos valores son completamente arbitrarios. Como arbitrario es su peso relativo, de hecho, se podría argumentar que una respuesta necesita de más esfuerzo que un retuit.

Un funcionamiento de la aplicación más riguroso y basado en evidencias empíricas hubiera sido, por ejemplo, determinar sobre bases estadísticas qué porcentajes de likes, respuestas y comentarios recibe en promedio una cuenta que está en el primer, segundo o tercer círculo y, fijados estos umbrales, rellenar los círculos de cada perfil analizado de acuerdo a estos. Hay que reconocer que, con el fin de programar el algoritmo de visualización, es mucho más sencillo tener un valor fijado de cuentas por cada círculo, de manera que no se tenga que calcular las posiciones cada vez. Aun así, unos valores más fieles a las regularidades estadísticas observadas darían resultados más fiables y por lo tanto más comparables entre sí.

En definitiva, chirpty nos parece una herramienta muy útil pero con bastantes limitaciones debido a algunas elecciones arbitrarias fijadas por diseño. Si estas limitaciones no son muy graves a la hora de analizar el resultado obtenido para un perfil dado, sí lo son si lo que queremos hacer son comparaciones entre perfiles distintos.

En Heurística llevamos bastante tiempo estudiando las redes de interacciones en Twitter y las diferencias en su organización interna entre varios tipos de perfiles. Aprovechando que el código de chirpty es abierto y disponible en GitHub, quizás nos animamos a implementar nuestra versión de la aplicación. Stay tuned ;)

--

--

Datapolitik.
Datapolitik.

Written by Datapolitik.

Datapolitik es un proyecto de Heuristica.barcelona en colaboración con Tecnopolitica.net Proyectos anteriores: Enredados 1-O (https://medium.com/@Enred10)

No responses yet