Big Jazz Data

CBA JAZZ | 2018

Big Jazz Data

El presente trabajo propone visualizar la relación de músicos que han visitado el Festival de Jazz de la Provincia de Córdoba con grandes artistas del Jazz Moderno, y de este modo, generar una instancia visual que permita al público identificar la importancia de los músicos que han sido parte del evento. A partir de allí, en conjunto con la organización del CBA Jazz, se empezó a trabajar sobre la posibilidad de aplicarlo a los músicos internacionales de la décima edición.

En lo formal, lo que se puede apreciar es el resultado de una labor de carácter extensionista universitario que se origina a partir de un trabajo final integrador de la Licenciatura en Ciencias de la Computación (carrera de grado de la FAMAF-UNC) realizado por Illak Zapata bajo la dirección del Dr. Damián Barsotti y el Lic. Mariano Barsotti. Del gran cúmulo de grabaciones y colaboraciones que tienen los músicos visitantes de trascendencia internacional, utilizando metodologías y herramientas de análisis de Big Data (Apache Spark), se fue recortando un camino de interacciones que permite visualizar la cercanía que tienen con esa especie de panteón de dioses del olimpo del jazz: Miles Davis, John Coltrane, Charles Mingus, Ornette Coleman, y ya más cerca en el tiempo, John Zorn y Wynton Marsalis, entre otros.

Específicamente, el trabajo consistió de dos etapas consecutivas. En primer lugar una búsqueda de datos y relaciones entre músicos  a partir de datos accesibles por Internet para su representación digital en la forma de una “gran red”. Y en segundo término, la selección de la información a visualizar según su importancia y teniendo en cuenta los músicos invitados a las distintas ediciones del festival.

Para la primera etapa se extrajo información disponible en Internet desde distintas fuentes y sitios especializados (Discogs, MusiBrainz, WikiData) relacionados a músicos y sus trabajos discográficos. Al ser esta información originada de distintas fuentes hizo falta homogeneizarla para tratarla de forma unificada. Con esta información se construyó, de manera automática, una representación digital de las relaciones entre músicos a partir de trabajos discográficos en común (dos músicos están relacionados si tocaron en un mismo disco) junto con información propia de cada uno (datos personales, redes sociales, sitios en internet, etc.) en la forma de una, como mencionábamos, “gran red”. Actualmente (la red se irá construyendo año a año para cada edición del festival) consta de más de 1 millón de artistas, más de 3 millones de discos y 19 millones de pares de músicos relacionados.

En una segunda etapa, sobre esta “gran red” se corrieron algoritmos distribuidos para detectar las relaciones (discos) particulares que unen los artistas invitados al festival con las grandes figuras del jazz. De esta forma nos quedamos sólo con una parte de la “gran red”: los artistas y las relaciones (discos) que unen los invitados con las grandes figuras.

Sin embargo, esta información era aún demasiado abundante para poder ser visualizada de forma gráfica. Por esta razón se seleccionó la información más relevante utilizando técnicas de detección de influencers y medidas de centralidad adaptadas a las relaciones representadas en la “gran red”.

En fin, todo un trabajo de programación, cuyo producto final es una visualización web interactiva que permite apreciar la jerarquía de la grilla del CBA Jazz 2018 acercando las figuras internacionales del Festival de Jazz al público del evento.

Artistas CBAJAZZ 2018 / BIG DATA