C OMPUTACIÓN A VANZADA PARA M ÚSICA POR O RDENADOR EXPLORING MOOD METADATA: RELATIONSHIPS WINT GENRE, ARTISTS AND USAGE METADATA 1.

1 C OMPUTACIÓN A VANZADA PARA M ÚSICA POR O RDENADOR EXPL...
Author: Soledad Rivas San Segundo
0 downloads 0 Views

1 C OMPUTACIÓN A VANZADA PARA M ÚSICA POR O RDENADOR EXPLORING MOOD METADATA: RELATIONSHIPS WINT GENRE, ARTISTS AND USAGE METADATA 1

2 1. Introducción El componente emocional está asociado a la expresividad musical. Muchos estudios identifican moods como criterios para organizar y música. ¿Qué es un mood? Los moods ayudan a clasificar un: un artista un álbum una canción Fuentes de información: allmusicguide.com (AMG) epinions.com last.fm En este articulo se estudia la relación entre: mood-genero mood-artista mood-uso EXPLORING MOOD METADATACAMO 2 Un mood es una palabra o frase que nos ayuda a clasificar la música

3 2. Etiquetas de moods en AMG AMG intenta ser la referencia musical más comprensible del mundo Existen 179 etiquetas mood, definidas como adjetivos, que describen el sonido o el sentimiento de un álbum o una canción. Algunos moods tienen asociados más de 100 álbumes o canciones y otros en cambio apenas tienen 3. Para evitar la falta densidad de algunos moods se proponen 3 conjuntos de datos con los que realizar los experimentos: Dejarlo como esta, con 179 moods se obtienen 7134 pares mood-álbumes y 8288 pares mood-canción. Quedarnos solo con moods que tienen asociados más de 50 álbumes o canciones, se obtienen 2748 pares mood-álbum y 3260 pares mood-canción. Ya que bastantes álbumes y canciones aparecen en varios moods, realizamos clusters de moods, de forma que luego obtendremos pares cluster-canción o cluster-álbum EXPLORING MOOD METADATACAMO 3

4 Como construir Mood clustering Se cogen los 40 moods más populares de las canciones y se genera una matriz 40x40, en la que indicamos en cada celda el numero de canciones que están relacionadas con ambos moods (lo mismo para los álbumes). Ward’s criterion [1], un procedimiento aglomerativo y jerárquico. Se obtienen 2 conjuntos, album-mood y cancion-mood, de los que se extraen los 29 moods más significativos, agrupados en 5 clusters. [1] Berkin, P. Survey of Clustering Data Mining Techniques, Accrue Software, 2002. Resaltar que cada cluster tiene un alto nivel de sinonimia, mientras que entre clusters el nivel de sinonimia es menor. CLUSTER 1 CLUSTER 2 CLUSTER 3 CLUSTER 4 CLUSTER 5 Rowdy Amiable / Good natured LiterateWittyVolatile RousingWistfulHumorousFiery ConfidentSweetBittersweetWhimsicalVisceral BoisterousFunAutumnalWryAggressive PassionateRollickingBroodingCampyTense/anxious CheerfulPoignantQuirkyIntense Silly EXPLORING MOOD METADATACAMO 4

5 3. Muestras y médoto de testeo En los siguientes apartados se va a proceder a analizar la relación entre: Mood y genero Mood y artista Mood y usabilidad Nos vamos a centrar en los datos obtenidos a partir de los álbumes, ya que es la unidad de análisis en epinions.com El análisis se ha realizado con Fisher’s Exact Test [2] (FET), este método permite examinar la asociación/dependencia de 2 variables, en nuestro caso los pares: Mood-genero Mood-artista Mood-usabilidad EXPLORING MOOD METADATACAMO 5 [2] Buntinas, M. and Funk, G.M. Statistics for the Sciences, Brooks/Cole/Duxbuty, 2005. Para cada uno de estas relaciones se realizaran 3 experimentos: Todos los moods Moods mas comunes Clusters

6 4. Moods y géneros (todos los moods) De los 7134 pares, 4564 están alrededor del mood “rock”, así que vamos a hacer 2 subconjuntos de datos uno con el mood “rock” y otro sin él El analisis FET en el subconjunto “rock”, nos devuelve 262 pares con una significancia p

7 4. Moods y géneros (moods comunes y géneros) Existen 2748 pares, la mayoría alrededor del mood “rock”, nuevamente hacemos 2 subconjuntos de datos uno con el mood “rock” y otro sin él El análisis FET en el subconjunto “rock”, nos devuelve 70 pares con una significancia p

8 4. Moods y géneros (moods clusters y géneros) De los 1991 pares cubriendo 20 géneros, nuevamente hacemos 2 subconjuntos de datos uno con el mood “rock” y otro sin él El análisis FET en el subconjunto “rock”, nos devuelve 20 pares con una significancia p

9 5. Moods y artistas (todos los moods) Se limita el análisis a artistas que tienen como mínimo 10 pares artista-mood, con lo que tenemos 142 artistas y 175 moods, para obtener 2241 pares. El analisis FET de los datos nos devuelve 623 pares con una significancia p

10 5. Moods y artistas (moods comunes) De los 1142 artistas que hay que hay en nuestro conjunto de datos, solo 29 de ellos aparecen como mínimo en 9 pares, con lo que contamos con 372 pares mood-artsista para nuestro estudio. El analisis FET de los datos nos devuelve 68 pares con una significancia p

11 5. Moods y artistas (moods clusters y artistas) Contiene álbumes de 920 artistas, solo se escogen los que tienen 8 ó más pares, con lo que obtenemos 248 pares para realizar el estudio Conclusiones: Los resultados obtenidos son bastante razonables. Los Beatles y los Beach Boys en el cluster 2. Los artistas situados en el cluster 5, son conocidos por la dificultad de catalogar su estilo. Una vez realizado el análisis FET obtenemos 17 pares con p

12 6. Moods y usos Al realizar la intersección se obtienen 149 álbumes en ambos conjuntos y 1440 pares en 140 moods. Al realizar el análisis FET se obtienen 64 pares significativos con p

13 6. Moods y usos (moods comunes) Al realizar la intersección se obtienen 84 álbumes en ambos conjuntos y 527 pares. El realizar el análisis FET se obtienen 16 pares con 7 usos identificados como significativos p

14 6. Moods y usos (clusters moods y uso) Al realizar la intersección se obtienen 66 álbumes en ambos conjuntos y 358 pares. El realizar el análisis FET se obtienen 6 usos con una relación significativa p

15 7. Corroboración de los datos Para corroborar los datos obtenidos, se repiten los experimentos anteriores usando last.fm. Last.fm es una colección de música que relaciona álbumes con genero, artistas y uso. 7. Corroboración de mood y género Obtenemos de last.fm 3 conjuntos de datos similares a los obtenidos en AMG, todos, comunes y clusters. EXPLORING MOOD METADATACAMO 15 Una vez aplicado el FET a los datos obtenemos que: 21 de los 28 pares obtenidos en AMG para todos y comunes son también significativos en al menos una muestra de last.fm con p

16 7. Corroboración de mood y artistas Obtenemos de last.fm 3 conjuntos de datos similares a los obtenidos en AMG, todos, comunes y clusters. 7. Corroboración de mood y uso Obtenemos de last.fm 3 conjuntos de datos basados en top albumes, tracks y artistas con al menos un uso, para todos, comunes y clusters. EXPLORING MOOD METADATACAMO 16 Una vez aplicado el FET a los datos se obtiene: 17 de 22 pares corroboran los datos de los conjuntos todos y comunes (p

17 8. Recomendaciones La relación entre uso-mood no es suficientemente estable para garantizar futuras consideraciones. Las relaciones entre artista-mood y género-mood muestran un gran compromiso Esto se ve corroborado en el uso de last.fm. El vocabulario mood es un impedimento para la construcción de un conjunto de uso. En este estudio se ha visto que muchos moods individuales son sinonimos, asi que Reduciendo el tamaños del vocabulario mood se mejora el entendimiento de los moods descritos. EXPLORING MOOD METADATACAMO 17 Se recomienda a los miembros del MIREX que construya un AMC (artist mood clasification) basado en un conjunto mood-space cluster, en lugar de mood individuales. Un escenario automático debe construir el ground-thruth para localizar géneros y artistas en el cluster apropiado. Los conjuntos de entrenamiento deberían construirse bajo la supervisión humana.