SlideShare una empresa de Scribd logo
Spike Challenge
Diseño e implementación de un clasificador
de tipo de música
Sebastián Camberos
Febrero 2018
Descripción Spike Challenge
• Objetivo: clasificar 2 tipos de
música a partir de descriptores
varios
• Libre elección de algoritmo de
clasificación
• Origen datos: API de Spotify
• Muestra (sin procesar)
- Entrenamiento, música tipo
reggaeton, 70 registros x 15 campos
- Entrenamiento, otros tipos de música,
2.230 registros x 16 campos
- Validación, 50 registros x 16 campos
Pregunta 1 Análisis Datasets
• Criterios selección variables
- Descripción variable Spotify vs
elementos de composición y estilo
musical (1)
- Corroboración diferencias estilo
musical con distribuciones (promedio,
desviación estándar y kurtosis)
- Eliminación descriptores que no
alteran estructura musical
- Eliminación variables estacionales
- Eliminación redundancias según
correlación o composición musical
Variable Composición Estilo Estructura Estacional Redundancia
acousticness X
danceability X
duration X
energy X
id_new X
instrumentalness X
key X
liveness X
loudness X
mode X
popularity X
speechiness X
tempo X
valence X
(1) Fuente descripción: https://beta.developer.spotify.com/documentation/web-api/reference/tracks/get-audio-features/
Pregunta 1 Histogramas
Música tipo reggaeton Otros tipos de música
Posibles outliers
Muestra: data_reggaeton.csv. Muestra: data_todotipo.csv, excluye registros vacíos.
Pregunta 1 Correlaciones
Muestra: data_train.csv, consolidado de reggaeton y todotipo, excluye registros vacíos.
• Preprocesamiento datos
- Filtrado de registros vacíos, 8 en total
- Normalización cantidad de campos
- Marcas identificación tipo de música:
“reggaeton” y “otros”
- Transformación int a float
- Consolidación muestra reggaeton y
otros tipos de música, 2.292 registros
x 15 campos
• Preentrenamiento modelo
- Extracción media y normalización
- Hot-encode: “reggaeton”, 01; “otros”,
10
Pregunta 2 Consolidación Datasets
Pregunta 3 Modelo
• Descripción modelo
- Basado en clasificador de dígitos
(LeCun, 1998) y autoencoder (Hinton,
2006)
- Red neuronal fully connected
- 4 hidden layers con pesos 1024 - 512
- 256 - 2
- Función activación ReLU
- Salida softmax interpretada como
probabilidad
- Código en Python y TensorFlow
• Calibración hiper parámetros
- Pesos iniciales aleatorios
- Optimizador Adam
- Entrenamiento por batches
Pregunta 4 Performance Modelo
• Observar durante entrenamiento
- Función de pérdida (cross entropy)
- Performance (accuracy)
- Inspección separación tipos de
música
• Performance
- Pruebas iniciales con 4 modelos
(búsqueda parsimonia)
- Inspección visual da cuenta de
separación de tipos de música en
logits y softmax
Modelo 1 Modelo 2 Modelo 3 Modelo 4
Variable acousticness X
danceability X X X X
duration
energy X X X X
id_new
instrumentalness X X X X
key X X X X
liveness
loudness
mode
popularity
speechiness X X X
tempo X X
valence X X X X
Predictores 8 7 6 5
Accuracy epochs 128 128 128 128
data_train 0.9978 0.9948 0.9930 0.9747
data_reggaeton 0.9286 0.8429 0.7857 0.1714
Pregunta 4 Performance modelo
Modelo 1
Modelo 2
Modelo 3
Modelo 4
Accuracy de experimento inicial
@128 epochs
Pregunta 4 Performance modelo
Separación de datos Modelo 1
@128 epochs
Separación de datos Modelo 4
@128 epochs
Salida red neuronal
Layer 4 (logits)
Salida red neuronal
Softmax (clasificador)
Histograma clasificador
(solo reggaeton)
Salida red neuronal
Layer 4 (logits)
Salida red neuronal
Softmax (clasificador)
Histograma clasificador
(solo reggaeton)
Corte sugerido
Pregunta 4 Performance modelo
• Existen mejoras de optimización y
de reducción de consumo de
energía
• Incrementar performance
- Uso de factores y variables puras
- Aumentar epochs evitando overfitting
• Reducir tiempo de entrenamiento
- Explorar curriculum learning (Bengio,
2009)
• Reducir tiempo de procesamiento
en producción
- Implementar pruning
- Reducir descriptores
- Reducir pesos por unidad neuronal
- Reducir layers
Salida red neuronal
Layer 4 (logits)
Salida red neuronal
Softmax (clasificador)
Histograma clasificador
(solo reggaeton)
Separación de datos Modelo 1
@384 epochs
• Performance validación
- Ocurre separación de datos
- Probabilidad de tipo de música
señalada por magnitudes de softmax
- 4 canciones clasificadas como
reggaeton
• Elementos para correcta
identificación de tipo de música
- Arquitectura modelo para descubrir
estructura subyacente y lograr amplia
separación de datos
- Predictores elegidos
- Nivel de corte obtenido durante
entrenamiento
Pregunta 5 Validación Modelo
Inferencia Modelo 1
@384 epochs, 80% nivel de corte
Salida red neuronal
Layer 4 (logits)
Salida red neuronal
Softmax (clasificador)
Histograma clasificador
(solo reggaeton)

Más contenido relacionado

Último

3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
nahumrondanurbano
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
MedTechBiz
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
NereaMolina10
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
DivergenteDespierto
 
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdfSemana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
WendyMLaura
 
Estadísticas y Situación Dengue Iquitos 2022
Estadísticas y Situación Dengue Iquitos 2022Estadísticas y Situación Dengue Iquitos 2022
Estadísticas y Situación Dengue Iquitos 2022
bufalo421
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
DieguinhoSalazar
 
Que es una independización de inmueble o predio
Que es una independización de inmueble o predioQue es una independización de inmueble o predio
Que es una independización de inmueble o predio
laguilart
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
MelanieYuksselleCarr
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
mvargasleveau
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
defola5717
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
IrapuatoCmovamos
 
TEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptx
TEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptxTEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptx
TEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptx
kdorianmen210
 

Último (20)

3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
 
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdfSemana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
 
Estadísticas y Situación Dengue Iquitos 2022
Estadísticas y Situación Dengue Iquitos 2022Estadísticas y Situación Dengue Iquitos 2022
Estadísticas y Situación Dengue Iquitos 2022
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
 
Que es una independización de inmueble o predio
Que es una independización de inmueble o predioQue es una independización de inmueble o predio
Que es una independización de inmueble o predio
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
 
TEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptx
TEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptxTEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptx
TEMA 10_PROBABILIDADES_UCSM-Semana 12-FASE III.pptx
 

Destacado

Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
Erica Santiago
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
 

Destacado (20)

Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 

Spike Challenge

  • 1. Spike Challenge Diseño e implementación de un clasificador de tipo de música Sebastián Camberos Febrero 2018
  • 2. Descripción Spike Challenge • Objetivo: clasificar 2 tipos de música a partir de descriptores varios • Libre elección de algoritmo de clasificación • Origen datos: API de Spotify • Muestra (sin procesar) - Entrenamiento, música tipo reggaeton, 70 registros x 15 campos - Entrenamiento, otros tipos de música, 2.230 registros x 16 campos - Validación, 50 registros x 16 campos
  • 3. Pregunta 1 Análisis Datasets • Criterios selección variables - Descripción variable Spotify vs elementos de composición y estilo musical (1) - Corroboración diferencias estilo musical con distribuciones (promedio, desviación estándar y kurtosis) - Eliminación descriptores que no alteran estructura musical - Eliminación variables estacionales - Eliminación redundancias según correlación o composición musical Variable Composición Estilo Estructura Estacional Redundancia acousticness X danceability X duration X energy X id_new X instrumentalness X key X liveness X loudness X mode X popularity X speechiness X tempo X valence X (1) Fuente descripción: https://beta.developer.spotify.com/documentation/web-api/reference/tracks/get-audio-features/
  • 4. Pregunta 1 Histogramas Música tipo reggaeton Otros tipos de música Posibles outliers Muestra: data_reggaeton.csv. Muestra: data_todotipo.csv, excluye registros vacíos.
  • 5. Pregunta 1 Correlaciones Muestra: data_train.csv, consolidado de reggaeton y todotipo, excluye registros vacíos.
  • 6. • Preprocesamiento datos - Filtrado de registros vacíos, 8 en total - Normalización cantidad de campos - Marcas identificación tipo de música: “reggaeton” y “otros” - Transformación int a float - Consolidación muestra reggaeton y otros tipos de música, 2.292 registros x 15 campos • Preentrenamiento modelo - Extracción media y normalización - Hot-encode: “reggaeton”, 01; “otros”, 10 Pregunta 2 Consolidación Datasets
  • 7. Pregunta 3 Modelo • Descripción modelo - Basado en clasificador de dígitos (LeCun, 1998) y autoencoder (Hinton, 2006) - Red neuronal fully connected - 4 hidden layers con pesos 1024 - 512 - 256 - 2 - Función activación ReLU - Salida softmax interpretada como probabilidad - Código en Python y TensorFlow • Calibración hiper parámetros - Pesos iniciales aleatorios - Optimizador Adam - Entrenamiento por batches
  • 8. Pregunta 4 Performance Modelo • Observar durante entrenamiento - Función de pérdida (cross entropy) - Performance (accuracy) - Inspección separación tipos de música • Performance - Pruebas iniciales con 4 modelos (búsqueda parsimonia) - Inspección visual da cuenta de separación de tipos de música en logits y softmax Modelo 1 Modelo 2 Modelo 3 Modelo 4 Variable acousticness X danceability X X X X duration energy X X X X id_new instrumentalness X X X X key X X X X liveness loudness mode popularity speechiness X X X tempo X X valence X X X X Predictores 8 7 6 5 Accuracy epochs 128 128 128 128 data_train 0.9978 0.9948 0.9930 0.9747 data_reggaeton 0.9286 0.8429 0.7857 0.1714
  • 9. Pregunta 4 Performance modelo Modelo 1 Modelo 2 Modelo 3 Modelo 4 Accuracy de experimento inicial @128 epochs
  • 10. Pregunta 4 Performance modelo Separación de datos Modelo 1 @128 epochs Separación de datos Modelo 4 @128 epochs Salida red neuronal Layer 4 (logits) Salida red neuronal Softmax (clasificador) Histograma clasificador (solo reggaeton) Salida red neuronal Layer 4 (logits) Salida red neuronal Softmax (clasificador) Histograma clasificador (solo reggaeton) Corte sugerido
  • 11. Pregunta 4 Performance modelo • Existen mejoras de optimización y de reducción de consumo de energía • Incrementar performance - Uso de factores y variables puras - Aumentar epochs evitando overfitting • Reducir tiempo de entrenamiento - Explorar curriculum learning (Bengio, 2009) • Reducir tiempo de procesamiento en producción - Implementar pruning - Reducir descriptores - Reducir pesos por unidad neuronal - Reducir layers Salida red neuronal Layer 4 (logits) Salida red neuronal Softmax (clasificador) Histograma clasificador (solo reggaeton) Separación de datos Modelo 1 @384 epochs
  • 12. • Performance validación - Ocurre separación de datos - Probabilidad de tipo de música señalada por magnitudes de softmax - 4 canciones clasificadas como reggaeton • Elementos para correcta identificación de tipo de música - Arquitectura modelo para descubrir estructura subyacente y lograr amplia separación de datos - Predictores elegidos - Nivel de corte obtenido durante entrenamiento Pregunta 5 Validación Modelo Inferencia Modelo 1 @384 epochs, 80% nivel de corte Salida red neuronal Layer 4 (logits) Salida red neuronal Softmax (clasificador) Histograma clasificador (solo reggaeton)