Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

Multimodal Speech Emotion Recognition using Audio and Text

16 visualizaciones

Publicado el

(SLT 2018) 2018 IEEE Spoken Language Technology Workshop
December 18-21, 2018
Location: Athens, Greece
http://www.slt2018.org/

  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Multimodal Speech Emotion Recognition using Audio and Text

  1. 1.      𝐡t ′ 𝑎 𝑡 𝑎 𝑡 𝐞 𝐡t ′  at = exp(𝐞⊺ 𝐡t ′ ) 𝑡 exp(𝐞⊺ 𝐡t ′) , 𝐙 = 𝑡 at 𝐡t ′ , 𝑦𝑖= softmax concat 𝐙, 𝐀 ⊺ 𝐌 + 𝐛   𝐡t = GRU (𝐡t−1, 𝐱t) 𝐀 = FullyConnected 𝐞 , 𝐓 = FullyConnected 𝐡last ′ 𝑦𝑖 = softmax concat 𝐀, 𝐓 ⊺ 𝐌 + 𝐛 ℒ = −log 𝑖=1 𝑁 𝑐=1 𝐶 𝑦𝑖,𝑐 log ( 𝑦𝑖,𝑐)  

×