ASLP-MULAN: audio speech and language processing for multimedia analytics

Torres Barañano, María Inés; Justo Blanco, Raquel; Ferreiros López, Javier; Pardo Muñoz, José Manuel; Ortega Giménez, Alfonso; Lleida Solano, Eduardo; Hurtado Oliver, Lluís Felip; Segarra Soriano, Encarnación

ASLP-MULANaudio speech and language processing for multimedia analytics

Torres Barañano, María Inés
Justo Blanco, Raquel
Ferreiros López, Javier
Pardo Muñoz, José Manuel
Ortega Giménez, Alfonso
Lleida Solano, Eduardo
Hurtado Oliver, Lluís Felip
Segarra Soriano, Encarnación

Revista:

Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2016

Número: 57

Páginas: 147-150

Tipo: Artículo

DIALNET GOOGLE SCHOLAR RUA editor

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Nuestra intención es generar la mezcla ideal de tecnologías del audio, el habla y el lenguaje con las de big data. Algunas tecnologías automáticas del procesado de audio, habla y lenguaje están adquiriendo suficiente grado de madurez para ser capaces de ayudar a este objetivo: transcripción automática del habla, métodos de búsqueda por habla, recuperación de documentos hablados, procesado del lenguaje natural, transcripción y descripción de contenidos multimedia no estructurados, resumen de ficheros multimedia, detección de emoción en el habla y análisis de sentimientos, comprensión de texto y habla, etc. Parece que merece la pena unirlos y ponerlos a trabajar sobre secuencias de datos obtenidos automáticamente procedentes de diversas fuentes de información como YouTube, Facebook, Twitter, periódicos digitales, buscadores de internet, etc. para generar informes que incluyan tanto puntuaciones basadas en análisis cuantitativo como expresiones resumidas subjetivas pero significativas sobre el análisis de tendencias y la satisfacción percibida sobre un producto, una empresa u otra entidad.

Referencias bibliográficas

García F., L. Hurtado, E. Segarra, E. Sanchis, and G. Riccardi, “Combining multiple translation systems for Spoken Language Understanding portability,” in Proc. of IEEE Workshop on Spoken Language Technology (SLT 2012), 2012, pp. 282–289.
Hurtado L.F., J. Planells, E. Segarra, E. Sanchis, D. Griol (2010): “A stochastic finite-state management”. Proc. of Interspeech, pp. 3002-3005
Justo R., T. Corcoran, S. M. Lukin, M. Walker: “Extracting relevant knowledge for the detection of sarcasm and nastiness in the social web”. Knowledege-Based Systems. 2014
Justo R., M. I. Torres “Integration of complex language models in ASR and LU systems”. Pattern Anal. Appl. 18(3): 493-505, 2015 Martinez F.F., J. Ferreiros, R. Cordoba, J.M. Montero, R. San-Segundo and J.M. Pardo ” A bayesian networks approach for dialog modeling: The fusion bn”. Proceedings of ICASSP 2009, pp. 4789-4792
Miguel A., J. Villalba, A. Ortega, E. Lleida, C. Vaquero "Factor Analysis with Sampling Methods for Text Dependent Speaker Recognition". INTERSPEECH 2014
Pla, F., L.F. Hurtado. “Political tendency identifcation in twitter using sentiment analysis techniques”. Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: Dublin, Ireland, August. Dublin City University and Association for Computational Linguistics
Planells J., L.F. Hurtado, E. Sanchis and E. Segarra (2012): “An online generated transducer to increase dialog manager coverage”. Proc. of Interspeech, pp. 1-4
Vaquero C., A. Ortega, A. Miguel, J. Villalba, E. Lleida “Confidence Measures for Speaker Segmentation and their Relation to Speaker Verification”. Interspeech, Makuhari, Japan. 2010

Fuente de los datos: Dialnet