ASLP-MULANaudio speech and language processing for multimedia analytics

  1. Torres Barañano, María Inés
  2. Justo Blanco, Raquel
  3. Ferreiros López, Javier
  4. Pardo Muñoz, José Manuel
  5. Ortega Giménez, Alfonso
  6. Lleida Solano, Eduardo
  7. Hurtado Oliver, Lluís Felip
  8. Segarra Soriano, Encarnación
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2016

Número: 57

Páginas: 147-150

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Nuestra intención es generar la mezcla ideal de tecnologías del audio, el habla y el lenguaje con las de big data. Algunas tecnologías automáticas del procesado de audio, habla y lenguaje están adquiriendo suficiente grado de madurez para ser capaces de ayudar a este objetivo: transcripción automática del habla, métodos de búsqueda por habla, recuperación de documentos hablados, procesado del lenguaje natural, transcripción y descripción de contenidos multimedia no estructurados, resumen de ficheros multimedia, detección de emoción en el habla y análisis de sentimientos, comprensión de texto y habla, etc. Parece que merece la pena unirlos y ponerlos a trabajar sobre secuencias de datos obtenidos automáticamente procedentes de diversas fuentes de información como YouTube, Facebook, Twitter, periódicos digitales, buscadores de internet, etc. para generar informes que incluyan tanto puntuaciones basadas en análisis cuantitativo como expresiones resumidas subjetivas pero significativas sobre el análisis de tendencias y la satisfacción percibida sobre un producto, una empresa u otra entidad.

Referencias bibliográficas

  • García F., L. Hurtado, E. Segarra, E. Sanchis, and G. Riccardi, “Combining multiple translation systems for Spoken Language Understanding portability,” in Proc. of IEEE Workshop on Spoken Language Technology (SLT 2012), 2012, pp. 282–289.
  • Hurtado L.F., J. Planells, E. Segarra, E. Sanchis, D. Griol (2010): “A stochastic finite-state management”. Proc. of Interspeech, pp. 3002-3005
  • Justo R., T. Corcoran, S. M. Lukin, M. Walker: “Extracting relevant knowledge for the detection of sarcasm and nastiness in the social web”. Knowledege-Based Systems. 2014
  • Justo R., M. I. Torres “Integration of complex language models in ASR and LU systems”. Pattern Anal. Appl. 18(3): 493-505, 2015 Martinez F.F., J. Ferreiros, R. Cordoba, J.M. Montero, R. San-Segundo and J.M. Pardo ” A bayesian networks approach for dialog modeling: The fusion bn”. Proceedings of ICASSP 2009, pp. 4789-4792
  • Miguel A., J. Villalba, A. Ortega, E. Lleida, C. Vaquero "Factor Analysis with Sampling Methods for Text Dependent Speaker Recognition". INTERSPEECH 2014
  • Pla, F., L.F. Hurtado. “Political tendency identifcation in twitter using sentiment analysis techniques”. Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: Dublin, Ireland, August. Dublin City University and Association for Computational Linguistics
  • Planells J., L.F. Hurtado, E. Sanchis and E. Segarra (2012): “An online generated transducer to increase dialog manager coverage”. Proc. of Interspeech, pp. 1-4
  • Vaquero C., A. Ortega, A. Miguel, J. Villalba, E. Lleida “Confidence Measures for Speaker Segmentation and their Relation to Speaker Verification”. Interspeech, Makuhari, Japan. 2010