r2 - 28 Dec 2012 - 12:41:19 - AmparoVaronaYou are here: TWiki >  Main Web  > SEAKERproject

Detección e identificación de locutores en señales de audio de diversa procedencia: reuniones, programas de televisión y conversaciones telefónicas.

  • Financiado por el Gobierno Vasco- Programa SAIOTEK (S-PE11UN065)
  • Investigador principal Amparo Varona
  • Investigadores: Germán Bordel, Mikel Peñagarikano, Luis Javier Rodriguez, Amparo Varona, Silvia Nieto, Mireia Diez
  • Período: 1/ene./2011 - 31/dic./2012

Resumen

El objetivo principal del proyecto es desarrollar sistemas que permitan segmentar en turnos de locutor señales de audio de diversa procedencia. Se trata, en última instancia, de añadir dicha información (marcas de tiempo y etiquetas de locutor) a la transcripción del habla, con objeto de permitir la recuperación de segmentos en los que habla un cierto locutor. Al igual que las huellas dactilares, el iris del ojo y otras propiedades biométricas, la voz es una característica específica de cada individuo. Una vez caracterizada mediante un conjunto adecuado de parámetros, es posible estimar modelos (patrones de referencia) y utilizar éstos para verificar la identidad de un individuo. El proyecto se enmarca, por tanto, en el campo general de la biometría y se aplicará en tres dominios: (1) reuniones, (2) programas de televisión (noticias, debates, etc.) y (3) conversaciones telefónicas. Cada uno de estos dominios plantea distintas dificultades y exigencias: las señales se producen en condiciones ambientales y de canal muy diferentes, también hay diferencias con respecto al número de locutores, la duración y secuencia de los turnos de locutor, el estilo y la espontaneidad de los locutores, etc. El proyecto abordará dos tareas diferentes, que compartirán algunas de las metodologías de modelado: (1) diarización de locutores y (2) verificación de locutores.

Publicaciones

Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "Improved Modeling of Cross-Decoder Phone Co-occurrences in SVM-based Phonotactic Language Recognition" IEEE TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING; in print, 2011

Varona, A., Nieto, S., Rodriguez-Fuentes, L.J., Penagarikano, M., Bordel, G., Diez, M., "A Spoken Document Retrieval System for TV Broadcast News in Spanish and Basque" XXVI Congreso de la Sociedad Española para el Procesamiento de Lenguaje Natural (SEPLN); Huelva, Spain, 5-7 September, 2011

Rodriguez-Fuentes, L.J., Varona, A., Penagarikano, M., Diez, M., Bordel, G., "Spoken language recognition in conversational telephone speech and TV broadcast news (GLOSA)" XXVI Congreso de la Sociedad Española para el Procesamiento de Lenguaje Natural (SEPLN); Huelva, Spain, 5-7 September, 2011

Rodriguez-Fuentes, L.J., Penagarikano, M., Varona, A., Díez, M., Bordel, G., "The Albayzin 2010 Language Recognition Evaluation" Interspeech 2011; Florence, Italy, 28-31 August, 2011

Bordel, G., Nieto, Silvia, Penagarikano, M., Rodriguez-Fuentes, L.J., Varona, A., "Automatic Subtitling of the Basque Parliament Plenary Sessions Videos" Interspeech 2011; Florence, Italy, 28-31 August, 2011

Varona, A., Penagarikano, M., Rodriguez-Fuentes, L.J., Bordel, G., "On the Use of Lattices of Time-Synchronous Cross-Decoder Phone Co-occurrences in a SVM-Phonotactic Language Recognition System" Interspeech 2011; Florence, Italy, 28-31 August, 2011

Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "Dimensionality Reduction for Using High-Order n-grams in SVM-Based Phonotactic Language Recognition" Interspeech 2011; Florence, Italy, 28-31 August, 2011

Diez, M., Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "On the use of Dot Scoring for Speaker Diarization" Iberian Conference on Pattern Recognition and Image Analysis (IbPRIA? 2011); Las Palmas de Gran Canaria. Spain., 8-10 June, 2011

Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "A Dynamic Approach to the Selection of High Order N-GRAMS in Phonotactic Language Recognition" 35th International Conference on Acoustics, Speech, and Signal Processing (ICASSP); Prague, Czech Republic, 22-27 May, 2011

-- AmparoVarona - 29 Dec 2011

Edit | Attach | Printable | Raw View | Backlinks: Web, All Webs | History: r2 < r1 | More topic actions
 
Grupo de Trabajo en Tecnologías Software
This site is powered by the TWiki collaboration platformCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback