V
iew topic
|
Edit
Attach
P
rintable
TopicList
r1 - 29 Dec 2011 - 15:29:33 -
AmparoVarona
You are here:
TWiki
>
Main Web
>
SEAKERproject
---+!! Detección e identificación de locutores en señales de audio de diversa procedencia: reuniones, programas de televisión y conversaciones telefónicas. * Financiado por el Gobierno Vasco- Programa SAIOTEK (S-PE11UN065) * Investigador principal [[Amparo Varona]] * Investigadores: Germán Bordel, Mikel Peñagarikano, Luis Javier Rodriguez, Amparo Varona, Silvia Nieto, Mireia Diez * Período: 1/ene./2011 - 31/dic./2012 ---++ Resumen El objetivo principal del proyecto es desarrollar sistemas que permitan segmentar en turnos de locutor señales de audio de diversa procedencia. Se trata, en última instancia, de añadir dicha información (marcas de tiempo y etiquetas de locutor) a la transcripción del habla, con objeto de permitir la recuperación de segmentos en los que habla un cierto locutor. Al igual que las huellas dactilares, el iris del ojo y otras propiedades biométricas, la voz es una característica específica de cada individuo. Una vez caracterizada mediante un conjunto adecuado de parámetros, es posible estimar modelos (patrones de referencia) y utilizar éstos para verificar la identidad de un individuo. El proyecto se enmarca, por tanto, en el campo general de la biometría y se aplicará en tres dominios: (1) reuniones, (2) programas de televisión (noticias, debates, etc.) y (3) conversaciones telefónicas. Cada uno de estos dominios plantea distintas dificultades y exigencias: las señales se producen en condiciones ambientales y de canal muy diferentes, también hay diferencias con respecto al número de locutores, la duración y secuencia de los turnos de locutor, el estilo y la espontaneidad de los locutores, etc. El proyecto abordará dos tareas diferentes, que compartirán algunas de las metodologías de modelado: (1) diarización de locutores y (2) verificación de locutores. ---++ Publicaciones Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "Improved Modeling of Cross-Decoder Phone Co-occurrences in SVM-based Phonotactic Language Recognition" IEEE TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING; in print, 2011 Varona, A., Nieto, S., Rodriguez-Fuentes, L.J., Penagarikano, M., Bordel, G., Diez, M., "A Spoken Document Retrieval System for TV Broadcast News in Spanish and Basque" XXVI Congreso de la Sociedad Española para el Procesamiento de Lenguaje Natural (SEPLN); Huelva, Spain, 5-7 September, 2011 Rodriguez-Fuentes, L.J., Varona, A., Penagarikano, M., Diez, M., Bordel, G., "Spoken language recognition in conversational telephone speech and TV broadcast news (GLOSA)" XXVI Congreso de la Sociedad Española para el Procesamiento de Lenguaje Natural (SEPLN); Huelva, Spain, 5-7 September, 2011 Rodriguez-Fuentes, L.J., Penagarikano, M., Varona, A., Díez, M., Bordel, G., "The Albayzin 2010 Language Recognition Evaluation" Interspeech 2011; Florence, Italy, 28-31 August, 2011 Bordel, G., Nieto, Silvia, Penagarikano, M., Rodriguez-Fuentes, L.J., Varona, A., "Automatic Subtitling of the Basque Parliament Plenary Sessions Videos" Interspeech 2011; Florence, Italy, 28-31 August, 2011 Varona, A., Penagarikano, M., Rodriguez-Fuentes, L.J., Bordel, G., "On the Use of Lattices of Time-Synchronous Cross-Decoder Phone Co-occurrences in a SVM-Phonotactic Language Recognition System" Interspeech 2011; Florence, Italy, 28-31 August, 2011 Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "Dimensionality Reduction for Using High-Order n-grams in SVM-Based Phonotactic Language Recognition" Interspeech 2011; Florence, Italy, 28-31 August, 2011 Diez, M., Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "On the use of Dot Scoring for Speaker Diarization" Iberian Conference on Pattern Recognition and Image Analysis (IbPRIA 2011); Las Palmas de Gran Canaria. Spain., 8-10 June, 2011 Penagarikano, M., Varona, A., Rodriguez-Fuentes, L.J., Bordel, G., "A Dynamic Approach to the Selection of High Order N-GRAMS in Phonotactic Language Recognition" 35th International Conference on Acoustics, Speech, and Signal Processing (ICASSP); Prague, Czech Republic, 22-27 May, 2011 -- Main.AmparoVarona - 29 Dec 2011
V
iew topic
|
Edit
|
Attach
|
P
rintable
|
V
iew topic
|
Backlinks:
We
b
,
A
l
l Webs
|
H
istory
:
r2
<
r1
|
More topic actions...
Main
Log In
or
Register
Main Web
Users
Groups
Index
Search
Changes
Notifications
Statistics
Preferences
Webs
Main
Sautrela
TWiki
Dansk
Deutsch
English
Español
Français
Italiano
Nederlands
Polski
Português
Svenska
简体中文
繁體中文
Copyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki?
Send feedback