r1 - 25 Mar 2014 - 14:57:05 - AmparoVaronaYou are here: TWiki >  Main Web  > PASAHOTSproject

Verificación de identidades mediante la huella vocal en aplicaciones de alta seguridad.

  • Financiado por el Gobierno Vasco- Programa SAIOTEK (S-PE13UN105)
  • Investigador principal Amparo Varona
  • Investigadores: Germán Bordel, Mikel Peñagarikano, Luis Javier Rodriguez, Amparo Varona, Mireia Diez
  • Período: 1/ene./2013 - 31/dic./2013

Resumen

El objetivo principal del proyecto PASAHOTS es el estudio y desarrollo de sistemas de verificación de identidades mediante la huella vocal en entornos en los que un acceso no autorizado es inaceptable. En los sistemas desarrollados para accesos de alta seguridad, la especificidad de la huella vocal se incrementa al pronunciar determinados textos o contraseñas (“Text-Dependent Speaker Verification”). Por contra, en los sistema desarrollados en el ámbito forense no se conoce a priori el texto pronunciado por los individuos bajo estudio, ya que las pruebas que se manejan han sido encontradas y no fabricadas (“Text-Independent Speaker Verification”). Durante el desarrollo del proyecto, se han desarrollado y se continuan optimizando metodologías de Verificación de Locutor Dependiente de Texto (VLDT) continuando con el trabajo realizado en nuestro grupo durante los últimos años en la Verificación del Locutor Independiente del Texto (VLIT). Como criterio general en el desarrollo del proyecto, siempre que ha sido posible, se ha tratado de usar bases de datos públicas y software de acceso libre, de modo que los resultados sean más fácilmente reproducibles y verificables. El proyecto ha implicado el desarrollo de dos sistemas competitivos basados en la aproximación i-vectors+PLDA usando como características los tradicionales MFCC y la propuesta basada en “log-likelihood ratios of phone posterior probabilities” (PLLR). Ambos sistemas se fusionan muy bien, como se puede observar en las publicaciones previamente mencionadas. Cabe destacar de manera especial el desarrollo de un sistema competitivo de verificación del locutor en condiciones muy ruidosas, con el que se ha participado en la “2013 Speaker Recognition Evaluation in Mobile Environments”.

Publicaciones

durante 2013 se han realizado las siguientes publicaciones directamente relacionas con la detección e identificación del locutor: M. Diez, A. Varona, M. Peñagarikano, L.J. Rodriguez, G. Bordel. “On the Complementary of Phone Posterior Probabilities for Improved Speaker Recognition”. IEEE Signal Processing Letters. DOI: 10.1109/LSP.2014.2312213. En prensa.

M. Diez, A. Varona, M. Peñagarikano, L.J. Rodriguez, G. Bordel. “Using Phone Log-Likelihood Ratios as Features for Speaker Recognition”. 14th Annual Conference of the International Speech Communication Association (Interspeech 2013). Proceedings of Interspeech 2013 (CORE A). Lyon, France. 25-29 de agosto de 2013.

J. Villalba, M. Diez, A. Varona, E. Lleida. “Handling Recordings Acquired Simultaneously over Multiple Channels with PLDA”. 14th Annual Conference of the International Speech Communication Association (Interspeech 2013). Proceedings of Interspeech 2013 (CORE A). Lyon, France. 25-29 de agosto de 2013.

E. Khoury, B. Vesnicer, J. Franco-Pedroso, R. Violato, Z. Boulkenafet, L.M. Mazaira Fernandez, M. Diez, J. Kosmala, H. Khemiri, T. Cipr, R. Saeidi,M. Gunther, J. Zganec-Gros, R. Zazo Candil, F. Simoes, M. Bengherabi, A. Alvarez Marquina, M. Penagarikano, A. Abad, M. Boulayemen, P. Schwarz, D. Van Leeuwen, J. Gonzalez-Domínguez, M. Uliani Neto, E. Boutellaa, P. Gomez Vilda, A. Varona, D. Petrovska-Delacretaz, P. Matejka, J. Gonzalez-Rodríguez, T. Pereira, F. Harizi, Luis J. Rodriguez-Fuentes, L. El Shafey, M. Angeloni, G. Bordel, G. Chollet, S. Marcel. “The 2013 Speaker Recognition Evaluation in Mobile Environment”. The 6th IAPR International Conference on Biometrics (ICB-2013). Madrid, Spain. 4-7 Junio, 2013.

Otras publicaciones del grupo durante este periodo están relacionadas con: 1) la identificación y verificación de la lengua (muy relacionada con la identificación y verificación del locutor, ya que comparte muchas de las metodologías de compensación, de modelado, de fusión de sistemas, etc.); 2) la búsqueda de segmentos de audio dentro de audio; (3) el subtitulado automático de vídeos como resultado de un contrato para subtitular las sesiones plenarias del Parlamento Vasco partiendo de las actas (transcripcioens manuales) de dichas sesiones.

L.J. Rodriguez-Fuentes, A. Varona, M. Penagarikano, G. Bordel, M. Diez. “GTTS sytems for the SWS Task at MediaElval2013?”. MediaEval? 2013, Multimedia Benchmark Workshop. Barcelona. 18-19 de octubre de 2013.

M. Diez, A. Varona, M. Penagarikano, L.J. Rodriguez-Fuentes, G. Bordel. “Language Recognition on Albayzin 2010 LRE using PLLR features”. Revista de Procesamiento del Lenguaje Natural, Sociedad Española de Procesamiento del Lenguaje Natural, Septiembre 2013.

G. Bordel, M. Peñagarikano, L.J. Rodríguez-Fuentes, A. Varona. “OBAM-PV: una aplicación para el subtitulado de videos de Sesiones Plenarias del Parlamento Vasco”. XXIX Congreso de la Sociedad Española del Procesamiento del Lenguaje Natural. Madrid, 18-20 de septiembre de 2013.

L.J. Rodriguez, N. Brümmer, M. Peñagarikano, A. Varona, G. Bordel, M. Diez. “The Albayzin 2012 Language Recognition Evaluation”. 14th Annual Conference of the International Speech Communication Association (Interspeech 2013). Proceedings of Interspeech 2013 (CORE A). Lyon, France. 25-29 de agosto de 2013.

M. Diez, A. Varona, M. Peñagarikano, L.J. Rodriguez, G. Bordel. “Dimensionality Reduction of Phone Log-Likelihood Ratio Features for Spoken Language Recognition”. 14th Annual Conference of the International Speech Communication Association (Interspeech 2013). Proceedings of Interspeech 2013 (CORE A). Lyon, France. 25-29 de agosto de 2013.

A. Abad, L.J. Rodriguez, M. Peñagarikano, A. Varona, G. Bordel. “On the Calibration and Fusion of Heterogeneous Spoken Term Detection Systems”. 14th Annual Conference of the International Speech Communication Association (Interspeech 2013). Proceedings of Interspeech 2013 (CORE A). Lyon, France. 25-29 de agosto de 2013.

L. J. Rodriguez-Fuentes, M. Penagarikano, A. Varona, G. Bordel, M. Diez. “GTTS Keyword Search System description for the OpenKWS13? Keyword Search Evaluation”. NIST Open Keyword Search 2013 Evaluation Workshop. Washington DC, USA. 17 de julio de 2013.

Edit | Attach | Printable | Raw View | Backlinks: Web, All Webs | History: r1 | More topic actions
 
Grupo de Trabajo en Tecnologías Software
This site is powered by the TWiki collaboration platformCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback