Subvención general a grupos de investigación UPV/EHU
- Financiado por la UPV/EHU (GIU10/18)
- Investigador principal Luis Javier Rodriguez-Fuentes?
- Investigadores: Germán Bordel, Mireia Diez, Mikel Peñagarikano, Luis Javier Rodriguez, Amparo Varona
- Período: 1/dic./2013 - 30/nov./2016
Resumen
Desde el año 2005 GTTS ha desarrollado una plataforma de aplicación real: Hearch. Se trata de un sistema de indexado y búsqueda en repositorios multimedia, es decir, un buscador de aspecto convencional (como Google, Bing, etc) pero con la capacidad de obtener como resultado segmentos de vídeo gracias a la transcripción automática de sus contenidos de voz. El sistema consta de un back-end que capta, procesa e indexa los recursos, y de un front-end que, mediante una interfaz web, permite realizar búsquedas, configurar los distintos módulos y monitorizar el funcionamiento. Actualmente puede verse funcionando una primera versión frente a repositorios de noticias en castellano y euskera (
http://gtts.ehu.es/Hearch/), aunque está también preparado para tratar con recursos en inglés.
Desde un punto de vista científico, se busca realizar aportaciones en cuestiones teóricas fundamentales que lleven a mejoras significativas en el rendimiento del sistema. Se prestará una atención especial a la mejora del backend de indexado: módulos de clasificación de voz/no-voz, verificación/identificación de la lengua y del locutor, el reconocedor automático del habla con transcripciones enriquecidas, etc.
Desde un punto de vista tecnológico, se busca mejorar la estructura y la ergonomía de la interfaz de usuario y facilitar la migración a nuevas aplicaciones. En esta línea, y en colaboración con los Servicios Informáticos del Parlamento Vasco, GTTS pretende desarrollar una nueva aplicación con el doble interés de ser un producto final y un sistema de contraste para la investigación. Se trata de hacer búsquedas por contenido o locutor en los videos (bilingües) de las sesiones parlamentarias.
Publicaciones