AutoCaption & PhonemeWorks
AutoCaption es una línea de investigación en alineamietro automático de audio y texto abierta en 2010.
Los primeros resultados, aplicados a una sesión del Parlamento Vasco, pueden verse en la sección de
demos.
Una parte importante del desarrollo de esta línea tiene que ver con el procesamiento fonético, y para ello se están construyendo herramientas capaces de manejar diferentes conjuntos fonéticos para diferentes idiomas así como distintas codificaciones de los mismos (IPA, SAMPA, OGI, CMU, etc). En concreto, para la demo del Parlamento Vasco se ha implementado un transcriptor ortográfico-fonético capaz de tratar con textos en los que el castellano y el euskera se intercalan sin pautas preestablecidas.
Acceso a la wiki de trabajo (se precisa autorizacion)
--
GermanBordel - 12 Apr 2010