Projeto SAVAS

O projeto

O projeto SAVAS irá recolher recursos textuais e audiovisuais produzidos em seis línguas europeias (espanhol, basco, português, italiano, francês e alemão). Os repositórios resultantes serão anotados a vários níveis (incluindo o nível ortográfico) de uma forma adequada ao treino de modelos acústicos e de linguagem para uma posterior utilização em sistemas de reconhecimento de voz contínua de vocabulários de dimensão elevada (LVCSR). Os recursos anotados no âmbito do projeto serão compartilhados com o restante da comunidade através da criação de um repositório META-SHARE local.

Impacto do projeto

O projeto pretende contribuir para o avanço do estado da arte de três áreas distintas:

  • anotação e automatização da recolha de recursos linguísticos, falados e escritos;
  • partilha desses recursos;
  • tecnologias de reconhecimento de voz contínua aplicada à legendagem automática de conteúdos audiovisuais;

O projeto pretende ainda contribuir para o aumento da competitividade das emissoras e empresas de legendagem europeias através do uso generalizado desta tecnologia na transcrição automática de conteúdos falados.

Interessados no projeto

As metodologias e tecnologias desenvolvidas no âmbito deste projeto serão de grande interesse para toda a indústria audiovisual, incluindo emissoras de televisão e outros produtores de conteúdos, para a comunidade científica em geral, para associações de defesa dos direitos de cidadãos portadores de necessidades especiais e para qualquer pessoa com interesse na matéria. 

Saber mais