Geração Automática de Legendas Ocultas

Closed Captioning Automático. O Porquê.

O desenvolvimento das sociedades levou a uma consciencialização crescente das mesmas para a necessidade de garantir condições de igualdade no acesso à informação e conhecimento a todos os indivíduos. É neste contexto que as emissoras de televisão, bem como outros produtores de mídia, se deparam, cada vez mais, com requisitos legais que obrigam à disponibilização dos conteúdos recorrendo a métodos de comunicação alternativa como, por exemplo, linguagem gestual ou legendagem.
O fato de a legendagem ser útil para um conjunto mais alargado de utilizadores e situações – por exemplo, as legendas ajudam falantes não nativos de uma língua a entender melhor os programas de televisão, bem como a aprender essa língua – despertou nas emissoras de Televisão um interesse acrescido por este mecanismo de descrição dos conteúdos falados. Porém, o processo de geração de legendas ocultas (closed captioning) é caro e moroso se feito manualmente. Assim, a criação, e posterior disponibilização, de ferramentas de transcrição automática, em tempo real e de alta qualidade, tem tido um lugar de destaque nas atividades de Pesquisa e Desenvolvimento da VoiceInteraction. O AUDIMUS.MEDIA foi desenvolvido com o objetivo de possibilitar a produção automática de legendas ocultas (closed captions) de alta qualidade e fidelidade a um custo acessível, tendo, por isso, vindo a ser adotado por um número crescente e já bastante significativo de emissoras.

 

Ao Vivo. Automático. Legislado. Acessível.

Geração automática de legendas ocultas para emissões de televisão ao vivo ou conteúdos web transmitidos em stream, sem necessidade de intervenção humana. Cumpre todos os requisitos legais aos quais as emissoras têm de responder para transmitir e legendar os seus conteúdos, evitando os custos proibitivos de uma legendagem manual.

 

Audimus.Media frame

 

Descrição Geral

O Audimus.Media é um sistema de geração automática de legendas ocultas, que é, normalmente, instalado na infraestrutura da emissora de modo a se integrar mais facilmente no workflow da mesma. Este sistema recebe os seus feeds de áudio diretamente da PGM e produz legendas ocultas em tempo real. De fácil integração com seu workflow atual, este sistema recebe qualquer fonte de aúdio ou vídeo, processa e envia as legendas geradas para qualquer encoder de teletexto ou de closed caption. Nas transmissões via web, o processo é semelhante. Para maximizar a qualidade das transcrições pode se recorrer  a técnicas como, por exemplo, a atualização diária dos vocabulários e modelos de língua.
 
 

 

Principais Características

Este produto foi criado, a principio, para canais de televisão. Tem sido objetivo da VoiceInteraction fornecer um serviço que permita gerar automaticamente legendas ocultas para transmissões de programas ao vivo, assegurando, assim, o estrito cumprimento de todos os regulamentos de acessibilidade, com qualidade e rapidez e a custos comportáveis. No entanto, as necessidades de closed captioning vão, atualmente, muito além das emissoras de televisão. A produção e distribuição de conteúdos pela internet – liderado pelas operadoras de OTT e IPTV — tem vindo a registrar um aumento que não pode ser ignorado. Cada vez mais, estas empresas necessitam de fornecer os seus conteúdos com as respetivas legendas ocultas. O Audimus.Media suprime esta necessidade com a possibilidade de receber qualquer conteúdo web e gerar as suas legendas em tempo real e de forma automática. Além disso, é também possível adicionar metadados aos conteúdos a transmitir. A indicação do nome do orador, da língua utilizada e a sinalização da ocorrência de música e conversações de fundo são alguns exemplos dos metadados adicionados à transcrição nas legendas ocultas.
 
Entidades institucionais e Plataformas de E-learning que façam transmissão de conteúdos ou empresas que possuam um canal de TV Corporativa e necessitem de legendar os seus conteúdos podem recorrer ao Audimus.Media.
 
O Audimus.Media permite:
  • Closed captioning automático de transmissões de televisão online
  • Closed captioning automática em web streams online
  • Incorporação de metadados em contéudos a transmitir
  • Cumprir com todos os regulamentos de acessibilidade
O Audimus.Media pode ser útil para uma ampla variedade de organizações e clientes. As utilizações mais relevantes estão presentes nas seguintes áreas de negócio:
  • Emissoras de televisão
  • OTT / IPTV
  • Internet Video Portals
  • Plataformas de E-learning
  • Televisão corporativa
  • Entidades Institucionais

Descrição Detalhada

Sempre foi nosso propósito a criação de um sistema totalmente automático, onde a produção de legendas em tempo real com a menor latência e taxa de erro possíveis são os objetivos principais. Para tal, desenhamos e desenvolvemos a arquitetura presente na imagem seguinte.
 
 
O Audimus.Media captura um sinal de áudio ou vídeo em formato digital ou análogico e, através de reconhecimento automático de fala, produz as legendas otimizadas para diferentes tipos de encoders com uma latência miníma.
Neste processamento automático, destacamos a identificação de todos os pivôs presentes no áudio recebido, bem como, a detecção de transições entre diferentes oradores. O texto de saída é normalizado, formatado e otimizado para o encoder (já integramos a maioria das marcas oferecidas no mercado). Tudo isto é feito em 3-4 segundos palavra a palavra.
Sendo um sistema dependente da língua, são disponibilizados diferentes modelos para diferentes regiões. Estes são treinados com grandes quantidades de áudio e texto, onde o universo total do vocabulário ultrapassa as 100.000 palavras.
Os modelos de linguagem resultam da interpolação de vários submodelos associados a diferentes fontes, estando disponível um Serviço de Adaptação dos Modelos de Linguagem que permite a sua adaptação diária às diferentes novas temáticas. Este sistema trabalha em conjunto com um Módulo de Segmentação Acústica para uma separação das zonas acústicas relevantes para a legendagem.
Entre as línguas/variedades suportadas podemos destacar: Português Europeu, Português do Brasil, Português de Angola, Espanhol, Francês, Alemão, Italiano, Basco, Inglês Americano e Inglês Britânico.
 
O Audimus.Media, pelas suas características, necessita de recursos computacionais de alta performance que devem obedecer a uma especificação prévia. Toda a administração do sistema é feita através de uma interface web.

The Adobe Flash Player is required for video playback.Get the latest Flash Player or Watch this video on YouTube.

 

audimusServer4

 

Quem confia em nós

O Audimus.Media encontra-se em produção nas seguintes emissoras:
 
 

Audimus.Media-Brasil

 
"A VoiceInteraction Brasil surpreendeu muito com o AUDIMUS.MEDIA, faz o que promete. Estamos muito satisfeitos com os sistema e com todo suporte dado pela VoiceInteraction." – Daniel Fernandes, Supervisor de Pesquisa e Desenvolvimento, TV TEM (afiliada TV Globo).
 
 
 

Demonstração