CPL

REconhecimento de voz x estenotipia

Chegou o dia do grande fight! Muita calma nessa hora! A ideia não é fazer um combate direto, mas uma análise que te dê instrumentos para poder se orientar sobre as vantagens e limitações de cada modelo de produção.

Pedindo ajuda ao especialista

Como a iniciativa deste guia é do CPL – Soluções em acessibilidade, empresa que usa reconhecimento de fala para a produção de closed caption, fui pedir ajuda internacional a um dos maiores especialistas sobre o assunto em solo yankee, Gary Robson. Infelizmente, não foi um papo ao vivo, mas podemos contar com os dados e informações disponibilizados por ele no livro The Closed Captioning Handbook para trazermos uma certa neutralidade à comparação.

Closed Caption nos EUA, solo fértil

Os EUA são um terreno fértil para observações nesta área, pois lá a ferramenta já existe e é usada há muito tempo. Com isso, eles já passaram por diversas fases, o que resultou, inclusive, numa proliferação das Captioning Houses, como muitas vezes são chamadas as empresas produtoras.

A consequência disso é que surgiram vários profissionais, tanto da operação por voz, quanto por digitação, formando associações nacionais de “voice writers” e “stenocaptioners” . Evidentemente que cada uma das organizações têm uma vasta gama de dados que comprovam que seu método é o melhor e mais eficiente. 

Robson também foi buscar uma ajuda fora deste embate, recorrendo a Marty Block, um dos mais enfáticos proponentes do uso de estenotipia para closed caption, chegando a ser presidente da NCRA (uma espécie de associação nacional de estenotipistas) durante um mandato, e que se tornou CEO de uma empresa concorrente que trabalha com reconhecimento de fala.

Qual é o melhor método: a resposta de Block

Block diz que bons operadores, tanto por voz quanto por estenotipia, farão trabalhos de qualidade similar. Ele aponta, por outro lado, que levando em consideração o melhor estenotipista contra o melhor voice writer, o processo de digitação será o mais preciso.

O mais curioso, no entanto, é que Block deixa a estenotipia por não acreditar que a quantidade de stenocaptioners de ponta daria conta da imensa demanda, pois o tempo de aprendizado da técnica, para atingir níveis mínimos para uma transmissão de TV, é muito grande (anos) quando comparado ao tempo de formação de um captioner por voz. Nisso há fortes impactos de mercado, como o alto custo de mão de obra, visto à restrição de oferta de profissionais e o consequente aumento do custo do serviço.

É importante deixar claro que este livro traz estudos dos anos 2000 e que esta realidade vem mudando de forma cada vez mais favorável ao reconhecimento de voz, pois a estenotipia, apesar de também ter evoluído neste período, é uma tecnologia muito bem acabada, que parece já ter atingido seu ápice. Enquanto isso, do outro lado, gigantes da indústria como Apple, IBM e Google apostam suas fichas (e investimentos) para que esta ferramenta seja cada vez mais eficiente em todas as suas amplas possibilidades de uso.

Espero que até aqui tenha dado para se ter um panorama geral dos modelos de produção. Acho interessante aprofundarmos em questões mais específicas e cotidianas da operacionalização destes serviços. Mas faremos isso no próximo artigo. Enquanto isso, siga a gente nas redes, mande sua dúvida e comentário e até lá!

entre em contato para saber preços e informações