Em conversa com Martin Walsh, da DTS, Layla Laidouci explora um diálogo claro-a solução de áudio de ponta da empresa para inteligibilidade vocal.
À medida que o entretenimento doméstico se torna mais avançado, o mercado de amadurecimento está destacando uma frustração generalizada. O diálogo ininteligível apresenta um obstáculo à imersão, retirando filmes e outro material criativo de intenção artística.
Clear Dialogue, a nova solução de pós-processamento de áudio da DTS, suporta todos os idiomas e várias fontes de conteúdo para resolver esse desafio. O especialista em entretenimento imersivo introduziu sua tecnologia de separação de áudio em setembro de 2024, com aclamações críticas no mundo dos eletrônicos de consumo. Executado na CES 2025, o Clear Dialogue usa a IA para diferenciar o áudio entre diálogo, música e efeitos sonoros. Falamos com Martin Walsh, vice -presidente da DTS, sobre a pesquisa e a missão por trás do conceito de diálogo claro.
Resolução de problemas
“As soluções tradicionais de processamento de sinal digital têm suas limitações”, começa Walsh. “Identificamos as causas radiculares do problema que queríamos abordar. Essas eram principalmente técnicas de mistura de conteúdo, qualidade dos alto -falantes de TV e ambientes de escuta. Usixamos e remixam trilhas sonoras para mitigar esses fatores”.
“Embora a qualidade da produção moderna da produção de áudio de entretenimento doméstica tenha se tornado equivalente à qualidade da produção de filmes, os produtos que a reproduzem nem sempre são os mesmos”.
Walsh reconhece que o entretenimento doméstico tem mais canais de áudio e alcance dinâmico do que nunca, mas a usabilidade do produto limita seu desempenho. “Embora a qualidade da produção moderna da produção de áudio de entretenimento doméstica tenha se tornado equivalente à qualidade da produção de filmes, os produtos que a reproduzem nem sempre são os mesmos”, ressalta ele. “A maioria das pessoas está assistindo conteúdo em alto-falantes estéreo baratos, finos e muitas vezes culpados, embutidos em suas TVs de tela plana. Isso significa que todos os canais adicionais de áudio de alta alcance dinâmica são compactados para alto-falantes de TV de baixa potência, comprometendo a inteligibilidade do diálogo no processo.
“A música de fundo ou os efeitos sonoros geralmente pode dominar palavras faladas, especialmente em cenas de ação ou ambientes ambientais. Configurações de áudio personalizáveis para esses fins são essenciais, mas geralmente deficientes em muitos modelos de TV. Os ambientes em que as pessoas assistem TV também podem afetar a qualidade do diálogo. Por exemplo, é provável que os espectadores reduzam o volume ao ouvir à noite.
“Outro remédio popular para os proprietários de sistemas de áudio multicanal é aumentar o volume do canal central em relação aos outros canais. Embora isso possa ser eficaz, ele também cria um desequilíbrio espacial para áudio não dialogador no canal central”.
Martin Walsh
O desafio técnico
As técnicas de processamento de sinal foram avançadas para abordar esses problemas de inteligibilidade de diálogo. Walsh diz que as tecnologias aplicam ganhos a áreas em que a fala humana provavelmente estará presente, mas isso pode afetar a Eq (equalização) dentro dessa faixa de frequência.
“Os formatos de áudio baseados em objetos, como DTS: X, permitem que os criadores de conteúdo codifiquem o diálogo como um objeto de áudio separado para processar independentemente esse objeto de diálogo no final do recebimento. No entanto, essas opções podem atrapalhar os fluxos de trabalho de criação de conteúdo e os objetos de diálogo não foram amplamente adotados até agora.”
A Walsh está se referindo ao codec de áudio proprietário da empresa, que oferece som imersivo onde ocorreria no espaço.
“Mesmo que o processamento de diálogo baseado em objetos seja adotado, a técnica não poderá ser aplicada ao conteúdo legado e não baseado em objetos”, continua ele. “Alguns provedores de conteúdo estão criando versões especiais de diálogo de suas trilhas sonoras: por exemplo, a Amazon introduziu um recurso chamado Dialogue Boost no Prime Video.
“Esse recurso permite que os usuários aumentem o volume de diálogo em relação à música e efeitos de fundo, facilitando a audição e a compreensão de palavras faladas no conteúdo suportado.
“Uma desvantagem dessa abordagem é que os produtores de conteúdo não podem prever as preferências do ouvinte ou o ambiente em que o conteúdo é consumido. Em vez disso, eles devem fazer um palpite educado para cada nova versão do mix, muitas vezes interrompendo a intenção artística original ou a mistura original e desalinhando com preferências individuais.
“Os recentes avanços no aprendizado de máquina isolam totalmente o diálogo do restante de uma faixa de áudio e aplicam processamento exclusivo a ele. O DTS Clear Dialogue separa as vozes da música e os efeitos de uma trilha sonora antes de aplicar qualquer EQ específico do diálogo.
“O diálogo claro cria um mix de diálogo sob medida para cada usuário com base em suas preferências e também pode incluir outras informações, como o ambiente de reprodução e as limitações do equipamento de reprodução”.
“Há evidências sugerindo que separar o diálogo da trilha sonora e melhorá -lo através do ganho ou da EQ pode melhorar a experiência de audição para indivíduos com perda auditiva leve a grave”.
O diálogo pode abordar a perda auditiva?
O DTS continua a conduzir pesquisas sobre os efeitos do diálogo DTS claro sobre aqueles com dificuldades auditivas. “Esta questão é complexa porque a perda auditiva pode variar de pessoa para pessoa”, diz Walsh. “A solução atual pode não ser ideal para indivíduos com perda auditiva significativa, pois o aumento dos níveis de alto -falante de TV pode causar muito distorção secundária substancial. É crucial garantir que o nível de processamento não resulte em uma experiência auditiva desconfortável para outras pessoas presentes na sala.
“Há evidências sugerindo que separar o diálogo da trilha sonora e melhorá -lo através de ganho ou EQ pode melhorar a experiência de audição para indivíduos com perda auditiva leve a grave.
“À medida que a audição diminui, distinguir o diálogo do fundo aumenta a carga cognitiva no ouvinte e se torna mais desafiador. Aumentar a proporção de diálogo para apoio pode fazer uma diferença significativa sem a necessidade de adaptar a solução ao perfil de audição específico de cada ouvinte”.
Imersão e diálogo
O diálogo claro amplifica os vocais sem distorcer todo o mix de áudio, introduzindo clareza, mesmo em cenas com ruído de fundo alto ou paisagens sonoras complexas. “Quando o diálogo é inteligível, o fluxo narrativo é mantido e mantém os espectadores envolvidos”, diz Walsh. “Isso é vital em programas de televisão e filmes para garantir que o público possa compreender a história, personagens e emoções sendo transmitidos.
“A leitura das legendas pode diminuir significativamente a imersão na história, pois o foco deve mudar para ler o texto em vez de observar o restante da tela. O feedback dos testes tem sido encorajador, destacando o quão simples ajustes nos níveis de diálogo, música e efeitos podem resultar em uma experiência de entretenimento muito menos estressante. Muitos disseram que não tinham conhecimento do esforço cognitivo exigido.
“Quando o diálogo é inteligível, o fluxo narrativo é mantido e mantém os espectadores envolvidos.”
“Esta solução é focada especificamente para televisões, alavancando os recursos de hardware de aprendizado de máquina presentes nos aparelhos de TV contemporâneos. A próxima geração de nossa tecnologia de diálogo clara DTS incluirá caixas de decópio, barras de som e receptores de AV. Em certos casos, essas soluções podem incorporar recursos de processamento de sinais mais avançados adaptados aos hardware específicos.”
Crédito da imagem: Andrey Popov/Shutterstock.com
‘O artigo anterior pode incluir informações divulgadas por terceiros’
‘Alguns detalhes deste artigo foram extraídos da seguinte fonte www.hiddenwires.co.uk’
‘ O artigo anterior foi obtido e traduzido do site internacional da celebrity.land ’ Source Link















