Melhorando a enunciação da tecnologia de fala para texto em ambientes médicos
Os programas de conversão de voz em texto estão se tornando mais populares para tarefas cotidianas, como ditado com as mãos livres, ajuda a pessoas com deficiência visual e transcrição de fala para pessoas com deficiência auditiva. Essas ferramentas têm muitos usos, e a pesquisadora Bożena Kostek, da Universidade de Tecnologia de Gdańsk, está explorando como o STT pode ser melhor utilizado na área médica. Ao estudar como a clareza da fala afeta a precisão do STT, ela espera melhorar sua utilidade para os profissionais de saúde.
“Automatizar a tomada de notas dos dados dos pacientes é crucial para médicos e radiologistas, pois proporciona aos médicos mais tempo face a face com os pacientes e permite uma melhor recolha de dados”, diz Kostek.
Kostek também explica os desafios que enfrentam neste trabalho.
“Os modelos STT muitas vezes têm dificuldades com termos médicos, especialmente em polonês, uma vez que muitos foram treinados principalmente em inglês. Além disso, a maioria dos recursos concentra-se em linguagem simples, e não em vocabulário médico especializado. Ambientes hospitalares barulhentos tornam isso ainda mais difícil, pois os prestadores de cuidados de saúde podem não fale claramente devido ao estresse ou distrações.”
Para resolver estes problemas, foi criado um conjunto de dados de áudio detalhado com termos médicos polacos falados por médicos e especialistas em áreas como cardiologia e pneumologia. Esse conjunto de dados foi analisado por meio de um modelo de Reconhecimento Automático de Fala, tecnologia que converte fala em texto, para transcrição. Diversas métricas, como Taxa de Erros de Palavras e Taxa de Erros de Caracteres, foram utilizadas para avaliar a qualidade do reconhecimento de fala. Esta análise ajuda a compreender como a clareza e o estilo da fala afetam a precisão do STT.
Kostek apresentou isso como parte do 187º Encontro virtual da Acoustical Society of America.
“O jargão médico pode ser complicado, especialmente com abreviaturas que diferem entre especialidades. Esta é uma tarefa ainda mais difícil quando nos referimos a situações hospitalares realistas em que a sala não está preparada acusticamente”, disse Kostek.
Atualmente o foco está no polonês, mas há planos de expandir a pesquisa para outras línguas, como o tcheco. Estão sendo estabelecidas colaborações com o Hospital Universitário de Brno para desenvolver recursos de termos médicos, com o objetivo de aprimorar o uso da tecnologia STT nos cuidados de saúde.
“Mesmo que a inteligência artificial seja útil em muitas situações, muitos problemas devem ser investigados analiticamente, em vez de holisticamente, concentrando-se na divisão de um quadro completo em partes individuais.”
Fornecido pela Sociedade Acústica da América
Citação: Melhorando a enunciação da tecnologia de fala para texto em ambientes médicos (2024, 22 de novembro) recuperado em 22 de novembro de 2024 em https://medicalxpress.com/news/2024-11-enunciation-speech-text-technology-medical.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.