
Os pesquisadores desenvolvem o método amigável para a privacidade para compartilhamento de dados médicos

Procedimentos e resultados da avaliação humana em imagens da mama gerada pelo Coldit. (A) Avaliamos imagens da mama gerada ao Coldit através de 3 estudos de leitores. O Reader Study 1 e o Reader Study 2 avaliam o realismo de imagens geradas a Coldit, enquanto o Reader Study 3 avalia a geração condicional de Coldit com base na classificação dos Bi-Rads. (B) Desempenho de avaliação de 6 leitores sobre o realismo de imagens da mama real e gerada a Coldit no Reader Study 1 e Reader Study 2. (C) Comparação do desempenho da classificação de Bi-Rads de cada leitor em imagens de mama reais e geradas por Coldit no estudo do leitor 3. AUC, área sob a curva de operação do receptor. Crédito: Pesquisar (2024). Doi: 10.34133/pesquisa.0532
O Big Data Medical possui imenso potencial para melhorar a qualidade dos cuidados de saúde e o avanço da pesquisa médica. No entanto, o compartilhamento cruzado de dados médicos, essencial para a construção de conjuntos de dados grandes e diversos, aumenta as preocupações com a privacidade e o risco de uso indevido de informações pessoais.
Vários métodos foram desenvolvidos para resolver esse problema. Os métodos de desidentificação são propensos a riscos de re-identificação, e a privacidade diferencial geralmente compromete a utilidade de dados, introduzindo ruído. Em regiões com rigorosos regulamentos de compartilhamento de dados, a aprendizagem federada foi proposta como uma solução potencial, permitindo o treinamento de modelos colaborativos sem compartilhar dados brutos. No entanto, ele permanece vulnerável ao vazamento de privacidade das atualizações do modelo ou do modelo final. Portanto, alcançar o compartilhamento de dados médicos seguro e eficiente continua sendo um problema urgente.
Para enfrentar esses desafios, a equipe do Professor Zhou desenvolveu Coldit, um modelo de difusão latente condicional com um backbone de transformador de difusão (DIT), capaz de gerar imagens de ultrassom mamário de alta resolução condicionadas em categorias de Bi-Rads (Bi-Rads 3, 4A, 4B, 4C e 5). O conjunto de treinamento para Coldit compreendeu 9.705 imagens de ultrassom mamário de 5.243 pacientes em 202 hospitais, utilizando vários fornecedores de ultrassom para garantir a diversidade e a abrangência dos dados.
Para validar a proteção da privacidade durante a geração de imagens, a equipe conduziu a análise mais próxima, confirmando que as imagens geradas pelo Coldit não replicaram nenhuma imagem do conjunto de treinamento, protegendo a privacidade do paciente. Para avaliação da qualidade, eles convidaram os radiologistas a avaliar o realismo e a classificação de Bi-Rads de imagens geradas a Coldit.
Na avaliação do realismo, exceto por um radiologista sênior com uma pontuação de AUC maior que 0,7, os outros cinco radiologistas alcançaram AUCs variando entre 0,53 e 0,63. Além disso, o desempenho geral da classificação dos Bi-Rads em imagens sintéticas foi comparável ao de imagens reais para todos os três radiologistas, com dois superando seu desempenho em imagens reais.
Além disso, o estudo utilizou as imagens sintéticas de ultrassom da mama para aumento de dados em um modelo de classificação BI-RADS. Os resultados indicaram que, após a substituição da metade dos dados reais no conjunto de treinamento por dados sintéticos, o desempenho do modelo permaneceu comparável ao modelo treinado exclusivamente com dados reais (p = 0,81).
Este estudo oferece várias vantagens sobre trabalhos anteriores. Primeiro, o uso de um conjunto de dados grande e multicêntrico garantiu diversas fontes de dados de 202 hospitais, abrangendo diferentes fornecedores e graus de dispositivo. Isso permitiu ao modelo capturar uma gama abrangente de variações inerentes às imagens de ultrassom do mundo real, levando à geração de imagens sintéticas mais realistas e precisas.
Segundo, empregar uma espinha dorsal do transformador puro em vez da rede de U tradicional capitaliza a capacidade excepcional dos Transformers de capturar dependências de longo alcance, permitindo que o modelo gerasse imagens mais coerentes e detalhadas. Terceiro, condicionando a síntese de imagem nos rótulos de Bi-Rads permite a geração de imagens de ultrassom correspondentes a categorias específicas de Bi-Rads. Isso é particularmente valioso em contextos médicos, onde a capacidade de gerar imagens adaptadas a cenários clínicos específicos é crucial para o diagnóstico preciso e o planejamento do tratamento.
A equipe do Professor Zhou acredita que os dados sintéticos, como uma solução de proteção à privacidade, desempenharão um papel fundamental na utilização segura de big data médico, acelerando o progresso em pesquisas médicas e aplicações clínicas e, finalmente, aprimorando a qualidade dos serviços médicos e da saúde do paciente. No futuro, a equipe planeja integrar a inteligência artificial generativa com mais tipos de dados de imagem médica para verificar sua aplicabilidade em diferentes cenários médicos.
Mais informações:
Jiale Xu et al., Imagens sintéticas de ultrassom da mama: um estudo para superar barreiras de compartilhamento de dados médicos, Pesquisar (2024). Doi: 10.34133/pesquisa.0532
Fornecido por pesquisa
Citação: Imagens de ultrassom sintético da mama: os pesquisadores desenvolvem o método amigável para a privacidade para compartilhamento de dados médicos (2025, 13 de março) recuperado em 14 de março de 2025 em https://medicalxpress.com/news/2025-03-syntetic-breast-lrastrous- images-pracacy.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins de informação.