Um modelo de base com eficiência de dados para detecção de biomarcadores
O uso de sistemas de inteligência artificial (IA) mostra-se promissor na medicina, onde podem ser usados para detectar doenças mais cedo, melhorar tratamentos e aliviar as cargas de trabalho da equipe. Mas seu desempenho depende de quão bem a IA é treinada.
Uma nova abordagem multitarefa para treinamento de IA torna possível treinar modelos de base de forma mais rápida e econômica, com menos dados. Pesquisadores estão recorrendo a essa abordagem para compensar a escassez de dados em imagens médicas — e, finalmente, salvar vidas.
De acordo com a Organização Mundial da Saúde (OMS), houve um aumento significativo nos casos de câncer em todo o mundo. Indicadores claros, conhecidos como biomarcadores, são essenciais para um diagnóstico confiável e tratamento bem-sucedido. Os sistemas de IA podem ajudar a identificar esses tipos de parâmetros mensuráveis em imagens patológicas.
Pesquisadores do Fraunhofer Institute for Digital Medicine MEVIS se uniram à RWTH Aachen University, à University of Regensburg e à Hannover Medical School para desenvolver um modelo de base para isso. O modelo com eficiência de recursos analisa amostras de tecido de forma rápida e confiável, com base em apenas uma fração dos dados de treinamento usuais.
Afastando-se de grandes volumes de dados e aprendizagem auto-supervisionada
Modelos de base padrão, como os grandes modelos de linguagem usados para ChatGPT, são treinados usando conjuntos de dados grandes e diversos, supervisionando a si mesmos enquanto aprendem. Mas para análise de imagens médicas, os dados são geralmente escassos e, de fato, as pequenas quantidades de dados disponíveis em estudos clínicos representam um grande desafio para o uso de IA.
Além disso, os centros clínicos diferem na forma como processam preparações patológicas e em suas populações de pacientes, mesmo antes de considerar a forma e as características específicas das doenças.
Todos esses fatores dificultam a detecção confiável de padrões existentes e, portanto, características relevantes para o diagnóstico. Para treinar a IA de forma eficaz, isso significa que grandes volumes de imagens de treinamento de diferentes origens são normalmente necessários. Mas cada imagem transversal de tecido tem tipicamente vários gigabytes de tamanho, contendo milhares de células diferentes, mas refletindo apenas uma pequena fração da variabilidade presente.
A especialização segue um treinamento básico sólido
O Fraunhofer MEVIS criou uma solução baseada em pré-treinamento supervisionado. “Estamos desenvolvendo uma estratégia de treinamento para IA fundamental modelada no treinamento que os patologistas passam. Eles não precisam reaprender o que é um núcleo novamente em cada caso. Isso é conhecimento de livro didático. Uma vez que esses conceitos foram abordados, eles estão presentes como uma base e podem ser aplicados a várias doenças”, explica o Dr. Johannes Lotz, especialista do Fraunhofer MEVIS.
Da mesma forma, seu modelo de IA passa por treinamento fundamental, aprendendo características gerais e leis conhecidas como conceitos de tecido a partir de uma ampla coleção de imagens de seções de tecido criadas com várias tarefas. A combinação dessas tarefas dá origem aos grandes volumes de dados necessários para treinar um modelo de IA grande e robusto.
Os conceitos de tecido aprendidos são então aplicados a uma tarefa específica em uma segunda etapa. Dessa forma, os algoritmos podem identificar biomarcadores que distinguem diferentes tipos de tumores, por exemplo — tudo com muito menos dados.
“Na nossa solução, cada conjunto de dados foi anotado por um humano especialmente treinado com as informações que precisam ser aprendidas”, explica Jan Raphael Schäfer, um especialista em IA da Fraunhofer MEVIS que trabalha na equipe de Lotz. “Damos ao nosso modelo a imagem e fornecemos a resposta ao mesmo tempo. E fazemos isso para várias tarefas diferentes simultaneamente, usando uma abordagem multitarefa.”
A equipe também usa um método de registro de imagem desenvolvido no instituto: HistokatFusion. Este método torna possível gerar dados de treinamento anotados automaticamente a partir de estudos de tecido, como coloração imuno-histoquímica, usando, assim, anticorpos marcados para visualizar proteínas ou outras estruturas.
Para fazer isso, esse método combina informações de múltiplas imagens histopatológicas. Os especialistas incorporam essas anotações geradas automaticamente no treinamento de seu modelo, o que acelera a coleta de dados.
Resultados excepcionais com apenas 6% dos recursos
Comparado a modelos que não envolvem treinamento supervisionado, a abordagem dos pesquisadores do Fraunhofer alcança resultados semelhantes com apenas 6% dos dados de treinamento. “Como a quantidade de dados de treinamento em aprendizado profundo se correlaciona com o esforço de treinamento e o poder de processamento, descobrimos que precisávamos de cerca de 6% dos recursos normalmente necessários.
“Além disso, precisamos de apenas cerca de 160 horas de treinamento, o que é um fator de custo crucial. Isso significa que podemos treinar um modelo equivalente com muito menos esforço”, explica Lotz.
A participação dos especialistas do Fraunhofer na competição internacional SemiCOL (Aprendizado semi-supervisionado para detecção de câncer colorretal) para classificação e segmentação de câncer mostrou o quão bem esses modelos pré-treinados podem ser generalizados.
A equipe venceu a parte de classificação do desafio sem precisar realizar ajustes caros em seu modelo e, por fim, ficou em segundo lugar entre nove equipes participantes.
Testes de segmentação interativa de imagens, nos quais estruturas de tecido são automaticamente detectadas e medidas em uma imagem, também mostram que esse método tem grande potencial. O modelo precisa de apenas algumas seções de imagem de amostra para estender conceitos que ele já aprendeu.
Mas isso não é tudo. “Modelos baseados em nossa solução tornam possível desenvolver novas ferramentas interativas de treinamento de IA médica que permitem que especialistas interajam diretamente com soluções de IA e treinem modelos relevantes rapidamente, mesmo sem qualquer conhecimento técnico de base”, diz Schäfer.
Livremente acessível e transferível
Os pesquisadores publicam o modelo pré-treinado e o código para aprendizado posterior em várias plataformas. Isso permite que especialistas o usem para fins não comerciais, desenvolvendo suas próprias soluções. A equipe também está trabalhando com parceiros clínicos para ter a solução aprovada para aplicações médicas e para validá-la sistematicamente.
Os especialistas do Fraunhofer MEVIS estão certos de que, uma vez na prática clínica diária, os sistemas que envolvem seu modelo básico reduzirão as cargas de trabalho em patologia e melhorarão o sucesso do tratamento.
Fornecido por Fraunhofer-Gesellschaft
Citação: Um modelo de base com eficiência de dados para detecção de biomarcadores (2024, 2 de setembro) recuperado em 2 de setembro de 2024 de https://medicalxpress.com/news/2024-09-efficient-foundation-biomarker.html
Este documento está sujeito a direitos autorais. Além de qualquer uso justo para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.