Notícias

Ferramenta computacional usa abordagem codificada por DNA para integrar e analisar diferentes bancos de dados de saúde

Uma ferramenta computacional inovadora que integra e analisa diferentes bases de dados de saúde

Fluxo de trabalho Tucuxi-BLAST e esquema de organização de dados. Quatro variáveis ​​são selecionadas em comum entre dois conjuntos de dados, então a codificação de DNA é realizada. O resultado da codificação é submetido ao algoritmo BLAST e, por fim, o ML é aplicado para classificar o RL (A). Roda de códons usada na codificação de DNA (B), resultados do BLAST para RL (C) e módulo Tucuxi-BW para desduplicação de dados (D). Crédito: PeerJ (2022). DOI: 10.7717/peerj.13507

Pesquisadores brasileiros criaram uma ferramenta computacional inovadora e ágil para vincular e analisar diferentes bases de dados de saúde com milhões de registros de pacientes. Chamada de Tucuxi-BLAST, a plataforma codifica registros de identificação em um banco de dados, como nome do paciente, nome da mãe e naturalidade, por meio de letras que representam os nucleotídeos de uma sequência de DNA (A, T, C ou G). Essa “conversão” de indivíduos em DNA permite a conexão precisa de registros entre bancos de dados, apesar de erros tipográficos e outras inconsistências.

A ferramenta pode ser utilizada em pesquisas, análises epidemiológicas e formulação de políticas públicas.

Por exemplo, as pessoas que foram vacinadas pelo SUS, o serviço nacional de saúde do Brasil, podem ser cruzadas com outros conjuntos de dados para encontrar pacientes vacinados com uma doença específica. Mesmo que um registro de vacinação contenha erros ou campos incompletos, o Tucuxi-BLAST consegue vinculá-lo ao mesmo paciente em outro banco de dados, pois trata as inconsistências como se fossem mutações de DNA. Ferramentas de genômica rotineiramente precisam comparar fragmentos para decidir se eles são mais semelhantes do que diferentes e se devem ligar os pares de bases em questão. Se cada indivíduo corresponde a uma sequência de letras, dados de diferentes repositórios podem ser cruzados e vinculados pela ferramenta.

“O SUS é uma valiosa fonte de informação para médicos e pesquisa epidemiológica porque armazena dados de saúde para milhões de pacientes. No entanto, registros referentes a doenças e outros tipos de dados são armazenados em diferentes bancos de dados que nem sempre conversam entre si. O método que desenvolvemos é capaz de efetuar a ligação de registros com precisão e grande velocidade”, Helder Nakaya, autor correspondente de um artigo sobre o estudo publicado na revista PeerJdisse à Agência FAPESP.

Nakaya é imunologista vinculado à Faculdade de Ciências Farmacêuticas da Universidade de São Paulo (FCF-USP), Hospital Judaico Albert Einstein (HIAE), Plataforma Científica Pasteur-USP e Instituto Todos pela Saúde. Ele também pertence ao Centro de Pesquisa em Doenças Inflamatórias (CRID), um dos Centros de Pesquisa, Inovação e Difusão (CEPIDs).

Usando a ferramenta na prática

Antes mesmo da publicação do artigo, o Tucuxi-BLAST começou a ser implantado na prática. Utilizou-se, por exemplo, para cruzar dados de quatro anos do Sistema de Vigilância da Malária do Ministério da Saúde com dados clínicos da Fundação de Medicina Tropical Dr. Heitor Vieira Dourado (em Manaus, Amazonas), filial da Fundação Oswaldo Cruz (Fiocruz), outro braço do ministério.

O resultado mostrou que ser HIV positivo é um risco para os portadores de malária por Plasmodium vivax, representando um desafio adicional para as políticas públicas. Dada a falta de identificadores únicos, o Tucuxi-BLAST utilizou o nome do paciente, nome da mãe e data de nascimento. As descobertas foram descritas em um artigo publicado em maio de 2022 na Relatórios Científicos.

O estudo foi liderado por pesquisadores da Universidade do Estado do Amazonas (UEA). Nakaya e José Deney Alves Araújo, da FCF-USP, primeiro autor do PeerJ artigo, também participou. Araújo batizou a ferramenta de Tucuxi em homenagem a Sotalia fluviatilis, um boto de água doce que habita os rios da Bacia Amazônica.

BLAST (Basic Local Alignment Search Tool) refere-se a um conjunto de programas usados ​​em bioinformática para gerar alinhamentos entre nucleotídeos ou sequências de proteínas em grandes bancos de dados.

Como funciona

Para desenvolver o novo método, os cientistas traduziram os dados do paciente em sequências de DNA usando uma roda de códons que mudou dinamicamente em diferentes execuções sem prejudicar a eficiência do processo. Os códons são sequências de três nucleotídeos que codificam um aminoácido específico em uma molécula de DNA ou RNA. As rodas de códons são usadas para identificar os aminoácidos codificados por qualquer códon de DNA ou RNA.

Esse esquema de codificação permitiu a criptografia de dados em tempo real, fornecendo assim uma camada adicional de privacidade durante o processo de vinculação. “Ele usou DNA para criptografar as informações e garantir a privacidade”, disse Nakaya.

Os campos de identificação codificados por DNA foram comparados usando o BLAST e os algoritmos de aprendizado de máquina classificaram automaticamente os resultados finais.

Como em genômica comparativaonde genes de diferentes genomas são comparados para determinar sequências comuns e únicas, o Tucuxi-BLAST também permite a integração simultânea de dados de vários bancos de dados administrativos sem a necessidade de pré-processamento de dados complexos.

No estudo, o grupo usou o Tucuxi-BLAST para testar e comparar um banco de dados simulado contendo 300 milhões de registros, além de quatro grandes bancos de dados administrativos contendo dados de casos reais de pacientes infectados por diferentes patógenos.

A conclusão foi que o Tucuxi-BLAST processou com sucesso as ligações de registros para o maior conjunto de dados (200.000 registros), apesar de erros de ortografia e outros erros e omissões, em um quinto das vezes: 23 horas, em comparação com 127 horas (cinco dias e sete horas) para o método de última geração.

Os pesquisadores criaram um site onde os usuários podem traduzir palavras, frases e nomes em DNA.

Vários países, como Reino Unido, Canadá e Austrália, investiram em iniciativas bem-sucedidas para integrar bancos de dados e desenvolver novas estratégias de análise de dados, observou Nakaya.


Técnica baseada em inteligência artificial detecta doença de Chagas a partir de imagens feitas com smartphone


Mais Informações:
José Deney Araujo et al, Tucuxi-BLAST: Habilitando a vinculação rápida e precisa de registros de bancos de dados administrativos relacionados à saúde em larga escala por meio de uma abordagem codificada por DNA, PeerJ (2022). DOI: 10.7717/peerj.13507

Cecilia Victoria Caraballo Guerra et al, A infecção pelo HIV aumenta o risco de adquirir malária por Plasmodium vivax: um estudo de coorte de 4 anos na Amazônia brasileira HIV e risco de malária vivax, Relatórios Científicos (2022). DOI: 10.1038/s41598-022-13256-4

Tradutor de texto: tucuxi-translator.csbiology.org/

Citação: Ferramenta computacional usa abordagem codificada por DNA para integrar e analisar diferentes bancos de dados de saúde (2022, 4 de outubro) recuperados em 5 de outubro de 2022 em https://medicalxpress.com/news/2022-10-tool-dna-encoded-approach-health- databases.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.

Looks like you have blocked notifications!

Segue as Notícias da Comunidade PortalEnf e fica atualizado.(clica aqui)

Portalenf Comunidade de Saúde

A PortalEnf é um Portal de Saúde on-line que tem por objectivo divulgar tutoriais e notícias sobre a Saúde e a Enfermagem de forma a promover o conhecimento entre os seus membros.

Artigos Relacionados

Deixe um comentário

Botão Voltar ao Topo
Send this to a friend