Estudo rastreia uma epidemia infecciosa de linguagem
“Paus e pedras podem quebrar meus ossos”, diz o velho ditado. “Mas palavras nunca vão me machucar.” Diga isso a Eugenia Rho, professora assistente do Departamento de Ciência da Computação, e ela lhe mostrará extensos dados que provam o contrário.
Seu Society + AI & Language Lab mostrou que
Agora, a equipa de investigação de Rho na Faculdade de Engenharia voltou-se para outra questão: que efeitos a retórica das redes sociais teve nas taxas de infecção e mortalidade por COVID-19 nos Estados Unidos, e o que podem os decisores políticos e as autoridades de saúde pública aprender com isso?
“Muitos estudos apenas descrevem o que está acontecendo online. Muitas vezes eles não mostram uma ligação direta com comportamentos offline”, disse Rho. “Mas existe uma maneira tangível de conectar o comportamento online com a tomada de decisões offline.”
Causa e efeito
Durante a pandemia da COVID-19, as redes sociais tornaram-se um local de encontro em massa para a oposição às orientações de saúde pública, como o uso de máscaras, o distanciamento social e as vacinas. A crescente desinformação encorajou o desrespeito generalizado pelas medidas preventivas e levou ao aumento das taxas de infecção, hospitais sobrecarregados, escassez de profissionais de saúde, mortes evitáveis e perdas económicas.
Durante o período de um mês entre novembro e dezembro de 2021, foram notificadas mais de 692.000 hospitalizações evitáveis entre pacientes não vacinados, de acordo com um estudo de 2022 publicado no Yale Journal of Biology and Medicine. Só essas hospitalizações custaram espantosos 13,8 mil milhões de dólares.
No estudo, a equipe de Rho, incluindo o Ph.D. o estudante Xiaohan Ding desenvolveu uma técnica que treinou o chatbot GPT-4 para analisar postagens em vários grupos de discussão de subreddit proibidos que se opunham às medidas de prevenção do COVID-19. A equipe se concentrou no Reddit porque seus dados estavam disponíveis, disse Rho. Muitas outras plataformas de mídia social proibiram pesquisadores externos de usar seus dados. A pesquisa está publicada no arXiv servidor de pré-impressão.
O trabalho de Rho é baseado em uma estrutura de ciências sociais chamada Teoria Fuzzy Trace, iniciada por Valerie Reyna, professora de psicologia da Universidade Cornell e colaboradora deste projeto da Virginia Tech.
Reyna demonstrou que os indivíduos aprendem e recordam melhor a informação quando esta é expressa numa relação de causa e efeito, e não apenas como informação mecânica. Isto é válido mesmo que a informação seja imprecisa ou a conexão implícita seja fraca. Reyna chama essa construção de causa e efeito de “essência”.
Os pesquisadores trabalharam para responder quatro questões fundamentais relacionadas aos pontos essenciais nas redes sociais:
- Como podemos prever com eficiência os pontos essenciais do discurso das redes sociais em escala nacional?
- Que tipos de essências caracterizam como e por que as pessoas se opõem às práticas de saúde pública da COVID-19, e como essas essências evoluem ao longo do tempo em eventos importantes?
- Os padrões essenciais predizem significativamente os padrões de envolvimento online entre usuários em subreddits proibidos que se opõem às práticas de saúde da COVID-19?
- Os padrões essenciais predizem significativamente as tendências nos resultados nacionais de saúde?
O elo perdido
A equipe de Rho usou técnicas de prompts em grandes modelos de linguagem (LLMs) – um tipo de programa de inteligência artificial (IA) – junto com estatísticas avançadas para pesquisar e rastrear essas essências em grupos de subreddit banidos. O modelo comparou-os então com os marcos da COVID-19, tais como taxas de infecção, hospitalizações, mortes e anúncios de políticas públicas relacionados.
Os resultados mostram que, de facto, as publicações nas redes sociais que ligavam uma causa, como “Tomei a vacina contra a COVID”, a um efeito, como “Desde então, sinto-me como se estivesse a morrer”, rapidamente apareceram nas crenças das pessoas e afectaram suas decisões de saúde off-line. Na verdade, o total e os novos casos diários de COVID-19 nos EUA poderiam ser previstos de forma significativa pelo volume de informações essenciais sobre grupos de subreddit proibidos.
Esta é a primeira investigação em IA que liga empiricamente os padrões linguísticos das redes sociais às tendências de saúde pública do mundo real, destacando o potencial destes grandes modelos linguísticos para identificar padrões críticos de discussão online e apontar para estratégias de comunicação de saúde pública mais eficazes.
“Este estudo resolve um problema assustador: como conectar os blocos de construção cognitivos de significado que as pessoas realmente usam ao fluxo de informações através das mídias sociais e ao mundo dos resultados de saúde”, disse Reyna. “Esta estrutura LLM baseada em prompts que identifica pontos essenciais em escala tem muitas aplicações potenciais que podem promover melhor saúde e bem-estar.”
Big data, grande impacto
Rho disse que espera que este estudo encoraje outros pesquisadores a aplicar esses métodos em questões importantes. Para tanto, o código utilizado neste projeto será disponibilizado gratuitamente quando o artigo for publicado no Anais da Conferência da Associação de Máquinas de Computação sobre Fatores Humanos em Sistemas de Computação. O artigo também compara o custo de várias maneiras pelas quais os pesquisadores podem analisar grandes conjuntos de dados e extrair conclusões significativas a um custo menor. A equipe apresenta suas descobertas de 11 a 16 de maio em Honolulu, Havaí.
Fora da academia, Rho disse que espera que este trabalho incentive as plataformas de mídia social e outras partes interessadas a encontrar alternativas para excluir ou proibir grupos que discutem temas controversos.
“A simples proibição total de pessoas em comunidades online, especialmente em espaços onde já estão a trocar e a aprender informações sobre saúde, pode arriscar levá-las mais fundo em teorias da conspiração e forçá-las a plataformas que não moderam de todo o conteúdo”, disse Rho. “Espero que este estudo possa informar como as empresas de redes sociais trabalham lado a lado com as autoridades e organizações de saúde pública para melhor envolver e compreender o que se passa na mente do público durante as crises de saúde pública”.
Mais Informações:
Xiaohan Ding et al, Aproveitando grandes modelos de linguagem baseados em prompts: prevendo decisões e resultados de saúde pandêmicos por meio de linguagem de mídia social, arXiv (2024). DOI: 10.48550/arxiv.2403.00994
arXiv
Fornecido por Virginia Tech
Citação: Estudo rastreia uma epidemia de linguagem infecciosa (2024, 11 de maio) recuperada em 11 de maio de 2024 em https://medicalxpress.com/news/2024-05-infectious-language-epidemic.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.