Autores:
(1) Utkucan Balci, Universidade de Binghamton, Estados Unidos;
(2) Michael Sirivianos, Universidade de Tecnologia de Chipre, Chipre;
(3) Jeremy Blackburn, Universidade de Binghamton, Estados Unidos.
Tabela de links
Resumo e 1 Introdução
2 Antecedentes e trabalho relacionado
3 dados
3.1 Identificando subredits tankie
3.2 Identificando subreditits de ideologia e 3.3 Coleção de postagem
4 Análise de Base de Usuário e 4,1 Construção de Gráficos e Detecção Comunitária
4.2 Crescimento da comunidade
4.3 Migrações de usuário ao longo do tempo
5 Análise de conteúdo e 5.1 Sobre o que os Tankies falam?
5.2 De quem são Tankies falando?
5.3 Análise de desalinhamento
5.4 Análise de toxicidade
5.5 Análise de domínio
5.6 Análise de Lemmygrad
6 Discussão e conclusão e 6,1 limitações
6.2 Implicações e trabalho futuro e referências
A dados
B entidades nomeadas
C Análise de desalinhamento
D Análise de domínio
5.4 Análise de toxicidade
Nesta seção, usamos modelos de API em perspectiva para comparar o comportamento on-line dos tanques e outras comunidades de extrema esquerda.
API em perspectiva. A API de perspectiva [92] é um amplamente utilizado [9, 12, 26] ferramenta para medir a toxicidade. Embora tenha limitações, por exemplo, há questões de preconceito e questões de desempenho ao encontrar padrões de conversação em que ele não foi treinado; em escala, fornece uma medida decente para comparação entre as comunidades on -line. A API fornece seis modelos de produção: 1) Toxicidade, 2) Severe_toxicity, 3) Insulto, 4) Ameaça Identity_attack, 5) e 6) palavrões (ver ver [91] Para detalhes completos sobre os modelos). Consideramos um limiar de 0,8, definido como “alto” para os escores graves_toxicidade de Hoseini et al. [57]. Para ter uma linha de base para as comparações, amostramos 0,5% das postagens do Reddit durante a linha do tempo do conjunto de dados, que é responsável por mais de 36 m de postagens.
Resultados. A Figura 5 mostra as funções de distribuição cumulativa (CDFs) para cada modelo dentro do cluster de extrema esquerda. Nossa análise revela que os Tankies tendem a ter pontuações mais altas do que outras comunidades de Farleft (excluindo R/Alltheleft) para todos os modelos de API em perspectiva. Além disso, todas as comunidades de extrema esquerda têm pontuações de API em perspectiva mais altas do que a amostra do Reddit da linha de base.
Especificamente, os tanques têm a maior proporção para escores ≥ 0,5 e pontuações altas (ou seja, escores ≥ 0,8) para identidade_attack e ameaça, e o segundo maior para os modelos restantes. A Tabela 5 mostra que os Tankies têm quase o dobro de pontuações altas do que a média de outras comunidades de extrema esquerda.
Confirmamos que as distribuições de pontuação para cada modelo são significativamente diferentes entre os tankies e outras comunidades de extrema esquerda usando um teste KS de 2 amostras (𝑝 <0,01 para todos após o ajuste para testes múltiplos usando o método Benjamini-Hochberg). Esses resultados indicam que os tanques tendem a fazer postes com níveis mais altos de toxicidade, insulto e palavrões em comparação com outras comunidades de extrema esquerda, excluindo R/Alltheleft. Os tanques também tendem a fazer postes com mais ataques e ameaças de identidade do que todas as outras comunidades de extrema esquerda.
Em seguida, examinamos as entidades nomeadas nas postagens dos Tankies com pontuações de API de alta perspectiva, removendo as entidades nomeadas que aparecem menos de 100 vezes. Na Tabela 6, apresentamos as 10 principais entidades nomeadas classificadas pela fração de postos que mencionam a entidade e pontuam altos em todos os modelos de perspectiva. Para todos os modelos, exceto identity_attack, as entidades nomeadas mais mencionadas estão principalmente relacionadas aos EUA (por exemplo, Amerikkans, Yankee, Charlotte, Qanon),
Figuras públicas e políticos (por exemplo, John Oliver, Elon Musk, Kyle Rittenhouse, Anthony Blinken, Erdogan, Alex Jones, Joe Rogan) ou países/nacionalidades (por exemplo, chechenos, Brasil, Iraques). Para o modelo Identity_attack, as entidades nomeadas mais frequentemente mencionadas são tipicamente grupos étnicos ou religiosos. Os tanques parecem atingir principalmente muçulmanos e judeus, com 41,80% e 34,03% dos postos que mencionam esses grupos com altas pontuações de identidade_ATTACK; A maior proporção de altas pontuações de identidade para muçulmanos e judeus de qualquer comunidade de extrema esquerda que analisamos. Além disso, observamos que os tanques atacam as identidades de asiáticos, árabes, hindus, mexicanos, africanos e brancos em mais de 20% de postos mencionando essas identidades.
Takeaways. Nossa análise mostra que os tanques têm a maior proporção de pontuações altas para identidade_attack e ameaça entre comunidades de extrema esquerda, e eles têm a segunda maior proporção de pontuações altas para toxicidade, severo_toxicidade, palavrões e insultos, por trás do r/alltheft. Embora nossas descobertas indiquem que a política dos EUA não é o foco principal dos tanques, eles ainda expressam opiniões fortes sobre eventos relacionados aos EUA, teorias da conspiração, políticos e figuras públicas. Finalmente, observamos que os tanques freqüentemente visam muçulmanos e judeus em seus posts.