- O Twitter publicou uma atualização sobre sua abordagem de moderação “Liberdade de expressão não é alcance” e afirma ter visto resultados encorajadores.
- A empresa limitou o alcance de tweets que violam sua política de conduta odiosa e aplicou um rótulo a eles que informa: “Visibilidade limitada: este tweet pode violar as regras do Twitter contra conduta odiosa”.
- O rótulo reduz o alcance de um post em 81%, limitando efetivamente a visibilidade de posts que potencialmente exibem conduta odiosa.
O Twitter publicou uma atualização sobre como sua abordagem de moderação “Liberdade de Expressão Não é Alcance” está funcionando e, de acordo com a empresa, tem visto alguns resultados encorajadores. Em abril, o site começou a limitar o alcance de tweets que violam sua política de conduta odiosa e aplicou um rótulo a eles que informa: “Visibilidade limitada: este tweet pode violar as regras do Twitter contra conduta odiosa”. Aparentemente, o Twitter aplicou o rótulo em mais de 700.000 postagens desde então e proativamente impediu que anúncios aparecessem ao lado desse conteúdo.
A empresa também afirmou que o rótulo reduz o alcance de um post em 81%, limitando efetivamente a visibilidade de posts que potencialmente exibem conduta odiosa. Além disso, o Twitter revelou em sua atualização que mais de um terço dos usuários optam por excluir os tweets rotulados por si próprios assim que são notificados de que violaram a política do site e apenas 4% dos autores apelaram contra os rótulos.
A empresa cobrando pelo acesso à API significa que a maioria dos pesquisadores que estudam discurso de ódio não pode verificar independentemente essas alegações. Mas o Twitter está claramente afirmando que sua abordagem tem sido eficaz até agora. Na verdade, o site está avançando com seu plano de expandir seus rótulos e incluir mais tipos de violações de política. De acordo com seu anúncio, agora também rotulará e rebaixará postagens que violam suas políticas de comportamento abusivo e discurso violento. Tweets que serão rotulados nas próximas semanas incluem postagens com conteúdo malicioso direcionado a indivíduos, aqueles que incentivam outros a assediar um indivíduo ou grupo de pessoas, aqueles que ameaçam infligir danos físicos a outros e tweets que incentivam outros a cometer atos de violência ou dano.
Permanecemos comprometidos em manter a liberdade de expressão no Twitter, ao mesmo tempo em que mantemos a saúde de nossa plataforma. Hoje, mais de 99,99% das impressões de tweets são de conteúdo saudável ou conteúdo que não viola nossas regras. Leia mais sobre nosso progresso em nossa aplicação de regras e política de moderação em @TwitterSafety.