快速识别推特巨魔的新颖策略

发布时间: 2020-08-19 17:27:26 来源:

两种解决重复单词和单词对独特使用的算法,需要多达50条推文才能准确地区分公众人物发布的欺骗性“巨魔”消息。德国耶拿(Jena)的弗里德里希·席勒大学(Friedrich Schiller University)的谢尔盖·莫纳霍夫(Sergei Monakhov)在2020年8月12日的开放获取期刊PLOS ONE中介绍了这些发现。

巨魔互联网消息旨在实现特定目的,同时也掩盖了该目的。例如,在2018年,有13名俄罗斯国民被指控使用虚假人物通过社交媒体帖子干扰2016年美国总统大选。尽管先前的研究调查了巨魔推文的显着特征-例如时间,主题标签和地理位置-但很少有研究研究推文本身的语言特征。

Monakhov采取了一种社会语言学的方法,侧重于这样的想法,即巨魔只能传达有限的信息,但必须多次这样做,并且要有足够的措辞和主题来欺骗读者。通过使用俄罗斯巨魔推文和美国国会议员的真实推文库,莫纳霍夫发现,这些巨魔特定的限制导致重复单词和单词对的独特模式与真实的非魔幻推文中的模式不同。

然后,莫纳霍夫(Monakhov)测试了一种算法,该算法使用这些独特的模式来区分真正的推文和巨魔推文。他发现,该算法仅需要50条推文即可准确识别与国会议员之间的巨魔。他还发现,该算法正确地将巨魔推文与唐纳德·特朗普的推文区分开来。根据推特的说法,尽管这些推文具有挑衅性和“潜在的误导性”,但并未掩饰其目的。

这种快速识别巨魔推文的新策略可能有助于在保持言论自由的同时,为打击混合战争提供信息。需要进一步的研究来确定它是否可以准确地将巨魔推文与公众人物未发布的其他类型的消息区分开。

莫纳霍夫补充说:“尽管人们通常认为巨魔写作中经常会出现反复出现的信息,但其最典型的特征是重复单词和单词对的反常分布。使用比例的比例作为定量度量,一个单词需要少至50用于识别互联网巨魔帐户的推文。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。
Top