图片:flickr/steevithak有没有想过一个 Twitter 帐户是由真人还是机器人运行的?这些英国科学家也想知道,他们开发了一种区分两者的方法。 在这项研究中,作者使用贝叶斯统计来区分人类、公司和机器人 Twitter 帐户,主要使用推文时间。 他们发现机器人帐户全天发布更一致,而人类帐户则表现出更多与日常活动相对应的高峰和低谷。 特别是,人们会在中午左右停止发推文,并在晚上 9 点左右达到 Twitter 狂热高峰。 因此,如果您希望您的 Twitter 机器人看起来更像人类,请给它一个午休时间。人类广播传播的缩放规律能够区分人类、公司和机器人 Twitter 用户“人类行为本质上高度个性化,但正在出现似乎控制人类集体行为的统计结构。 在这里,我们寻找支配人类在沟通决策中行动时间的通用统计规律。 我们专注于人类广播沟通中消息之间的时间间隔的分布,如 Twitter 中记录的那样,并研究了三个用户类别的超过 160,000 条推文:个人(由一个人控制)、托管(通常由公关机构控制)和机器人控制(自动化系统)。 为了验证我们的假设,我们调查是否可以根据推文时间行为来区分用户类型,而与消息中的内容无关。 为此,我们开发了一个系统来处理大量推文以进行现实挖掘,并实现了两种简单的概率推理算法:1. 一个朴素贝叶斯分类器,它区分两个和三个帐户类别,分类性能分别为 84.6% 和 75.8%;以及 2. 一种预测算法,用于估计用户下一次发推文的时间,R^2=0.7。 我们的结果表明,我们可以可靠地区分这三个用户类别,并以合理的准确度预测用户消息间时间分布。 更重要的是,我们发现人类用户消息间时间分布的尾部具有特征性的幂律下降,这与托管和自动化帐户获得的结果不同。 该结果证明了一种通用规律,该规律渗透到人类在广播通信中的决策时间,并扩展了先前对点对点通信的几项研究的发现。” 完整文本的额外引述:“我们可以观察到,个人帐户的推文活动水平随着时间的推移而增加,在晚上 9 点达到顶峰。托管帐户倾向于在工作时间内,即上午 9 点到下午 6 点之间发布更多推文。 分布在中午 12 点的下降可能可以用午休时间来解释。 最后,机器人控制帐户的分布表现出各种峰值,这可能是因为它们的行为与结构化的日常活动无关。”















