追踪移民是一项艰巨的任务,政策制定者、研究人员和人道主义组织长期以来一直为此苦苦挣扎。他们使用的数据常常过时、不完整且不一致,这阻碍了他们理解人口流动并有效应对全球危机和经济变化的努力。
现在,这种情况有望改变,这得益于 Menlo Park 的 Facebook 母公司 Meta 的 Guanghua Chi 和同事们的工作。他们利用来自三亿 Facebook 用户匿名数据,估算了 181 个国家每月的人口流动情况。
“我们的估计与现有高质量的移民数据非常吻合,而且几乎可以覆盖全球,比其他方法更及时,”他们表示。
全球迁徙
该团队要解决的问题表述简单,但难以解决:要准确地、近乎实时地、在全球范围内测量人口的长期流动。传统方法依赖于人口普查或行政记录,这些记录在各国收集的频率和一致性往往不规则。一些近期的创新已经利用了手机数据或社交媒体帖子,但这些努力通常在地理范围上受到限制。基于 Facebook 的方法绕过了这些限制,为衡量人口流动设定了新的标准。
他们的方法采用了联合国推荐的移民定义,只计算在新的国家定居至少一年的人。该团队首先根据用户自我报告的位置和 IP 地址等信号,预测每个用户的家乡国家。然后,他们检测居住地的长期变化,并应用了一个基于片段的算法,该算法旨在最大限度地减少噪音并最大限度地与标准的移民定义保持一致。在识别出移民事件后,他们将它们按月汇总,并对数据进行加权,以反映人口层面的流动。
当然,Facebook 用户并不能完全代表全球人口。例如,在欠发达国家,富裕人群往往更可能使用 Facebook,也更可能移民。
为了解决这个问题,研究人员开发了一个加权系统来纠正这些不平衡。他们的选择模型考虑了国家层面的 Facebook 使用率和收入水平,通过调整原始计数来更好地反映人口层面的移民流动。最后,他们添加了少量的统计噪音,以保护个人用户的隐私,同时保留整体趋势。
这种调整确保了由此产生的移民数据能够反映现实世界的流动,而不是社交媒体使用习惯的怪癖。“我们的估计比现有数据有了显著改进,通过利用超过 30 亿人的数据,我们可以估算 181 个国家之间每月的移民流动,”研究人员说。
为了验证他们的方法,Chi 和同事们将他们的估计与来自不同国家和地区的、高质量的官方统计数据进行了比较。例如,在与新西兰的移民统计数据进行基准测试时,他们的模型取得了近乎完美的结果,相关性为 0.98。
他们的数据揭示了有趣的趋势。2022 年,他们估计在研究涵盖的 181 个国家中,有 3910 万人进行了国际移民,占样本人口的约 0.63%。美国是全球净移民增长最多的国家,净迁入 392 万人(841,200 名移出者对 4,109,400 名移入者)。而乌克兰则遭受了最大的净损失,达到 234 万人(66,600 名移入者对 2,402,100 名移出者)。
在 COVID-19 大流行期间,全球移民因广泛的旅行限制而下降了 64%,但在 2022 年已反弹至比大流行前水平高出 24% 的水平。
危机捕捉
这些数据还生动地捕捉到了地缘政治危机的社会后果。在俄罗斯于 2022 年 2 月入侵乌克兰后,乌克兰的移民数量比战前水平激增了十倍,截至 2022 年 12 月,估计有 230 万人移居他国至少一年。确定的主要目的地——波兰、德国、捷克共和国、美国和英国——与难民署的数字非常吻合,尽管研究团队指出,他们更严格的移民定义导致的人数比纯粹基于难民登记或临时保护身份的数字要少。
在香港于 2020 年通过一项有争议的安全法(之后移居英国的人数激增了十五倍)以及缅甸于 2021 年发生政变后,也观察到了类似的激增。“我们观察到,危机可能导致移民发生剧烈变化,”研究人员说,并强调了他们数据集在追踪全球事件实时反应方面的作用。
有趣的是,研究团队发现移民模式反映了经济差距和社会网络。富裕国家吸引了不成比例的移民,而邻国之间的移民远比远距离国家之间更普遍。“距离是国家间移民率的一个重要预测因素,”他们指出,并强调了邻近性、经济机会和现有侨民社区共同塑造了全球移民流动。
移民也倾向于呈现阶梯式模式:来自贫穷国家的移民移居到中等收入国家,然后从中等收入国家移居到富裕国家。
这是一项重要的工作,具有广泛的应用前景。实时、高分辨率的移民数据可以改变从经济学、社会学到灾难响应和城市规划等各个领域。政府应该能够更好地制定移民政策,人道主义组织能够更快地应对危机,研究人员可以建立更准确的人口流动模型。
为此,该团队正通过人道主义数据交换(Humanitarian Data Exchange)公开其数据集,确保未来工作的广泛获取。这是其他全球科技公司应效仿的透明度典范。科技公司正在编译的海量全球数据库中,显然存在许多唾手可得的宝藏。它们如何发布这些数据,以及是否发布,都应该成为公众辩论的一部分。
参考:使用在线数据测量全球移民流动:arxiv.org/abs/2504.11691
《纽约时报》也发布了一个可视化这些数据的交互式工具。














