美国人口普查积弊已久,AI 有望抹平数字鸿沟

发稿时间: 2022-06-06 09:05 来源:中国电信业 作者: 李白咏 2022-06-06
分享X

作为发达国家的美国,10年一次的例行人口普查面临压缩成本的压力,政府和外包企业希望借助人工智能(AI)的神奇功效来应对相关挑战。此外,在非洲一些国家,AI在人口普查中发挥出前所未有的作用,甚至帮助一些国家完成数十年来首次人口普查。AI能否成为一剂解决全球范围内人口普查困局的“灵丹妙药”?美国知名媒体《连线》(Wired)近期在其网站发布了一篇题为“AI能否挽救人口普查败局”(The Census Is Broken. Can AI Fix It?)的文章,给这一问题提供了一个有趣的视角。

即使采用了机器学习技术,传统的人口普查员上门拜访仍有其不可替代性。卫星图像技术从太空拍摄地球表面的照片,可谓名副其实的“高”科技。使用AI 对卫星图像进行分析,从而获取和更新用于发送人口普查表格或相关通知的住房地址,这一做法的弊端在于无法揭示单个建筑物内部发生的情况。例如,业主或住户可以在建筑物内部将两个单元分隔成四个单元,此类操作不会留下任何书面记录,除非派遣工作人员上门拜访,否则难以从外部对其进行确认。

格雷格·耶特曼(Greg Yetman)是哥伦比亚大学气候学院国际地球科学信息网络中心(CIESIN)的联合主任。作为与NASA 合作项目的一部分,CIESIN 自20 世纪90 年代初以来一直在探索通过观测地球来提供社会经济数据的方法。例如,对于纽约市皇后区的居民来说,住在地下室公寓是很常见的情况,而随着生活成本的攀升,业主或住户更有可能对公寓进行改造或者转租,未登记的居住点也会越来越多,不论是人口普查还是卫星图像,通常都很难将此类情况记录在案。同时,如果一个人没有固定住所或者几乎没有留下过财务记录,那他很可能不会出现在私人供应商所收集的位置共享数据中,也更有可能在人口普查中被“遗漏”。

美国的人口普查虽然面临越来越大的预算压力,其现代化也还有改进的空间,但至少该国宪法要求每10 年进行一次,相比之下,一些发展中国家可能几十年来都没有进行过详细的人口普查。此外,成本考量、利益冲突或地处偏远等障碍,都会使一些社区难以被纳入人口普查统计之中。

2017年,尼日利亚政府、CIESIN 等机构与比尔和梅林达盖茨基金会(Bill&MelindaGates Foundation)合作使用卫星图像和机器学习技术绘制了该国的人口分布图,用以进行麻疹疫苗接种。目前这个名为“Grid3”的项目已经推广到了另外五个非洲国家,但技术只是解决方案的一部分,在将机器学习应用于卫星图像之后,还是需要进行社区调查,通过与人直接触数来验证相关结论。

2022年3月发表的一项研究显示,卫星图像和机器学习被用于自动识别刚果民主共和国西部五省份的住房地块,并预测人口数量、年龄和性别。金沙萨公共卫生学院、加利福尼亚大学、洛杉矶公共卫生学院对近80000人进行了匿名调查,以验证深度学习模型的性能,该模型达到了80%的准确度。需要强调的是,刚果民主共和国自1984年以来就没有进行过全国人口普查。

AI虽然功能强大,但绝非包治百病的灵丹妙药,世界上没有一种能适用于所有场景的AI 模型。格雷格·耶特曼指出,用于识别连片建筑物的深度学习算法模型常常无法区分一个屋顶的尽头和另一个屋顶的起点。以美国为例,如果将AI模型应用于东海岸的住宅,那么使用美国西部屋顶图像训练的AI 模型就会出错,因为美国西部的社区在扩张时遵循基于网格的系统,而波士顿等东部城市的发展则不那么统一。同理,南非的屋顶和赞比亚的屋顶在外观上明显不同,AI很容易将加纳首都阿克拉商业市场中摊位的屋顶误认为是居民房屋的屋顶,更难以准确预测城市住宅区或农村的人口数量。根据来自麻省理工学院、明尼苏达大学和阿肯色大学的研究人员的2021 年进行的一项分析,利用卫星图像进行人口预测的深度学习模型往往倾向于高估农村人口的规模,同时低估城市人口的规模,其原因可能是AI 算法很难从太空中拍摄的照片上识别出建筑物的高度信息。

为了改善AI在人口普查中的应用效果,其中一条路径是让AI生成通常需要挨家挨户进行社区调查才能收集到的数据。位于美国加利福尼亚州的伯克利大学正在开发一款通用的AI模型,能够识别森林覆盖率、道路长度、预测海拔高度甚至房价高低等。为了测试该模型的局限性,去年夏天,研究人员试图重现美国人口统计局每年进行的“美国社区调查”(AmericanCommunity Survey)的部分内容。该模型预测人口密度和家庭收入的准确率超过50%。这一数字听起来可能并不高, 但获得该结果只花了一名研究生一周的时间,而上一次美国人口普查的花费高达140 亿美元,需要数十万人参与其中,可见AI 在降低人口普查成本方面前景广阔。

狮子搏兔,亦用全力。人口普查结果是进行社会治理的根本依据之一,是掌握国情国力的重要手段。AI 当然不是包治百病的灵丹妙药,但其神奇之处在于能够为包括人口普查在内的各种难题提供全新的解决方案,甚至有望从更高维度抹平数字鸿沟,关键在于AI模型能否经得起实践的检验。

新闻附件:

相关新闻