谷歌地图能揭示更多社会和人口信息。图片来源:iStock.com/BanksPhotos
你们城市有多少人投票支持巴拉克·奥巴马?多少人拥有大学学位?每个人赚多少钱?如果没有谷歌地图,收集这些数据可能需要几年时间。
在一项新研究中,研究人员下载了5000万张由该科技公司的交通工具拍摄的街景照片,基于此谷歌绘制了美国200个城市的地图。然后,研究人员使用了一些机器学习算法——能从范例中学习的软件工具——来确定图像中2200万辆汽车的分布、样式和生产年份。(该算法能以52%的准确率进行分类和建模。)
从这一点上,其他算法可以通过了解某些车辆类型在人口普查和选举数据显示的地区分布情况来估计当地人口统计数据资料,例如更富有或更保守的地区。
结果显示,这种算法在确定该地区家庭收入中值;白人、黑人和亚裔的比例;受教育程度不同的人的比例,以及2008年奥巴马与约翰·麦凯恩竞选总统时各自的支持率等方面出人意料地准确。近日,研究人员在美国《国家科学院院刊》上发表了一份研究报告。
研究人员还将汽车数据与实际人口统计数据进行比较,并发现了一些有趣的模式。例如,与皮卡车相比有更多的轿车的选区中有88%支持奥巴马,相反,皮卡车多的选区中有82%的更偏爱麦凯恩。
此外,研究人员还注意到,在未来,自动驾驶汽车上的摄像头可以增加数据收集的便利和频率,帮助决策者获得几乎实时的图像,以更好地了解劳动力和住房供应,从而为道路和学校分配资源,并为紧急情况制定计划。(张章)
更多阅读
《科学》相关文章(英文)