时空大数据加速智慧城市落地—新闻

作者：贡晓丽来源：中国科学报发布时间：2017/12/7 10:18:28

选择字号：小中大

时空大数据加速智慧城市落地

■本报记者贡晓丽

近年来，全国乃至全世界都掀起了智慧城市建设热潮。图片来源：百度图片

近年来，全国乃至全世界都掀起了智慧城市建设热潮。有数据显示，全球智慧城市相关产业市场规模预计从2017年的4246.8亿美元增至2022年的12016.9亿美元，年复合增长率达23.1%。近日在乌镇举行的2017世界互联网大会上，亦有众多企业发布自己的智慧城市云解决方案。

智慧城市要解决的是日益凸显的交通拥堵、环境恶化、能耗增加等城市问题。“在人工智能时代，城市计算是解决城市问题的必然选择，也很可能是最好的路径。”微软亚洲研究院首席研究员郑宇在12月2日于北京举办的2017人工智能前沿应用与人才发展论坛上说。

据介绍，城市计算包括城市数据的感知和获取、数据的管理、数据的分析和挖掘以及数据的服务和提供。“这四个层面连成一个环路，不断地、自动地在不干扰人生活的情况下，用大数据解决城市的大挑战。”郑宇说。

城市计算，预测未来

城市计算是一个交叉学科，是计算机科学以城市为背景，跟城市规划、交通、能源、环境、社会学和经济等学科融合的新兴领域。更具体地说，城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战的过程。按郑宇所述：“城市计算能帮助我们理解各种城市现象的本质，甚至预测城市的未来。”

任何计算都要以数据为基础，但在数据的感知和获取环节则面临多重挑战。“我们拿到的数据往往只是一个采样，某些属性在这个采样上的分布跟它在整体数据上的分布有很大差异。”郑宇表示，数据是否具有代表性是需要考虑的第一个问题。其次，数据的有限性、易缺失、使用的准确性等，都是城市计算在感知层面的挑战。

“城市发展是从数字化到信息化再到智慧化递进的过程，数据是智慧的基础。”山东大学计算机与软件学院院长陈宝权指出，从众多候选集中选出所需要的数据很重要，可以解决很多实际问题，比如在城市区域内确定设立充电桩的位置，规划空气质量检测站点的设置等等。

为了进一步说明数据感知与获取对城市公共设施配置的重要性，郑宇展示了天津市的救护车站布局图，“以前选救护车站点基本就是根据人口数量或者道路房屋密度决定。但是人的急救需求的影响因素很复杂，我们可以根据真实的120求救信号数据和救护车抢救病人的GPS轨迹等数据对站点进行重新布局，以优化平均抢救时间。”郑宇说。

另外，救护车辆如何在各个站点之间动态调度，使得系统运力最大化是第二步需要解决的问题。“就是要找到一个使得很多人到此的汇聚时间最优化的点。”郑宇建议，所有以速度优先级最高的应用都可以考虑这个选址模型。

城市大数据平台发挥效力

未来的智慧城市应该什么样？陈宝权认为，智慧城市有两个层面的含义：一是宏观层面，城市总体资源的分配是智慧的，特别是基础设施能合理满足市民需求，比如交通设计能完全按照人流的需求来考虑；二是微观层面，智慧城市下人人都能享受到更加便利、高效、安全和环保的服务，生活舒适度不断提高。

要达到以上目标，数据的管理不可或缺。城市中所有数据根据结构可分为两种：点数据与网络结构数据。一旦建成后任何属性都不会变动的是空间和时间都静态的点数据；位置不变，但是每个小时的读数不断变化的是空间不变但是时间属性在不停变化的结构数据。

“在摩拜单车使用中，不同时间有不同的人在不同地方发出请求，这就是一个时空多变的数据；网络结构中，路网就是一个静态的网络结构，把路网叠加了交通流量信息以后就变成空间不变、时间变化的数据。”郑宇说，最复杂的是轨迹数据，时间和空间都在变，并且点和点之间有连续的关系。

“定义好这些数据结构模型以后，我们就可以针对特定的模型设计特定的算法，提高系统的利用率。”郑宇说，“我们是给整个城市提供服务，对整个城域作推断、预测，运算量非常大，而且要求实时。因此，数据和应用之间就需要一个平台来连接。”

“很遗憾现在任何一家公司的云计算平台都不能很好地支持我们的时空大数据。”郑宇坦言，“城市大数据平台并不是云计算平台，后者并不能很好地支持上述运算。”

而郑宇主导的在贵阳落地的第一个城市大数据平台，把分布式计算环境跟索引方法结合在一起，可以使算法完成时间从几个小时变成几秒钟，“这就是平台强大的力量。”郑宇说。

把握时空数据

“城市计算处理的是时空数据，它跟视频、图像、语音是不同的。这也导致传统的深度学习模型不能直接拿来用。”郑宇解释说，时空数据有空间属性和时间属性，时间属性又包括时间的平滑性、周期性和趋势性。

据介绍，数据的应用是首先把相邻几个小时的数据放到一个深度卷积神经网络里面，来模拟相邻时间的时序的平滑性。然后把几天内同一时刻对应的数据输入到相同结构的深度卷积神经网络，来模拟周期性。再输入更大时间范围内同一时间点对应的数据，来模拟趋势性。因为三个因素的输出结果并不是在每个地方都一样，因此三个数据要先做融合，并引入权重系数。

其次需要考虑外部的因素，比如气象事件，把所有数据融合以后，再去反馈学习下一帧的数据，进而预测下一帧这个时刻的状况。郑宇解释说，卷积网络通过一次卷积可以把一个区域的值卷积到一个点上面，描述近距离的空间的局部相关性。经过多次卷积以后可以把越来越远的地方卷积到一起，描述距离较远的空间的相关性，当深度卷积网络比较深的时候它的训练效果就会变差。

为了解决这一问题，微软研究院引入深度残差神经网络，整个架构称为时空残差网络。“这个比较新的模型相对于以前LSTM的模型，不需要进行连续的数据输入，只需要抽取关键帧。”郑宇介绍说，这样的结构大大优化了网络结构，只需要用几十帧就能达到原先模型里几百帧、几千帧的效果，甚至更好。他表示，这种深度时空残差网络，在人口流动的预测上将会有很大的应用前景。

“随着人工智能能够完成的复杂任务越来越多，人们会越来越感受到其存在，享受更多的福利。”陈宝权说。

《中国科学报》 (2017-12-07 第6版前沿)

以下评论只代表网友个人观点，不代表科学网观点。

�� SSI �ļ�ʱ��

编辑部推荐博文
研究生迷茫常见原因及应对之策用量子精度解开手性分子的秘密蚁鴷来了（Wrynecks have arrived）读《教育家》8月份的三期杂志人机与均值、方差受控环境园艺：室内种植与新栽培技术更多>>