自6月11日北京新发地发生聚集性疫情,到7月20日,仅仅34天,北京新冠肺炎疫情防控从二级调至三级。11229人解除集中医学观察、超1100万人次完成核酸检测。
首都安澜,大数据人工智能(AI)技术功不可没。拥有2100多万人口的超大型国际化大都市,利用大数据快速锁定病例行动轨迹,圈定密切接触者等高风险人群,对于预警管控,迅速切断传播渠道至关重要。
大数据人工智能是如何“参战”的,如何在战“疫”中守护隐私,对于不断突发的“疫情”,大数据人工智能还应如何“乘风破浪”做得更好?不久前,参与北京战“疫”的专家汇聚2020北京智源大会,揭开了这场战“疫”背后的神秘面纱。
精准画像,“一个都不能少”
新冠病毒极其狡猾,必须“快、准、狠”地切断传播渠道。每一点迟疑和遗漏,都将影响整个抗“疫”的进程,高风险人群的筛定,必须做到“一个都不能少”。
早在今年1月份疫情发生以来,北京AI疫情追踪项目迅速启动,中国人民大学高瓴人工智能学院院长文继荣教授团队参与建立了新冠病毒肺炎防控智能追踪服务系统。
“我们必须通过大数据把确诊人员的行动轨迹全部刻画出来,每一处遗漏都是隐患。这个过程非常复杂,但参与人员的通力合作也令人感动。” 文继荣说。
文继荣介绍,疫情追踪分为四部分。首先需要多家互联网企业合作,进行重点疫区14日内互动态势分析。其次要根据确诊人员信息,结合互联网企业上报的“信息点”(POI)等信息,将多个互联网渠道提供的确诊人员活动轨迹进行整合和串并分析,然后绘制确诊人员的活动圈。
接下来,要根据确诊人员的活动轨迹图,结合互联网公司等收集的确诊人员近距离接触信息,筛查出密切接触风险人员及其活动轨迹。最后综合分析这些传染风险人员的活动行为,评估传染风险人员的风险度,为疫情分析、防控和预警提供支持。
疫情防控取得一定胜利后,复工复产成为迫切的问题,然而,楼宇内的一些隔离措施成为阻碍复工复产的重要原因。“楼宇内GPS信号弱,人员的行动轨迹无法确定,一人确诊,整体封楼这种粗放式的隔离方式不太合理,严重影响整个社会的复工复产节奏。”文继荣说。
为了开展更科学、更智能、更精准的疫情防控和人员隔离,“疫情实时风险预警系统”上线。它基于蓝牙、局域网信号、气压计等信号,引进智能算法进行时空轨迹数据分析,研究人群时空轨迹,追溯近距离接触人员,做到智能防控,精准隔离,有效降低隔离成本,护航复工复产。
处理大量、片段化的冗杂数据是开展疫情大数据分析的重要一环。文继荣介绍:“人们的轨迹数据分布在多个互联网公司系统中,每个系统只能捕捉人的片段化的数据,比如打车、地图、购物等大数据都在相应的不同运营商手中。为了全面刻画人物行动轨迹,就需要做轨迹拼接,采用分布式的计算框架寻找密切接触者,这需要大家共同协作。“
对于能否将所有数据拿来统一分析,文继荣认为:“这个方法不太现实。集中进行数据分析需要非常大的算力,这需要几千甚至几万台服务器。此外,集中管理数据容易引发商业隐私等方面的问题。”
公共利益和隐私保护“谐振”
隐私作为一个相对的概念,一直是AI发展的短板。中国工程院院士高文认为:“第一,各家应该努力去寻找最好的技术,让隐私得到最好的保护。第二,根据我国技术和社会发展现状,如果想让技术和社会和谐快速发展,隐私得到很好的保护,诚信非常重要。”
随着新冠疫情逐渐威胁人类生存,危害人们公共利益时,隐私保护应该做出让步吗?
“完全的隐私保护是不可能的。” 文继荣说,“当今世界正在从物理世界走向数字世界,随着跟踪设备和数据收集的增加,以及数据处理能力的强化,隐私保护的问题不可避免,也将越来越严重。”
在文继荣看来,东西方看待隐私保护的观点是不同的。“中国、美国、欧洲的观点具有不同的代表性。欧洲基于原有价值观出台了非常严格的标准,是隐私保护的“保守派”,中国属于‘改革派’,而美国属于‘中间派’。”
文继荣认为,不同国家或地区隐私保护态度不同,实际上反应了集体主义和个人主义的文化观念差异。“我国强调集体主义,因此民众在面对公共利益受到威胁时,对让渡隐私保护的接受度较高,这也促进了我国数字经济和产业经济的发展,因此我国数字化浪潮不可避免。”
北京大学副教授边凯归对此表示认同:“我国民众在配合政府利用个人数据方面的配合度很高,而一些西方国家的民众在这方面的配合度相对较低,这也导致国外疫情防控出现了诸多问题。当然,我们也已经在不断迭代技术方案,尽量保护数据隐私。”
“我们在鼓励使用数据进行创新和促进社会发展的同时,也应该公开讨论隐私保护的风险和问题,探讨从技术、政策等方面如何可以做得更好。”文继荣说,“为保证数据安全可靠,可以建立数据分级分类管理机制、数据加密机制、关键数据传输协议及安全通道建设。”
中国科学院院士张钹也认为中西方存在隐私保护的差异。“我国隐私保护的核心问题是不滥用个人信息。避免滥用需要两个方面,一方面是制定法律、规则,限制滥用行为;另一方面是发展安全、可靠、可信赖、可扩展的AI技术。”张钹说。
对于西方部分国家过度严格保护数据隐私,希望通过“群体免疫”达到抗“疫”目的的行为,北京大学公共卫生学院教授宁毅从医学角度解释道:“真正建立自然状态下的群体免疫,即使达到很高的群体免疫水平,随着部分人员的死亡和新生儿的出生,群体免疫的屏障也会逐步减弱。群体免疫减弱后还会来一波新的爆发。群体免疫即使在未来要维持,也是通过爆发来维持。”
平战结合,“数战数决”
2003年SARS,2009年H1N1流感,2014年西非埃博拉病毒疫情,2015年寨卡病毒疫情……2020年新冠肺炎疫情。突然性高传染的病毒疫情等重大突发公共卫生事件一直是现代国际社会面临的共同难题。面对下一次疫情,大数据可以被利用的更好吗?
精鼎医药亚太区真实数据负责人冯胜参与了新冠临床试验数据分析工作,他回忆道:“很多数据处于零散阶段,是疫情期间大数据利用的一个重要问题。”
文继荣也认为这种“数据孤岛”应该被打通,“与公共卫生事件相关的很多数据散落在各个政府部门、互联网、电信运营商、物流等企业,以及民航、高铁、公交车、网约车等公共出行系统中,未能得到有效汇总和利用。”
此外,文继荣还提出:“数据动态性、安全性和决策的及时性,都是疫情期间大数据发挥作用受到制约的地方。”
为打造重大突发公共卫生事件大数据服务平台,文继荣认为,首先要实现公共信息互通共享,打破各部门“信息孤岛”,实现计算、数据等资源完全共享,形成统一的数据标准、数据对策模块化。其次要适应数据海量增长,有效满足需求,提供充足资源。此外要实施精确的数据分析和智能决策,探索国家突发公共卫生事件的预警模型,建立突发公共卫生事件的数字信息预警体系。
当前疫情还未获全胜,如何运用大数据服务突发公共卫生事件,是摆在国家、乃至世界面前需要长远考虑的“必答卷“。
“要通过‘平战结合’的思路,建立多种数据采集渠道,围绕相关关键数据的采、治、用、管、研,建立应对公共卫生事件和应急事件的完善系统和规范工作流程。”文继荣表示。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。