论文标题:Rehearsal: learning from prediction to decision(主编视点:排演——从预测到决策)
期刊:Frontiers of Computer Science
作者:Zhi-Hua ZHOU
发表时间:15 Aug 2022
DOI:10.1007/s11704-022-2900-0
微信链接:点击此处阅读微信文章
导读
本期FCS Perspective栏目,特邀FCS主编、南京大学周志华教授的观点分享——Rehearsal: learning from prediction to decision。该文发表在Frontiers of Computer Science期刊2022年第4期(了解原文详情请点击左下方“阅读原文”)。为帮助读者更精准地理解这篇文章,对该文进行了翻译,以飨读者。
作者简介
周志华,南京大学计算机系主任兼人工智能学院院长、计算机软件新技术国家重点实验室常务副主任、校学术委员会委员。欧洲科学院院士。ACM、AAAI、IEEE等的Fellow。主要研究方向为人工智能、机器学习、数据挖掘,曾获两次国家自然科学二等奖、IEEE计算机学会Edward J. McCluskey技术成就奖等。
Frontiers of Computer Science, 2022, 16(4): 164352
https://doi.org/10.1007/s11704-022-2900-0
排演:从预测到决策
周志华 | 南京大学
背景
机器学习的研究工作主要集中在预测上,即从一组观测数据中构建学习模型实现对未见示例的精准预测。虽然诸如开放环境机器学习等问题依然有待进一步研究,深度学习等现代机器学习技术大体上已能较好地解决未见示例的预测问题。
那么,机器学习的下一步研究方向是什么呢?
观点
考虑下述情况:假设一个非常强大的机器学习模型预测“我们不希望的事件”将会发生,我们能否根据预测结果做出决策,以采取一些行动来避免“不希望事件”的发生呢?比如,一位先生根据上个月的油价、当地的交通信息、国际新闻信息等数据训练了一个学习模型。今天他的模型预测出下个月的通勤支出将急剧增加,这一结果是他不希望的。经过深思熟虑,这位先生决定从下周开始乘坐公共汽车,放弃自己开车。
上面的例子告诉我们,机器学习模型的预测结果本身并不能构成决策,而只提供了一些警示信息,警示一些“不希望事件”(如通勤费增加) 将会发生。众所周知,预测依赖变量(事件)之间的相关性,而仅仅考虑相关性并不能帮助我们对变量之间的关系产生深入的“理解”。那么,如果我们考虑因果关系呢?尽管因果关系对于科学发现和追求真理至关重要,但我们认为它对做决策通常并不是必要的。
首先,做决策并不需要对因果关系有彻底的了解;我们甚至无须对与“不希望事件”有关变量的因果关系有彻底的了解。这一点不难理解:人类每天都在做决策,但我们并不需要完全地理解周围的世界。再者,因果关系通常表示一个静态的生成过程,而现实环境往往是开放的、动态的,因果关系可能会随现实环境的变化而变化。因此,即使可通过历史数据发现因果关系,在实际任务中基于这种因果关系做出的决策也并不一定合理。例如,在俄乌冲突之前,欧洲的石油价格取决于俄罗斯的石油交易价格,而俄乌冲突之后,制裁导致两地价格脱钩,不再有因果关系。第三,即便只考虑静态环境,假设我们已经发现了一些导致“不希望事件”的原因变量,如果它们无法被我们人为改变,也仍然无济于事。例如,在上面的例子中,即使发现俄乌冲突会导致油价上涨继而导致通勤成本大幅上涨这两个因果关系,由于个人既不能阻止冲突也不能控制油价,这些因果关系并不能帮助决策。实际上,乘坐公交车的决定既不影响油价,也不影响冲突。最后,即使不考虑上述三点,也应该注意,做决策本身并不需要我们先对因果关系有正确、详尽的理解,就像人类决策那样,很多时候即便基于错误的直觉,人类依然可以做出好的决策。
一般来说,预测依赖事物的相关关系,科学发现依赖于事物的因果关系。而决策,我们认为它依赖于一种介于相关关系和因果关系之间的关系,我们将这种关系称作排演关系。我们认为,在现实中做出的决策,源自于我们对未来关于不同动作下的排演。在上面的例子中,这位先生在脑海中假设性地排演了从开车切换到乘坐公共汽车,并基于排演结果做出相应的决策。要特别注意的是,排演和因果领域常说的“干预”有很大的区别,排演只是对决策下“不希望事件”的假设性推测,并不追求对决策下“不希望事件”的准确估计辨识(identification)。相关、排演、因果之间的关系如图1所示。简单地说,如果X和Y有因果关系/排演关系,则它们一定有相关性;如果X和Y有因果关系且X是可操作的,则X和Y具有排演关系,反之则不然。
图1 相关性、排演和因果之间的关系图
基于贝叶斯决策论,为了简化讨论,我们令表示“不希望事件”发生的概率,假设全部变量都是二元的,其中和分别表示可操作和不可操作变量的集合。当时,我们会收到“不希望事件”可能出现的预警。收到预警消息后,我们想通过调整一些可操作的变量,使上述不等式反转。决策变量的选取可通过式
实现。式(1)中的表示集合基数,表示集合减法,表示排演操作。如式(1)所示,我们希望调整尽量少的变量。式(1)的目标可以很容易地推广到不同决策下代价不同、或者决策值是连续或多值而非仅仅二元值的场景。在式中,的识别仅依赖。这里值得强调的是,我们仅仅希望让式(1)成立,而非对其中的每一项进行严格的估计。接下来,我们对排演展开更详尽的讨论。
首先,当我们收到即将发生“不希望事件”的预警,进行排演、决策时,我们可以先尝试构建变量之间的关系图。大多数情况下,我们只需要构建一个涵盖与“不希望事件”有关的变量的关系图,而无需考虑全部变量。然后,我们需要知道哪些变量是可以操作的,这一步通常可以由领域知识获得。一个示例见图2,其中左边部分就是一个关系图,白色表示可操作变量,灰色表示不可操作变量。
图 2 排演过程示意图(排演涉及当前的观察和估计对未来的影响)
注意图2中的边是无向的。尽管知道因果关系可能对排演过程有所帮助,但通常来讲,排演并不需要我们知道因果关系。回到文章最开始的例子,读者可能会想,如果我们可以识别出交通工具对通勤成本有因果关系,那我们就知道可以通过换乘交通工具来避免过度的通勤开销。然而,正如我们前面强调的,我们并不把具有完整的因果关系作为一个先决条件。事实上,大多数情况下,即便对世界有着片面或者错误的理解,人类依旧可以做出好的决策。在图2所描述的过程中,即便我们不确定某个变量对“不希望事件”有因果作用,我们也会在决策时把它作为排演变量加以考虑。
基于图 2 左侧的关系图,我们可以尝试对可操作变量进行排演操作。假设考虑。注意我们并没有该操作下的真实数据,一个简单的实现排演操作的方法是通过人工生成排演下的模拟数据,例如,我们可以将原始数据中的油耗设置成0来模拟决策者乘坐公交以替代自己开车的情况。
再者,不同于预测,决策关注的是动作对未来的影响。如图2所示,排演下的结果需要在未来环境(右侧)而非当下环境(左侧)进行评估。但是,当我们做决策时,我们只有当下的数据。因此,一个简单的评估方法是,我们假设除了排演变量和其直接影响的变量外,其他变量都不会大幅度变化,并基于此假设评估排演下的“不希望事件”。当环境在短时间内不会剧烈变化时,该方法可以很有效的进行短期决策。如果更进一步,我们需要考虑环境中不同的变量可能的变化,这就涉及到了环境建模技术和开放环境机器学习。
此外,对下“不希望事件”的估计是基于假设性的排演,而非我们采取实际动作。同时,我们也并不为使排演下的“不希望事件”Y能够被准确估计,额外做其它假设。因此,我们无法准确的估计下的“不希望事件”Y,这就导致了我们需要建立相应的假设检验方法,以提供保障。我们想再次强调,排演不同于干预,我们仅仅希望使式(1)成立,并不追求准确的估计其中的概率值。
总结
我们相信排演可以成为一个从预测到决策的实用且合理的方式。未来,为排演开发有效的算法并且建立全新的理论虽极具挑战性,却饶有兴味。
相关内容推荐:
FCS Perspective|对比自监督学习的一个综合观点
FCS Perspective|Wray BUNTINE观点:深度学习革命后的机器学习
FCS Perspective|观点:强化学习中的异策略评估
FCS Perspective|Thomas G. Dietterich观点:人工智能与人类组织的鲁棒性
Frontiers of Computer Science
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、 、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中13种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。