学习因果关系和基于因果性的学习—论文

作者：张坤等来源：《国家科学评论》发布时间：2018/7/27 11:32:09

选择字号：小中大

学习因果关系和基于因果性的学习

人们在日常生活里以及各种科学探索和决策过程中，都常常追问“为什么”这样的因果性问题。为了能干预当前系统从而达到特定的目的，我们需要透过相关性，找到并利用因果性。还有一些问题看似无关“为什么”，但其实答案也存在因果关系中。比如在评价特定人或事的时候，我们往往需要想象在同样的环境中，如果换了一个人或者那件事没有发生，结果又会如何。拿这个假想结果和现实情况对比，人或事所起到的因果效应就显示出来了。按卡尔·荣格的说法，正是对因果关系的在意，催生了现代科学的诞生和发展。目前的因果性研究致力于回答以下问题：通过分析观测的数据，我们能精确地找出数据背后的因果关系吗？如何使人工智能系统理解环境并具备外推能力？如何能在复杂、可变的环境里做最优预测和控制？因果关系有哪些我们还未察觉的用途？

《国家科学评论》最近发表了美国卡耐基梅隆大学张坤、Peter Spirtes、Clark Glymour和德国马普智能系统研究所Bernhard Schölkopf共同撰写的观点文章“Learning Causality and Causality-Related Learning”（National Science Review 2018; 1: 26-29. https://doi.org/10.1093/nsr/nwx137），简要阐述了该研究领域的一些进展以及目前大家比较关注的方向。找因果关系的传统方法需要做人为干涉或随机实验，这个过程非常昂贵，有时甚至无法做到。因此，人们需要从观测数据中找出因果关系，这个问题统称为因果发现。得益于过去30年数个领域在此问题上的进展，即使没有时间先后信息，现在也有一系列方法能在特定前提下解决这个问题，这也提供了另一个分析“大数据”的途径。在20世纪90年代，学者们发现虽然相关性不直接蕴含因果性，但如果引入一些普遍能接受的假设，就可以从变量的条件独立关系中找到他们之间的因果信息。遗憾的是，这类方法一般不能找出唯一的因果图，而是找到一类图，它们有同样的无向连接，但一些因果方向未必相同。

过去10年的研究把这个结果往前推进了一步——假设因果过程服从某些函数模型，那么在一般情况下，反方向是不可能服从这个模型的。具体来说，在反方向，我们是找不到独立的噪声的，这就直接给出了“因”和“果”在统计意义上的不对称性。其中，后非线性因果函数模型（post-nonlinear causal model)在NIPS 2008因果挑战赛中，在所给数据集上都正确区分出了因和果。这个结果改变了一些人的看法——原来单纯从独立同分布的数据中是可以看出谁是因谁是果的。如图1所示，如果因果过程为线性且“因”X和因果过程中的噪声是非高斯的（图中它们是均匀分布的），“因”X和“果”Y具有不对称性。为了实现更鲁棒、实用的因果发现，文中还列出了5个近年来已经引起重视的现实问题，包括：确定性因果关系，如何使用非平稳或异质数据更有效地找到因果关系，以及如何处理非理想数据采集方式带来的观测噪声和数据选择偏差等。

文章还探讨了如何从因果关系的角度去理解以及解决某些机器学习问题。大致来说，传统机器学习往往假设数据的分布不变，而目前随着机器学习的广泛应用，我们需要考虑更实际的包含异质数据的问题，比如半监督学习和迁移学习。这类问题的解决可获益于因果系统的性质：首先，我们可以“以不变应万变”——即使数据分布发生变化，因果关系是相对稳定的，因为它对应着实际的物理过程；其次，我们可以“分而治之”——一般来说，因果系统里“因”的产生过程和“因”产生“果”的过程是没有联系的，即使这两个过程都发生了变化，我们也可以把它们各个击破；再次，我们可以“四两拨千斤”——因果过程对应着实际的物理规律，顺着这个过程去构建数据的分布特性往往更简单。目前，该领域的很多研究人员致力于找出更广泛实用、更高效的因果发现方法，以及从因果的角度去开发更具智能的机器学习系统。（来源：科学网）

以下评论只代表网友个人观点，不代表科学网观点。

�� SSI �ļ�ʱ��

编辑部推荐博文
问答之间｜idea被别人做过，要转变方向吗？科学网博主徐鑫力作，揭示科研成功秘诀 \| 赠书研究生学位论文如何顺利通过外审和答辩大庆油田是怎么形成的？新函数用于应对执行器故障的未知时变方向从“英国算”到“语数外” 更多>>