近日,上海交通大学教授武筱林和博士生张熙的一篇论文引发争议,有人质疑论文暗示“看脸定罪”,因而涉嫌歧视。
这篇论文题为《基于面部图像的自动犯罪性概率推断》(Automated Inference on Criminality using Face Images)。他们用计算机视觉和机器学习技术,检测了1856张中国成年男子面部照片,其中将近一半是已经定罪的罪犯。实验结果显示,罪犯与非罪犯这两个群体,可以由基于机器学习的人脸分类器以较高的概率加以区分。此外,罪犯与非罪犯,在内眼角间距、上唇曲率和鼻唇角角度这三个测度上,存在较显著差异。而更重要的发现在于,犯罪分子之间的面孔特征差异要大于守法公民。
论文在预印本网站上发表后,很快引起了关注,不少研究者纷纷来信索取实验细节,交流看法。但让武筱林和他的研究伙伴不解的的是,来信中出现了大量负面评论,甚至攻击性回应。
“有人建议我们撤稿”
谈及这场风波,武筱林情绪略激动,他向记者展示了几封较有代表性的邮件。
第一封来自一名留学在外的上海交大校友:“我建议你撤销这篇论文,并且上传一封公告,为不恰当的研究方法致歉。”理由则是“这篇论文充满了极度的歧视和强烈的误导。我们人工智能领域的研究者,不应当滥用技术,去做一些违反伦理的事情。”
值得一提的是,这名来信者特别强调:“这篇论文给上海交大的声誉带来了很糟糕的影响。这对那些申请美国高校的上海交大学子来说,将会是一场灾难。”
另一封信则来自美国康奈尔大学的科研同行:“我是来敦促你撤稿的,因为这是一项可耻的工作。我们无法选择自己的唇部弧度、眼间距和所谓的鼻唇角角度。但犯罪者的问题在于行为,而不是长相。”
他还指出,作者可能忽略了一个问题:有些人可能恰恰因为长相与众不同,而更容易被判定有罪。“这种既有歧视应当被谴责和消除,而非被扩大!”
与此同时,在国外一些网站上,围绕这项研究的争论也在发酵。部分攻击性和带有讽刺意味的言论,让武筱林非常愤怒:“有些人站在道德高地谴责我制造歧视,部分言论明显带着对中国学者的偏见。我很生气,这本来是一个纯粹的科学问题!”
研究初衷是反对“相由心生”
为何要研究这个显然容易引发争议的课题?武筱林解释,自古以来,各个文化中都有类似‘相由心生’的说法。就连亚里士多德都认为,由外部特征可以推断人的秉性。但他和他的学生觉得这个说法站不住脚。“最开始,我们是抱着怀疑的态度,想用现代科学方法去证伪这种观点的。”
正因如此,尽管他们早在一年前就做出了这个结果,却迟迟不愿发表出来。
“得出现在这个结论,我们自己也很意外。”武筱林说,他们也曾从各个角度质疑自己的研究。
有人提出,因为罪犯的照片是由警察提供的,而警察使用的照相机有可能在信号上与其他相机不同。针对这个可能性,他们对第一版论文进行了修正:故意在照片的光学信号上加了很多噪音,以淹没不同相机信号上的差异。在他们新近上传的第二版论文上,发表了这个新的测算结果:尽管误判率升高不少,但并没有推翻之前的结论,分类器仍有75%的准确率。
此外,他们特地重新核实了犯罪者照片的拍摄情况,证实都是普通证件照片,而非被捕后拍摄的。
“如果非要问我为什么研究这个问题,我只能说,我就是好奇,就是想要追问。”武筱林说。
在他引用的参考文献中,有一条中文文献,是宋朝人陈抟所著的《神相全编》——一本流传甚广的相术技法大全。书中对人物眼间距、嘴唇和人中部位的描述,恰好与论文中提到的三个差异参量有正相关。
对此,武筱林解释道,这些是通过纯机器学习方法自动识别的、在犯罪组和未犯罪组之间存在显著差异的位置,与书中描述只是不谋而合。但他也强调,他们同时检测了《神相全编》中提到的眉毛角度,以及类似研究中常用的瞳孔间距等参量,但都没有显著差异。
看脸定罪纯属无中生有
武筱林觉得,人们的担忧也并非毫无道理。特别是国内一些报道,已经公然用“看脸定罪”作为标题和噱头。对此他声明,“看脸定罪”纯属无中生有,坚决反对将该研究成果运用于甄别罪犯或“潜在犯罪者”。他说:“就价值观来讲,我强烈反对任何形式的歧视,当然包括以貌取人”。
加拿大麦克马斯特大学的电子与计算机工程系主任,蒂姆•戴维森教授则指出,这项研究应当促使人们反思一个问题:长相偏离均值的人是否更容易遭受所谓“主流”人士的歧视和排斥,而其中一些人会因此走上违法道路?
武筱林表示,他现在更希望有人从纯学术的角度与他展开探讨:“我很欢迎大家用更丰富的数据样本、更缜密的实验设计、更严谨的数据处理,来推翻这个结论。”
《中国科学报》记者专门就这篇论文咨询了国内一位计算机视觉和机器学习领域的学者。这位专家表示,这项研究的理想条件是保证所有被试者在同样条件下、用相同相机拍摄照片,并且确保自然中性情绪。由于题目涉及犯罪分子,这其实是很难做到的。
他认为,即便犯罪分子的照片是被捕前的证件照,也不能排除此时他已经犯罪,或者处在不稳定的生活及情绪状态下。此外,他不太确定是否能通过添加噪声来掩盖相机参数和拍摄条件的影响。
他的观点是:“在罪犯照片属性未知的情况下,我倾向于认为这个实验还不足以给出结论。”