让计算机“看脸”识别罪犯?并非“以貌取人”

来源:    发布日期:2016-12-21 10:23:22   阅读量:0

让计算机“看脸”识别罪犯?论文作者说并非“以貌取人”

记者 白竟楠

犯罪分子的长相与普通人不一样?一项出乎意料的机器学习领域研究结果引发了“以貌取人”是否科学的大讨论。

相传美国前总统林肯亲自面试一位应聘者,幕僚觉得那人不错,但林肯没录用他。幕僚问林肯:“您觉得他能力不行吗?”林肯回答:“我不喜欢他的长相!”

这个经典的桥段在坊间流传甚广,被用以辅助众多励志文章,教人管理自己的心绪,正所谓“相由心生”。不过,如果用理性的角度来看待这个问题,我们的长相先天上是由遗传因素决定的,后天因素纷繁复杂,至今为止还没有一种科学理论来证明长相与行为的关系。所以我们还是更加相信“人不可貌相”,千百年来“以貌取人”这个词还带有一定贬义的味道。

之所以要探讨长相,是因为最近,上海交通大学电子信息与电气工程学院教授武筱林和他的博士生张熙,发表了一篇题为《基于面部图像的自动犯罪概率推断》(Automated Inference on Criminality using Face Images)的研究论文,他们基于计算机视觉与机器学习的分类器模型,得出了一些比较“出人意料”的实验结果:

犯罪分子与犯罪分子之间在面部的差异要大于普通人与普通人之间的差异,并且,犯罪分子与普通人之间有足够差异,从数据上来说,罪犯的内眼角间距平均要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。

▎实验结果是怎样得到的?

这篇研究论文被报道后引发了学界、公众对于“以貌取人”这一历史性话题的热议,计算机真能通过长相来判断是不是罪犯?我们先来了解一下整个实验的过程:

数据准备:共收集1600余张证件照

▲数据集中的样本证件照,其中上排代表犯罪者,下排代表非犯罪者

武筱林等实验人员首先建立了一个人脸识别数据库,样本图片包括普通公民和罪犯(嫌疑人)两组,共1600多张黑白证件照,均为中国男性,年龄在18岁至55岁之间。

普通公民的图片从网上收集而来,罪犯(嫌疑人)的照片中,一半来源于公安部和各省公安厅贴在网上通缉罪犯的犯罪嫌疑人标准照片,另一半是与某公安局签订保密协议之后获取的照片。

他们对这些照片进行了归一化处理,也就是通过计算机图像处理技术使得所有照片具有相同的分辨率、对比度、亮度变化率(动态范围),并把照片中的人脸进行了五官匹配,这样做的目的是为了让所有采集来的证件照在数学上有可比性。并且,罪犯(嫌疑人)的照片都为犯罪被逮捕前的证件照,没有被警察审讯过后监狱拍摄的照片,所以表情中性比较自然。由于罪犯或嫌疑人的信息保密问题,研究者并不能知道所有罪犯(嫌疑人)的民族信息。

研究方法:四个分类器模型

▲ 研究者利用特征生成机(Feture GeneratingMachine,FGM)抓取面部的差别性特征(上图红框区域),比较的特征分别是眼内角间宽 d,鼻唇角角度 θ ,以及嘴角弧度 p

用计算机对人脸进行犯罪与非犯罪倾向性的分类,需要建立计算机学习算法,编写程序。武筱林的团队建立了四个分类器,它们是不同的逻辑判断软件,分别为Logistic Regression(逻辑回归)、KNN(K最邻近算法)、SVM(支持向量机)和CNN(卷积神经网络)。这四个分类器是用不同的机器学习算法生成的,最后通过各自的结论相互印证。为了实验的严谨性,他们还控制了性别、年龄和面部表情等变量。

实验过程:90%的样本进行训练,10%用于测试

在这1000多张的样本图片中,科研人员会挑出其中的90%让电脑分析处理,相当于训练电脑。实验人员要将照片分为普通人和罪犯两组,分别标注特征,就像拍摄CG电影中的动作捕捉技术一样,在人脸的不同肌肉组织处标记出来,即人脸的特征点位置,然后让机器学习这些特征,当机器“学会”了这些特征之后,再用剩下的10%的样本对机器的学习成果进行测试。

▲上图分别显示了四个分类器的总体正确率和误判率,可以看到,CNN 在交叉验证中的分类正确率最高,达到 89.51%

▲上图分别显示了四个分类器的总体正确率和误判率,可以看到,CNN 在交叉验证中的分类正确率最高,达到 89.51%

实验结果:

研究采取机器学习的方法验证面部特征与犯罪性的关系,利用特征生成机(Feture Generating Machine,FGM)抓取面部的差别性特征,分别比较了内眼角间距、鼻唇角角度以及上唇曲率等几个特征。

结果显示,犯罪分子与普通人之间有足够差异,从数据上来说,罪犯的内眼角间距平均要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。

并且,犯罪分子与犯罪分子之间在面部的差异要大于普通人与普通人之间的差异,也就是说,普通人的长相相似度更高,犯罪分子长相之间的不同更明显。

▎面对争议,论文作者表示理解,但不要断章取义

这篇论文引起的学术内外界的争论让武筱林始料未及。有声音说这是以貌取人涉嫌歧视。对此,北京科技报|“科学加”客户端记者与武筱林教授取得了联系,在采访过程中,他也对一些引起争议的问题进行了回应。

目的只是为了研究计算机视觉和机器学习

“我是从事信息科技研究的,只不过在这其中涉及到了人文的内容,并不是以‘相由心生’为目的。”武筱林向北京科技报|“科学加”客户端记者解释,做这项研究最重要的目的是探索机器学习和人工智能在社会计算方面的潜力,看电脑能不能通过学习达到人们在对陌生人的社会属性及行为倾向性常有的第一印象。测试带监督的机器学习方法是否可以对非犯法人群与犯法人群进行分类,只不过是挑了一个特殊的研究对象而已。

研究的灵感来源于心理学实验?

2011年,康奈尔大学的心理学研究团队做过一项研究,将普通公民的面部照片和犯罪者的面部照片混在一起,然后让人分辨,实验的结论是参加实验者可以辨识到普通人与犯罪者的面部图像差异特征,并据此来推断和区分所给定的面部图像是普通人还是犯罪者。有人认为,武筱林最初的实验灵感来源于这项研究。

武筱林否认了这一说法,他说到,自己从事的研究领域是计算机图像技术,懂机器的人脸识别不一定懂心理学上的人脸判读。正是由于这项实验涉及信息技术之外的内容,作为一个从事了30多年科学研究的科学家,学术的严谨性使得他阅读了大量的与“罪犯面部识别”相关的其他领域的研究结果,这篇康奈尔大学的论文是他参考的论文之一。

只是没想到的是,自己用计算机做出的实验结果与康奈尔大学这项心理学研究的实验结果有着极高的相似性,人眼可以识别出罪犯(嫌疑人),机器在通过训练之后也可以。

实验数据样本还是较少

搜集照片和处理照片的过程经历了三个月,这项工作由博士生张熙完成,武筱林把关和筛选张熙收集来的照片。

在武筱林看来,这一千多张样本还是少了,由于技术手段和隐私条件的限制,拿不到更多的样本,这也是此次研究很大的遗憾。“其实更科学的结论需要更大的数据样本,由于罪犯(嫌疑人)样本量的限制,所以此次试验只以男性公民和男性罪犯(嫌疑人)为对象,女性的样本量更小。”武筱林说。

实验结果自己也很意外

武筱林介绍到,最核心的实验过程经历了一年的时间。“其实第一批实验结果在论文发表一年前就已经得出了,但是慎重起见,我们对结果进行了反复验证,又在数据甄别、算法完善、分类器参数微调上进行了优化,所以第二年才发表论文。”而最终得出的实验结果证明,四个分类器结论基本一致,CNN算法识别罪犯的准确率最高,高达80%以上。

对于自己用计算机做出的实验结果与康奈尔大学的心理学研究实验结果有着极高的相似性,武筱林表示自己也没有预料到。

科研有禁区,质疑可以理解

在许多报道中,有许多业内外人士质疑武筱林和张熙的研究成果,认为这为“以貌取人”提供了依据,有悖伦理。武筱林说,面相与社会属性之间的关联有很多科研机构在不同的学科领域研究,但是所有的研究人员都小心翼翼,因为这种理论成果可能被滥用。“一个人的犯罪概率不是由面相决定的,更不能忽视犯罪的背景概率,因为犯罪这件事儿本身就是罕见的,中国的犯罪率很低。计算一个具有某种面部特征的人的犯罪概率时,一定要用贝叶斯定理,一定要乘以人口总体的犯罪率也就是很小的背景概率时,才是有意义的。所以,不能单凭长相说明一个人的犯罪率高还是低。”

张熙表示,在写作过程中,最难的事情就是谨慎使用词汇,因为争议性很大。“我们只希望呈现我们的研究成果,并不希望被误解成歧视。在这方面遇到的困难甚至要大于程序的设计和编写。许多科学研究就像武器一样,关键看掌握在谁的手里。学术是否有禁区,这是可以讨论的,质疑可以理解,但是不能断章取义。”■

编后记>>

如果仔细地了解了实验的全过程,我们会发现作者只是利用人脸识别的方法,来进行一项计算机视觉和机器学习领域的研究,并不存在证明或者证伪“以貌取人”这样的目的,也没有关于应用的讨论。对于选取的实验方法以及实验条件是否合理,这完全是一个可探讨的学术问题。

但要由此而得出“计算机人脸识别成果为‘以貌取人’提供依据”这样的推论,确实有失偏颇。我们不应该人为主观地去判断一项科学研究是否有意义或者意义是什么,如果这项研究没有人去做,我们又怎么会关注这个“出人意料”的发现呢?

但要由此而得出“计算机人脸识别成果为‘以貌取人’提供依据”这样的推论,确实有失偏颇。我们不应该人为主观地去判断一项科学研究是否有意义或者意义是什么,如果这项研究没有人去做,我们又怎么会关注这个“出人意料”的发现呢?