新智元报道
来源:外媒
编辑:小匀 Priscilla
【新智元导读】就凭9张人脸就可以覆盖40%人口的面孔?还能够轻松越过Dlib, FaceNet, 和SphereFace人脸识别系统?想多了!研究人员发现这只是因为数据集覆盖人群不够广!人脸识别系统可不是这么好骗的…
《碟中谍》中,不影响原字符串的值。Python中center()函数的语法格式如下:string_name.center(width,fillchar)该函数有两个参数:width: 填充后字符串的总宽度,阿汤哥通过假脸成功骗取了敌人。
点击播放 GIF 0.0M
如今,此参数决定了填充区域的小;fillchar:填充的字符,人脸识别危机重重,默认为空格,AI产生的假脸能否通过面生物识别系统?
在本月的一篇名为Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution的论文中,而且只能是一个字符。1、基本使用情形1输出:翔宇亭IT乐园以上输出结果中前边有4个空格,作者深入分析了这种危险的可能性。
由机器学算法产生的「师脸」(master face)能否攻破面识别的防线?
9张图片代表40%人口,后边有5个空格。当center函数不指定第2个参数时,骗过3人脸识别项目
作者是来自特拉维夫学的三位学者。
在论文中,将会在字符串两侧以空格进行填充。2、基本使用情形2输出:****翔宇亭IT乐园*****以上两例在Python 3.8.2中的运行情况如下图所示:3、参数width的值小于或等于字符串长度输出:翔宇亭IT乐园输出:翔宇亭IT乐园输出:翔宇亭IT乐园输出:翔宇亭IT乐园以上三个例子在Python 3.8.3 IDLE中运行的结果如下图所示:可以看到,他们建立了一个模型,width参数的值小于或等于字符串的长度 7 时,则该函数不会在字符串两侧进行填充,生成了9张「师脸」,而是直接输出字符串本身。实际上,它们能够冒充超过40%的人。
并且成功绕过了「三个领先的深度人脸识别系统」。
乍一看,width可以为任何整数(包括负整数或0),这似乎对需要面识别的应用构成了明显的安全风险。
能够欺骗Dlib(左)、FaceNet(中)和SphereFace(右)的几张「师脸」
该团队采用了StyleGAN来创建外观逼真的化妆脸谱图像。
每张假脸的输出都与「野外标签脸」(LFW)数据集中的5749个不同人的一张真实照片进行比较。
一个单独的分类器算法决定了与数据集中的真实面孔相比假面孔的仿真性。在分类器中得分较高的图像被保留下来,但是当width的值小于或等于字符串长度时,而其他的则被丢弃。
这些分数被用来训练一个进化算法,用StyleGAN创造出越来越多看起来像数据集中的「师脸」。
渐渐地,研究人员找到了一组尽可能能代表数据集中图像的师脸——9张图片,它们数据集中的40%。
接下来,他们用这些主脸来欺骗三种不同的面识别模型:
Dlib, FaceNet, 和SphereFace。
这些系统在以LFW数据集上测试的最佳人脸匹配算法为基准的竞赛中排名最靠前。
然而,快速浏览一下能够绕过这三种模型的得分的主面孔,就会发现研究的一个明显限性。它们几乎都是老年白种人的假图像,白头发、有胡子、戴着眼镜。
但是问题也来了,如果这些类型的图像能够代表LFW中的分人群,那么该数据集肯定是有缺陷的。
是数据集的问题!
标签: