记者 |
给图片加上马赛克很简单,但若将马赛克还原成清晰图片却很难。近日,美国杜克大学科研团队推出了一款AI工具,能将马赛克级别的模糊人脸,转换为以假乱真的高清图像。
这个名叫PULSE的算法,能够在几秒内将16x16像素的图片提升至1024x1024,分辨率提升高达64倍。目前该算法仅针对人脸照片,经算法生成的新照片能够呈现脸上的毛孔、皱纹甚至一缕头发。
不过,算法生成的人像图片与原始的真实人脸并不完全相符,它也不能被用于人脸识别。这些由算法新生成的高清人脸在现实中并不存在(当然,现实中的60亿人里或许有和他们长得相似的人)。
还原马赛克照片的工具早已有之。以往的还原方法是在低分辨率图片中添加像素点,而PULSE却不同,它先利用AI生成一系列高清图片,再降低它们的分辨率,并与模糊的原图对比,从中找出匹配程度最高、最接近原图的高清图像。
尽管目前研究团队的论文以人脸照片作为案例,但理论上,PULSE可以应用至所有物体的低分辨率照片,并制作出清晰逼真的图像。因此,其应用范围可以包含医学、显微镜学、天文学和卫星图像等。
该团队在机器学习中使用了一种名为“对抗生成网络”(StyleGAN)的工具,这是在相同照片数据集上训练的两个神经网络。其中一个神经网络通过AI生成经过数据训练的人脸,而另一个用于比对该人脸图片能否以假乱真。第一个神经网络会在训练中表现得越来越好,直到第二个无法分辨出差异。
就在PULSE引起大众兴趣以后,新的问题也跟着赞誉一起到来。有网友指出,PULSE涉嫌“种族歧视”。
国外网友发现,在PULSE中输入被模糊后的奥巴马照片时,该工具输出的“奥巴马”高清图像竟是白人脸孔。后又有许多人进行了相似的测试,结果无一例外——输入低清的少数族裔人脸照片,PULSE输出的都是高清的白人特征照片。
在BLM运动进行正盛的时期,任何一个关于“黑白”的争论都会挑动人们敏感的神经。很明显,在网友们发现这一点以前,杜克大学研究团队并没有意识到算法的公正性问题。而值得玩味的是,研究团队的5个人中,至少有3人是有色人种。
对此,杜克大学研究团队很快在Github上回应称:“看起来PULSE生成白人面孔的频率确实比其他有色人种高很多,这种偏见很可能是从StyleGAN训练时使用的数据集继承而来的,也可能存在我们不知道的其他因素。”
图灵奖得主、Facebook首席AI科学家Yann LeCun也加入了这场讨论,他同样认为是数据集的问题:“数据有偏见,机器学习系统就会有偏见。这个算法使每个人看起来都是白人,因为该网络在FlickFaceHQ上进行了预训练,里面大多是白人照片。在塞内加尔的数据集上训练‘完全’相同的系统,每个人看起来都会像非洲人。”
有人质疑,Yann LeCun并没有考虑到社会伦理因素,例如西方社会对有色人种的长期忽视,而将罪名都推给了不公平的数据集。更何况,绝对公平的数据集是很难实现的。
向来以直言不讳的Yann LeCun在连发数十条推特后,最终做出了道歉声明:“很抱歉我在Twitter对此事的评论成了话题中心。”
目前,研究团队在PULSE官网置顶了关于争议的声明:我们想解决有关PULSE偏见的问题。我们已经在论文中增加了一个部分,并附加了一张能直接解决此偏差的模型卡。
评论