隐私保护成图像识别技术升级之痛

在电视或者网络上,我们会看到一些被像素化的文字或者脸部。这是出于隐私考虑,某些信息不适合展示给大众,或者会给当事人带来困扰。不过,随着科技的进步,这种保护隐私的方法已经不那么可靠了。因为,除了人类以外,人工智能也加入到图像识别的行列中。

据Wired网站的报道,德州大学和康奈尔科技学院的研究人员发现,通过一些训练,神经网络可以识别图像中隐藏的信息,无论是模糊的门牌号,还是像素化的人脸。而且,他们并不需要费力开发新的方法,只要使用主流的机器学习方法就行了。

我们使用了非常标准的图像识别技术。这才是让人不安的地方。 康奈尔科技的研究员Vitaly Shmatikov说。由于这些方法广为人知,解析图片隐藏信息只需要一些基础的技术 。

在训练神经网络的过程中,研究人员使用了几个大型的图像库。当神经网络看到的单词、脸部或者物品越多,它的识别准确率就会越高。在神经网络的识别准确率达到90% 后,研究人员用三种隐私工具处理了图像,并且让神经网络继续解析这些图像。最后,他们开始用新的模糊图像测试神经网络,看它是否能够辨识出面部、物品或者手写的数字。

结果是,在某些数据库和隐私技术上,神经网络的成功率达到80%,甚至是90%。在像素化图像方面,随着图片模糊程度增加,神经网络的成功率会降低,但是,它仍然能够达到50% 到75% 的成功率。

值得注意的是,神经网络并不能凭空恢复图像,或者把模糊的图片完全还原。它只能将其与自己见过的东西联系起来。比如,在火车站的监控图像里,如果每个过往人员的面部都是模糊的,神经网络不能识别每个人,但是,如果你怀疑某人在特定时间经过,那么,神经网络就能从众人中辨识出那个人。

通过此项研究,研究人员向隐私人士和安全人员提出了警告。在图像识别和数据收集上,机器学习已经成为不可忽视的工具。 我希望,经过了这项研究,当人们发布隐私技术并且宣称其安全之前,首先要经过神经网络的分析, Shamatikov说。