隐私保护成图像识别技术升级之痛

在电视或者网络上，我们会看到一些被像素化的文字或者脸部。这是出于隐私考虑，某些信息不适合展示给大众，或者会给当事人带来困扰。不过，随着科技的进步，这种保护隐私的方法已经不那么可靠了。因为，除了人类以外，人工智能也加入到图像识别的行列中。

据Wired网站的报道，德州大学和康奈尔科技学院的研究人员发现，通过一些训练，神经网络可以识别图像中隐藏的信息，无论是模糊的门牌号，还是像素化的人脸。而且，他们并不需要费力开发新的方法，只要使用主流的机器学习方法就行了。

我们使用了非常标准的图像识别技术。这才是让人不安的地方。康奈尔科技的研究员Vitaly Shmatikov说。由于这些方法广为人知，解析图片隐藏信息只需要一些基础的技术。

在训练神经网络的过程中，研究人员使用了几个大型的图像库。当神经网络看到的单词、脸部或者物品越多，它的识别准确率就会越高。在神经网络的识别准确率达到90% 后，研究人员用三种隐私工具处理了图像，并且让神经网络继续解析这些图像。最后，他们开始用新的模糊图像测试神经网络，看它是否能够辨识出面部、物品或者手写的数字。

结果是，在某些数据库和隐私技术上，神经网络的成功率达到80%，甚至是90%。在像素化图像方面，随着图片模糊程度增加，神经网络的成功率会降低，但是，它仍然能够达到50% 到75% 的成功率。

值得注意的是，神经网络并不能凭空恢复图像，或者把模糊的图片完全还原。它只能将其与自己见过的东西联系起来。比如，在火车站的监控图像里，如果每个过往人员的面部都是模糊的，神经网络不能识别每个人，但是，如果你怀疑某人在特定时间经过，那么，神经网络就能从众人中辨识出那个人。

通过此项研究，研究人员向隐私人士和安全人员提出了警告。在图像识别和数据收集上，机器学习已经成为不可忽视的工具。我希望，经过了这项研究，当人们发布隐私技术并且宣称其安全之前，首先要经过神经网络的分析， Shamatikov说。