喜欢犯罪片的你一定对这个情节不陌生:某个破案人物要求技术员放大一张照片,然后大喊“增强画质!”原本一团模糊的图像就会一秒变成高精度的高清照。
面对如此一本正经胡说八道的桥段,观众也只能笑而不语。如今,由于人工智能图像缩放程序EnhanceNet的出现,这个笑话居然变成了一项真实存在的技术。
图解:左侧为原图。科学家把像素化的小鸟图(中间)导入EnhanceNet。结果产生了右图,和原图几乎一模一样。
请看上面三张图,这可不是P的。EnhanceNet可以把极为粗糙、低分辨率的小鸟图转换成高清图。它甚至还能重现原图的景深,正如前景里的树枝所示。
这款程序的投资人来自德国马克斯-普朗克智能系统研究所的迈赫迪·S·M·萨贾迪、伯恩哈德·薛可夫和迈克尔·赫什——将它归类为“通过自动化纹理合成的单一图像超分辨率。”
物如其名:它能通过合成纹理放大分辨率极低的图片,引入新细节,生成最后的高清图像。合成细节使得成图非常逼真,几乎和真实的照片没有区别。人工智能终于能够利用虚构的细节以极高精确度还原现实,这大概是史上头一遭。
根据研究报告中所描述的无数次实验,“成图以高放大倍率显著提升了图像质量。”此软件通过“对抗性训练设置下的前馈式全卷积神经网络”创造图像。换言之,和其他对抗性神经网络一样,一个系统生成结果,另一个系统评估结果的准确度。
和这项技术相比,目前的高端照片缩放法简直自愧不如。从下方的对比图你就能看出两者之间的巨大差异,左侧为最顶级的先进方法(PSNR,即峰值信噪比),右侧为EnhanceNet生成的结果:
第一只猎鹰图相当于Photoshop的放大效果,结果往往导致画面过于平滑,最终不可避免地牺牲了清晰度,连人眼也能发现瑕疵。相比之下,EnhanceNet成图在画质和细节上的提升显而易见。
在往来邮件中,迈赫迪·S·M·萨贾迪称“这套算法可轻松嵌入Photoshop等商业软件之中。”更有意思的是,你还可以把它作为操作系统的一部分“融入手机,在放大图片的同时增强画质,避免出现模糊不清。”萨贾迪说道。此外,他还补充说明了其他用途:
从对老电影提升采样至4K画质,到复原过于模糊的旧全家福用以放大冲印,再到提升检测精度等一般应用。我们在报告里切实研究过这一方面。
事实证明,在图像上使用我们的算法同时也降低了其他神经网络在图像中探测对象的难度,这具有广阔的应用前景,包括谷歌图片搜索和自动驾驶汽车探测行人。
设想一下:一个神经网络增强了图像质量,接着,另一个神经网络使用成图检测对象。这当然还包括了执法应用。
萨贾迪告诉我,即便“重建出来的细节未必是真实的细节,这些技巧也能运用于车牌识别等特殊案例。”这意味着,警方无需等待超高分辨率的相机,也能逮住超速行驶的司机。有了这项技术,他们现在就能做到。
萨贾迪指出,你还可以利用这套系统还原被像素化的面部,比如匿名照片里的人脸。尽管“重建后的人脸未必和原来一模一样,毕竟大部分信息都在像素化的过程中丢失了,但也有助于辨认某个人。”这种结果不能作为呈堂证供,但至少现在,对方化成了灰,你也能真的认出来了。
然而,这项技术将对隐私权构成威胁。图谋不轨的人完全可以获取代码,训练一个神经网络重建被模糊处理或像素化的图像。假如你曾经上传过打了马赛克的业余小黄片,那就请做好要“走红”的心理准备吧。
‐End‐
文 | Jesus Diaz
图片 | Fastcompany & 网络
编辑 | 黄子君