-
欢迎来到北京明(míng)景科技有限公司
联系我们: 010-82378600, 13911129392
欢迎来到北京明(míng)景科技有限公司
联系我们: 010-82378600, 13911129392
应用程序“ZAO”火(huǒ)遍社交网络,但(dàn)其引发的隐私、信息安全問(wèn)题待解。随着机器学习技術(shù)不断发展以及AI的加持,虚假信息正逐渐影响公共生活。
在IEEE(电气电子工(gōng)程師(shī)学会)的年(nián)度媒体交流会上(shàng),中科院自(zì)动化研究所副研究員(yuán)、 中國(guó)人(rén)工(gōng)智能(néng)学会理事董晶博士认為(wèi),打破虚假信息面具,“以AI对抗AI”将会是解决方案。
“蓄意与便利的图像篡改,為(wèi)互联网數(shù)据的真实性带来巨大伤害,眼見(jiàn)再不為(wèi)实。”董晶表示,以换脸APP“ZAO”為(wèi)例,虽然開(kāi)发方并未透露其技術(shù)细节, 没有明(míng)确表示其“换脸” 技術(shù)源自(zì)開(kāi)源的“Deepfakes”,但(dàn)有着强烈的相似性。
据董晶介绍,“Deepfakes”使用了(le)一(yī)种名為(wèi)生成式对抗网络(GAN) 框架,利用神经网络学习所用數(shù)据源的统计特征,其中一(yī)个网络模块负责生成伪图,另一(yī)个负责鉴别生成图片的质量,通(tōng)过对抗博弈的方式不断进化,达到以假乱真的水平。
相对于传统“换脸”技術(shù),生成式对抗网络以机器人(rén)視(shì)觉(CV)為(wèi)基础,技術(shù)门槛降低(dī),算法上(shàng)也有公開(kāi)的源代码可(kě)循,數(shù)据库、训练模型均可(kě)方便获得,其训练结果与机器学习時(shí)間(jiān)長(cháng)短、训练模型有关。同時(shí),模型依赖數(shù)据自(zì)动学习、自(zì)动生成,无需人(rén)工(gōng)干预。体现在“Deepfakes”上(shàng),其流程包括对數(shù)据的提取、训练和(hé)转换。
近两年(nián),AI最显着的应用是在图像领域,如(rú)人(rén)脸识别、醫(yī)疗影像识别等,原因是深度学习在图像领域首先取得了(le)成功,识别的准确率甚至超过了(le)人(rén)眼,使其完全达到了(le)可(kě)以产业化的水平。
不过,若采用机器深度学习的造假技術(shù)日益遭到滥用,预计将造成重大后果。“由于這(zhè)些技術(shù)都(dōu)利用了(le)生物(wù)信息,而生物(wù)信息本身具有不可(kě)撤销性,因此它们一(yī)旦被泄露或被滥用,都(dōu)会给用户带来严峻且永久的后果,甚至会对司法调查、保险鉴定等這(zhè)些严肃、敏感的地(dì)带造成严重冲击。” 董晶说。
以取证為(wèi)例,董晶总结,目前在图像、視(shì)頻(pín)领域的证据造假呈现两大趋势:從(cóng)內(nèi)容编辑转向內(nèi)容生成,從(cóng)图像篡改转向視(shì)頻(pín)篡改。為(wèi)信息安全带来巨大挑战。
不过,技術(shù)推动了(le)新造假方式的产生,同時(shí)也提供了(le)打假的新方法。在学界,其中一(yī)种验证方式是要(yào)求录制的內(nèi)容必须提供元數(shù)据,元數(shù)据能(néng)显示录制的內(nèi)容是何時(shí)何地(dì)以及何种方式被收集的。了(le)解了(le)這(zhè)些信息,如(rú)果发现視(shì)頻(pín)、图片的某个细节与实际情况不符,就可(kě)以据此判断虚假信息加以剔除。
董晶通(tōng)过反向利用AI技術(shù),從(cóng)伪造图片的蛛丝马迹中辨别真伪信息: “我们首先需要(yào)确定人(rén)类視(shì)觉系统和(hé)计算机視(shì)觉系统在识别特定信息的认知特性、机理与计算方法,进而從(cóng)人(rén)类視(shì)觉系统与计算机視(shì)觉系统的认知差异性出发,通(tōng)过借鉴两类視(shì)觉系统之間(jiān)的认知以及计算的差异性和(hé)关联性来鉴别图像真伪。”
目前,董晶研究通(tōng)过利用AI從(cóng)視(shì)頻(pín)中远程读取心率、呼吸頻(pín)率等生理特征, 进而辨别視(shì)頻(pín)中的人(rén)像是真人(rén)还是假人(rén)。在AI的帮助下(xià),原本肉眼无法看(kàn)到的心跳(tiào)、脉搏、呼吸率,也能(néng)以數(shù)据的形式具象化,突破人(rén)眼視(shì)觉的盲區(qū), 從(cóng)而达到深度鉴别的目的。
“要(yào)实现有效利用人(rén)类与计算机二者視(shì)觉系统认知的差异性及关联性,关键难点就是伪造特征的获取与表达。” 董晶说。
董晶强调,是否能(néng)将伪造特征在視(shì)觉內(nèi)容中有效地(dì)检测与识别,往往决定了(le)真伪鉴定技術(shù)的可(kě)靠性。然而,伪造特征作(zuò)為(wèi)一(yī)种“微(wēi)弱信号”,很(hěn)多時(shí)候不易被察觉。同時(shí),由于伪造特征長(cháng)期处于不断变化当中,没有统一(yī)的模型,這(zhè)些特性都(dōu)给微(wēi)弱信号的捕捉与识别工(gōng)作(zuò)增加了(le)难度。