從P圖到假圖批量生成 AI圖像安全成可信AI重點(diǎn)關(guān)注方向
作者:林斐 來(lái)源:IT時(shí)報(bào)
圖像是信息的重要載體,也是信息保護(hù)的重點(diǎn)關(guān)注對(duì)象。圖像編輯軟件的發(fā)展和普及降低了虛假圖像的制作門檻,大量基于虛假圖片產(chǎn)生的詐騙案件、網(wǎng)絡(luò)暴力事件在全球范圍內(nèi)造成了惡劣的影響。自AIGC技術(shù)興盛以來(lái),“生成式造假”也讓人們倍感憂慮。圖像內(nèi)容的安全與可信性也成為了公眾關(guān)注的焦點(diǎn),但圖像領(lǐng)域的“可信AI”才剛剛起步。
在剛剛結(jié)束的本次世界人工智能大會(huì)可信AI論壇上,長(zhǎng)期聚焦“AI+OCR”在文檔智能領(lǐng)域中的前沿技術(shù)探索的合合信息展示“三大技術(shù),一項(xiàng)標(biāo)準(zhǔn)”,探索AI在圖像內(nèi)容安全領(lǐng)域可信化發(fā)展的多重可能。
合合信息AI圖像安全技術(shù)方案主要包括三項(xiàng)重點(diǎn)技術(shù):AI圖像篡改檢測(cè)、生成式圖像鑒別、OCR對(duì)抗攻擊技術(shù),以應(yīng)對(duì)日益高發(fā)的惡意P圖、生成式造假和個(gè)人信息非法提取現(xiàn)象。
AI圖像篡改檢測(cè)技術(shù)

P圖是常見的圖像篡改手段之一。去年的世界人工智能大會(huì)上,合合信息PS篡改檢測(cè)技術(shù)首次亮相,“像素級(jí)”起底修改痕跡,覆蓋身份證、護(hù)照等多種證照識(shí)別類目。該技術(shù)基于深度學(xué)習(xí)的圖像篡改檢測(cè)技術(shù)及相關(guān)系統(tǒng),通過(guò)學(xué)習(xí)圖像被篡改后統(tǒng)計(jì)特征的變化,智能捕捉圖像在篡改過(guò)程中留下的細(xì)微痕跡,并以熱力圖的形式展示圖像區(qū)域篡改地點(diǎn),相關(guān)技術(shù)已在銀行、保險(xiǎn)等領(lǐng)域落地應(yīng)用。
今年圖像篡改檢測(cè)“黑科技”持續(xù)優(yōu)化升級(jí),應(yīng)用面也拓展至“截圖篡改檢測(cè)”。此前,圖像篡改檢測(cè)的技術(shù)研究對(duì)象主要集中于自然場(chǎng)景圖像,然而,真正為人們的生活帶來(lái)風(fēng)險(xiǎn)的通常是被篡改的資質(zhì)證書、文檔、截圖等。合合信息AI圖像篡改檢測(cè)技術(shù)可檢測(cè)包括轉(zhuǎn)賬記錄、交易記錄、聊天記錄等多種截圖,無(wú)論是從原圖中“摳下”關(guān)鍵要素后移動(dòng)“粘貼”至另一處的“復(fù)制移動(dòng)”圖片篡改手段,還是“擦除”“重打印”等方式,圖像篡改檢測(cè)技術(shù)均可“慧眼”識(shí)假。

該技術(shù)的主要難點(diǎn)在于,能否從沒(méi)有明顯視覺(jué)差異的圖片中找出被篡改的截圖,以及找出的圖片中是誤檢率是否可控。與證照篡改檢測(cè)相比,截圖檢測(cè)難度更大。
從成像角度來(lái)看,截圖的背景沒(méi)有紋路和底色,整個(gè)截圖沒(méi)有光照差異。證件篡改識(shí)別尚可通過(guò)拍照時(shí)產(chǎn)生的成像差異進(jìn)行篡改痕跡判斷,而截圖則沒(méi)有這些“信息”?,F(xiàn)有的視覺(jué)模型通常難以充分發(fā)掘原始圖像和篡改圖像的細(xì)粒度差異特征,因此難以實(shí)現(xiàn)令人滿意的準(zhǔn)確率。為此,合合信息提出了一種基于HRNet的編碼器-解碼器結(jié)構(gòu)的圖像真實(shí)性鑒別模型,結(jié)合圖像本身的信息包括但不限于噪聲、頻譜等, 從而捕捉到細(xì)粒度的視覺(jué)差異,達(dá)到高精度鑒別目的。
生成式圖像鑒別
今年以語(yǔ)言生成類、視覺(jué)生成類模式為代表的AIGC產(chǎn)品引發(fā)了社會(huì)對(duì)于圖文內(nèi)容“可信度”問(wèn)題的討論。AIGC爆火的背后,不法分子通過(guò)生成的圖片去規(guī)避版權(quán)、身份驗(yàn)證,非法獲取利益,給人民群眾造成了財(cái)產(chǎn)損失?;诖吮尘?,合合信息研發(fā)了關(guān)于AI生成圖片鑒別技術(shù),用于幫助個(gè)人及機(jī)構(gòu)識(shí)別判斷AI圖片是否為生成的,防止“虛擬人”欺詐,通過(guò)解決生成式AI面臨的部分倫理問(wèn)題,助力生成式AI的健康發(fā)展。
該項(xiàng)目的難點(diǎn)主要分為兩點(diǎn):生成出來(lái)的圖像場(chǎng)景繁多,不能窮舉,不能通過(guò)細(xì)分來(lái)一一訓(xùn)練解決;有些生成圖和真實(shí)圖片的相似度過(guò)高,很貼近于人類的判斷,對(duì)于機(jī)器而言,真?zhèn)闻卸ㄖ粫?huì)更難。合合信息基于空域與頻域關(guān)系建模,能夠在不用窮舉圖片的情況下,利用多維度特征來(lái)分辨真實(shí)圖片和生成式圖片的細(xì)微差異。

輸入圖片后,模型通過(guò)多個(gè)空間注意力頭(attention head)來(lái)關(guān)注空間特征,并使用紋理增強(qiáng)模塊放大淺層特征中的細(xì)微偽影,增強(qiáng)模型對(duì)真實(shí)人臉和偽造人臉的感知與判斷準(zhǔn)確度。
生成式圖像檢測(cè)技術(shù)在反詐騙、版權(quán)保護(hù)等領(lǐng)域的應(yīng)用空間十分廣泛。例如在金融行業(yè),不法分子可利用AI合成技術(shù)對(duì)線上資金進(jìn)行盜刷,威脅公民財(cái)產(chǎn)安全。本項(xiàng)技術(shù)可通過(guò)對(duì)支付環(huán)節(jié)的干預(yù),降低資金盜刷概率;在傳媒行業(yè),某些圖片供給方使用軟件自動(dòng)生成海報(bào)等圖片,故意隱瞞其來(lái)源并售賣給第三方,第三方在不知情的情況下進(jìn)行商用,導(dǎo)致了侵權(quán)問(wèn)題,相關(guān)檢測(cè)技術(shù)可在一定程度上解決這些問(wèn)題。
OCR對(duì)抗攻擊技術(shù)
人們會(huì)出于生活、工作需要,拍攝自己的相關(guān)證件、文件并發(fā)送給第三方,這些圖片上承載的個(gè)人信息可能被不法分子使用OCR技術(shù)識(shí)別提取并泄露。基于個(gè)人、企業(yè)業(yè)務(wù)的文件資料保密需求,合合信息進(jìn)行了創(chuàng)新技術(shù)探索,研發(fā)了OCR對(duì)抗攻擊技術(shù)來(lái)進(jìn)行文檔圖片“加密”。

合合信息OCR對(duì)抗攻擊技術(shù)應(yīng)用效果展示,可對(duì)關(guān)鍵信息進(jìn)行遮蓋,在不影響肉眼觀看的情況下阻止機(jī)器自動(dòng)爬取。該技術(shù)可在不影響肉眼觀看與判斷的情況下,對(duì)場(chǎng)景文本或者文檔內(nèi)文本進(jìn)行擾動(dòng),對(duì)包含中文、英文、數(shù)字等關(guān)鍵信息的內(nèi)容進(jìn)行“攻擊”,防止第三方通過(guò)OCR系統(tǒng)讀取并保存圖像中所有的文字內(nèi)容,降低數(shù)據(jù)泄露的風(fēng)險(xiǎn),以此達(dá)到保護(hù)信息的目的。
與中國(guó)信息通信研究院等權(quán)威機(jī)構(gòu)一起建立標(biāo)準(zhǔn) 助力科技向善
圖像安全的重要性與日俱增,標(biāo)準(zhǔn)規(guī)范的出臺(tái)迫在眉睫。合合信息與中國(guó)信息通信研究院(下簡(jiǎn)稱信通院)等權(quán)威機(jī)構(gòu)一道,攜手院校、研究機(jī)構(gòu)及企業(yè),共同探索AI技術(shù)在圖像領(lǐng)域的可信化落地這一深遠(yuǎn)命題,助力科技向上的同時(shí)向善發(fā)展。
為貫徹落實(shí)《中華人民共和國(guó)網(wǎng)絡(luò)安全法》《生成式人工智能服務(wù)管理辦法(征求意見稿)》等文件中對(duì)于AI服務(wù)的規(guī)范性要求,系統(tǒng)性建立圖像內(nèi)容安全行業(yè)發(fā)展秩序,信通院牽頭啟動(dòng)了《文檔圖像篡改檢測(cè)標(biāo)準(zhǔn)》制定工作,合合信息、中國(guó)圖象圖形學(xué)學(xué)會(huì)、中國(guó)科學(xué)技術(shù)大學(xué)等科技創(chuàng)新企業(yè)及知名學(xué)術(shù)機(jī)構(gòu)聯(lián)合編制。
《文檔圖像篡改檢測(cè)標(biāo)準(zhǔn)》將為文檔圖像內(nèi)容安全提供可靠保障,助力新時(shí)代AI安全體系建設(shè)。作為牽頭方,信通院表示,《文檔圖像篡改檢測(cè)標(biāo)準(zhǔn)》將基于產(chǎn)業(yè)現(xiàn)狀,圍繞“細(xì)粒度”視覺(jué)差異偽造圖像鑒別、生成式圖像判別、文檔圖像完整性保護(hù)等行業(yè)焦點(diǎn)議題,凝聚行業(yè)共識(shí),以期為行業(yè)提供有效指引。
“可信”反映了AI系統(tǒng)、產(chǎn)品和服務(wù)在安全性、可靠性、可解釋、可問(wèn)責(zé)等一系列內(nèi)在屬性的可信賴程度,相關(guān)概念正隨著技術(shù)發(fā)展的腳步,從模糊走向清晰、從起步走向成熟。開年以來(lái),以語(yǔ)言生成類、視覺(jué)生成類模式為代表的AIGC產(chǎn)品引發(fā)了社會(huì)對(duì)于圖文內(nèi)容“可信度”問(wèn)題的討論?!段臋n圖像篡改檢測(cè)標(biāo)準(zhǔn)》的制定,或?qū)橹袊?guó)“可信AI”在機(jī)器視覺(jué)、圖像處理領(lǐng)域的體系建設(shè)提供有力支持。
用“過(guò)硬”的AI為行業(yè)發(fā)展注入安全感
AI向善還是向惡而行?不法分子和守護(hù)者們每天都在未知的角落里上演無(wú)數(shù)次隱形的爭(zhēng)斗。哪一方是技術(shù)實(shí)力更為強(qiáng)勁,是決定道高一尺還是魔高一丈的關(guān)鍵。作為一家人工智能公司,過(guò)硬的科技實(shí)力是合合信息等科技企業(yè)突破行業(yè)難題,培育創(chuàng)新技術(shù)的底氣。AI圖像安全新技術(shù)的實(shí)現(xiàn),得益于公司在文檔圖像領(lǐng)域十余年的深耕攢下的底蘊(yùn)。
近期,合合信息相關(guān)產(chǎn)品接連獲得信通院在智能文檔處理、OCR智能化領(lǐng)域的高分評(píng)級(jí)。智能文檔處理系統(tǒng)評(píng)估結(jié)果顯示,AI核心能力方面,合合信息產(chǎn)品在NLP領(lǐng)域的文本分類、知識(shí)圖譜領(lǐng)域的實(shí)體識(shí)別、關(guān)系抽取及OCR領(lǐng)域的字符識(shí)別、文本行識(shí)別均獲得5分評(píng)分。合合信息智能文檔處理產(chǎn)品獲得“5級(jí)”評(píng)定。據(jù)悉,“5級(jí)”為該模塊最高評(píng)定等級(jí)。
OCR評(píng)估中,合合信息智能文字識(shí)別產(chǎn)品順利通過(guò)全部7項(xiàng)基礎(chǔ)類功能指標(biāo)測(cè)試以及9項(xiàng)增強(qiáng)類功能指標(biāo)測(cè)試,獲得“增強(qiáng)級(jí)”評(píng)級(jí)。評(píng)估報(bào)告認(rèn)為,公司智能文字識(shí)別產(chǎn)品展現(xiàn)出良好的性能和服務(wù)成熟度。以具有較大難度的證件類和票據(jù)類性能測(cè)試為例,面對(duì)旋轉(zhuǎn)、陰影、反光、褶皺、形變、模糊、多語(yǔ)言、低像素、光照不均等復(fù)雜場(chǎng)景,合合信息智能文字識(shí)別產(chǎn)品均有較高的識(shí)別準(zhǔn)確率,字符準(zhǔn)確率分別為99.21%和99.59%,字段準(zhǔn)確率分別為97.87%和98.42%。
測(cè)試結(jié)果還顯示,合合信息智能文字識(shí)別產(chǎn)品支持超過(guò)50種復(fù)雜語(yǔ)言的識(shí)別,為全球化、多語(yǔ)言背景下的信息智能識(shí)別提供了技術(shù)支撐。截至目前,合合信息智能文字識(shí)別、智能文檔處理相關(guān)技術(shù)已發(fā)表于CVPR、AAAI、ACL、ACM MM等國(guó)際頂會(huì)上,并在ICPR、ICFHR 等十余項(xiàng)國(guó)際競(jìng)賽中獲得冠軍?,F(xiàn)階段,公司已獲得超百項(xiàng)自主知識(shí)產(chǎn)權(quán)發(fā)明專利,為全球超過(guò)200個(gè)國(guó)家和地區(qū)的上億用戶提供智能文字識(shí)別產(chǎn)品及AI服務(wù)。未來(lái),公司將持續(xù)關(guān)注圖像領(lǐng)域新需求、新動(dòng)態(tài),用“過(guò)硬”的AI為行業(yè)發(fā)展注入安全感。
從P圖到假圖批量生成 AI圖像安全成可信AI重點(diǎn)關(guān)注方向的評(píng)論 (共 條)
