最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【本科啟蒙論文】基于圖像修復(fù)淺談數(shù)字圖像處理技術(shù)的發(fā)展

2022-09-25 16:42 作者:當(dāng)心山藥  | 我要投稿

前言:因?yàn)椴幌朐诒究破陂g認(rèn)真寫的文章,只是給課程評(píng)個(gè)分就消失,所以在專欄投一下稿。

這個(gè)系列就叫【本科啟蒙論文】?


摘要:圖像修復(fù)技術(shù)近二十年來(lái)有了巨大的發(fā)展和變化。圖像修復(fù)技術(shù)與計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)的發(fā)展進(jìn)程有一定的相似之處。通過(guò)介紹圖像修復(fù)技術(shù)引出通過(guò)計(jì)算機(jī)自動(dòng)計(jì)算修復(fù)圖像的新方案,并介紹最新的計(jì)算機(jī)視覺(jué)技術(shù)來(lái)概括數(shù)字圖像處理技術(shù)的發(fā)展。

關(guān)鍵詞:圖像修復(fù)、CVPR、計(jì)算機(jī)視覺(jué)、圖像識(shí)別、計(jì)算機(jī)深度學(xué)習(xí)

????????網(wǎng)紅經(jīng)濟(jì)的發(fā)展吸引了大量的游客前往網(wǎng)紅景點(diǎn)“打卡”。門庭若市的網(wǎng)紅店卻讓其他顧客的身影作為照片的背景。實(shí)在是不討人歡喜,快速去掉背景中不想要的圖像,填補(bǔ)上原本的風(fēng)景,是一項(xiàng)十分實(shí)用的技術(shù)。

????????摳圖本質(zhì)是就是計(jì)算機(jī)對(duì)圖片進(jìn)行計(jì)算學(xué)習(xí),對(duì)不需要的部分進(jìn)行自動(dòng)填補(bǔ)的圖像修復(fù)技術(shù)。這項(xiàng)技術(shù)還能夠應(yīng)用到老舊照片的修復(fù)和還原上。對(duì)于年久破損和氧化明顯的老照片來(lái)講,數(shù)字化方法是挽救這些照片的最好手段[1]。在沈銘先生的文章中我了解到,在20年前的時(shí)候,圖像處理技術(shù)值能夠?qū)崿F(xiàn)對(duì)顏色的調(diào)整后,設(shè)置選區(qū)羽化值,實(shí)現(xiàn)顏色的彌合過(guò)渡,來(lái)實(shí)現(xiàn)顏色盡量接近自然的顏色。經(jīng)過(guò)Photoshop3.0到2021的版本迭代,如今的Photoshop已經(jīng)擁有了內(nèi)容識(shí)別,液化等自動(dòng)計(jì)算的效果,能夠最真實(shí)還原圖像缺失的部分。

????????所謂數(shù)字圖像處理技術(shù),就是計(jì)算機(jī)實(shí)現(xiàn)了對(duì)圖像進(jìn)行增強(qiáng)、分割、復(fù)原、編碼以及壓縮的處理過(guò)程。它們?cè)谶b感航空航天領(lǐng)域、醫(yī)藥醫(yī)學(xué)領(lǐng)域,通信工程領(lǐng)域都得到了廣泛的應(yīng)用。這些過(guò)程并不是計(jì)算機(jī)系統(tǒng)或者圖像處理軟件與生俱來(lái)的能力,是在人類一次又一次對(duì)于圖像處理技術(shù)的算法進(jìn)行優(yōu)化升級(jí)的過(guò)程中,計(jì)算機(jī)不斷學(xué)習(xí)而來(lái)的成果。

????????傳統(tǒng)的兩種圖像修復(fù)算法有兩種。一種是擴(kuò)散修復(fù)。對(duì)圖像比邊緣進(jìn)行一個(gè)微分運(yùn)算。向空缺內(nèi)部進(jìn)行修復(fù)填補(bǔ);一種是補(bǔ)丁修復(fù)。選取一個(gè)范圍作為補(bǔ)丁,再選取其他與之相似的區(qū)域,對(duì)其進(jìn)行填補(bǔ)。二者在圖像修補(bǔ)的過(guò)程中都有一定的局限性。前者對(duì)于一些狹小的間隙缺失處有很好的修補(bǔ)效果。后者無(wú)法完美修復(fù)一些包含語(yǔ)義的圖像。

????????為了更好的了解圖像修復(fù)技術(shù)。我們應(yīng)該了解計(jì)算機(jī)是如何分析圖像和學(xué)習(xí)新的算法的。首先我們從人的視覺(jué)出發(fā)。當(dāng)我們?nèi)庋劭吹揭黄瑘D像內(nèi)容缺失的時(shí)候,我們會(huì)先設(shè)想空白處缺失部分的結(jié)構(gòu)和邊緣,再根據(jù)包含內(nèi)容的部分對(duì)缺失部分進(jìn)行紋理和色彩的填充。而計(jì)算機(jī)要處理圖片,它需要學(xué)會(huì)分類,學(xué)會(huì)分割,學(xué)會(huì)實(shí)例檢測(cè)然后學(xué)會(huì)可以用于圖像修復(fù)的缺失部分的內(nèi)容進(jìn)行填補(bǔ)[3]。所謂的圖像修復(fù)技術(shù),就是對(duì)需要的圖像區(qū)域進(jìn)行修復(fù)使得視覺(jué)上看不到偏差圖像處理技術(shù)[3]。傳統(tǒng)的圖像修復(fù)技術(shù)各有各的弊端,而深度深層模型的出現(xiàn)給圖像修復(fù)技術(shù)帶來(lái)了更多的可能性。

????????目前用于圖像修復(fù)的深度深層模型主要有三個(gè)方面。

????????首先是對(duì)于圖像網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)置方面。網(wǎng)絡(luò)如何如何提取并且建立確實(shí)區(qū)域內(nèi)外之間的聯(lián)系與long·term之間的關(guān)系對(duì)于確實(shí)區(qū)域生成好的結(jié)構(gòu)是十分重要的。在ContextEncoders[4]中提到了一種實(shí)現(xiàn)效果優(yōu)于傳統(tǒng)圖像修復(fù)算法的修復(fù)方式。為了對(duì)缺失部分的內(nèi)容進(jìn)行預(yù)測(cè),設(shè)置一個(gè)fc層的結(jié)構(gòu)去編碼圖像上下文計(jì)算出缺失部分的內(nèi)容。缺點(diǎn)是使用這種方式只能對(duì)固定大小的圖像進(jìn)行修復(fù),結(jié)果也比較模糊。在TOG 2017的一篇論文中,提到了使用FCN加dilate卷積的網(wǎng)絡(luò)來(lái)獲得隨機(jī)輸入大小,使用global和局部判別器來(lái)獲得更清晰的結(jié)果以達(dá)到優(yōu)于fc層網(wǎng)絡(luò)算法修補(bǔ)結(jié)果的效果。

????????針對(duì)訓(xùn)練過(guò)程中masks的生成方面。在2018年的ECCV上,有團(tuán)隊(duì)提出了對(duì)于不規(guī)則圖形修復(fù)masks的重復(fù)訓(xùn)練和深度學(xué)習(xí)的概念[7]?。他們提供了相關(guān)的數(shù)據(jù)集,并被主流的文章認(rèn)可和引用。

????????最后,是對(duì)于深層深度模型整體框架設(shè)計(jì)方面。先將圖片用比較粗糙的結(jié)果將圖片補(bǔ)充完整,在進(jìn)一步優(yōu)化,生成清晰的結(jié)構(gòu)圖和匹配的紋理以達(dá)到修復(fù)圖像的效果。

????????傳統(tǒng)的Image級(jí)的方法不能處理還有強(qiáng)語(yǔ)言的圖像,而深度學(xué)習(xí)級(jí)的方法通過(guò)編解碼的方式修復(fù)圖像,會(huì)丟失一部分信息。于是,兼具二者優(yōu)點(diǎn)的圖像處理技術(shù)孕育而生。

????????基于金字塔式注意力機(jī)制的圖像修復(fù)技術(shù)[3]基本框架包含encoder,decoder,attention和discrminator四個(gè)步驟。在encoder部分,由深到淺,多次補(bǔ)全,經(jīng)過(guò)多次attention逐級(jí)補(bǔ)全之后交由decoder進(jìn)行RGB的色彩和紋理的處理。最終能夠在圖像修復(fù)中達(dá)到對(duì)人臉細(xì)節(jié)進(jìn)行修復(fù)的效果。同時(shí)新的網(wǎng)絡(luò)結(jié)構(gòu)也能讓圖像處理技術(shù)能夠接受更大規(guī)格的圖像輸入。也能夠做到對(duì)于video進(jìn)行信息提取,進(jìn)行逐幀畫面的內(nèi)容修復(fù)與補(bǔ)全。

????????CVPR、ICCV和ECCV是世界頂級(jí)的計(jì)算機(jī)視覺(jué)會(huì)議。CVPR是一年一度的國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別學(xué)術(shù)性會(huì)議。每年收錄的論文約在300篇左右。每一年都有固定的研討主題。在各種學(xué)術(shù)會(huì)議統(tǒng)計(jì)中,CVPR被認(rèn)為有著很強(qiáng)的影響力和很高的排名。目前在中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦國(guó)際學(xué)術(shù)會(huì)議的排名中,CVPR為人工智能領(lǐng)域的A類會(huì)議[8]。在巴西教育部的排名中排名為A1。基于微軟學(xué)術(shù)搜索(Microsoft Academic Search)2014年的統(tǒng)計(jì),CVPR中的論文總共被引用了169,936次.這樣一些基于交流新技術(shù)和想法的組織和聚會(huì),無(wú)疑是給圖像視覺(jué)領(lǐng)域開(kāi)放了高速公路。今年三大頂會(huì)也有從理論偏向?qū)嶋H應(yīng)用的重心轉(zhuǎn)移,使得跟多的研究人員有了更多的機(jī)會(huì)走上這樣的舞臺(tái)。

????????香港中文大學(xué)教授湯曉鷗率領(lǐng)的團(tuán)隊(duì)在全球范圍內(nèi)做出了大量深度學(xué)習(xí)原創(chuàng)技術(shù)突破:2012年國(guó)際計(jì)算視覺(jué)與模式識(shí)別會(huì)議上僅有的兩篇深度學(xué)習(xí)文章均出自其實(shí)驗(yàn)室;2011—2013年間在計(jì)算機(jī)視覺(jué)領(lǐng)域兩大頂級(jí)會(huì)議ICCV和CVPR上發(fā)表了14篇深度學(xué)習(xí)論文,占據(jù)全世界在這兩個(gè)會(huì)議上深度學(xué)習(xí)論文總數(shù)的近一半。他在2009年獲得計(jì)算機(jī)視覺(jué)領(lǐng)域兩大最頂尖的國(guó)際學(xué)術(shù)會(huì)議之一CVPR最佳論文獎(jiǎng),這是CVPR歷史上來(lái)自亞洲的論文首次獲獎(jiǎng)[9]。

?????????2021年CVCR最佳論文獎(jiǎng),是馬克思·普朗克智能系統(tǒng)研究所和蒂賓根大學(xué)團(tuán)隊(duì)的Michael Niemeyer,Andreas Geiger。他們的論文主要研究方向是:將組合式三維場(chǎng)景表示納入生成模型,可以使圖像合成更加可控。將場(chǎng)景表示為生成神經(jīng)特征場(chǎng),是我們能夠從背景中分理處一個(gè)或者多個(gè)物體。最佳學(xué)生論文提名的三篇之一Real-Time High-Resolution Background Matting[11]?,致力于實(shí)現(xiàn)實(shí)時(shí)高分辨率的背景消除研究。這都是在圖像處理和修復(fù)領(lǐng)域的最新技術(shù)。在這次CVCR中,也有國(guó)人的名字出現(xiàn)在獲獎(jiǎng)名單中。何愷明與陳鑫雷研究的連體網(wǎng)絡(luò)主要研究的是連體結(jié)構(gòu)在無(wú)監(jiān)督表征學(xué)習(xí)中的作用。對(duì)于計(jì)算機(jī)圖象識(shí)別學(xué)習(xí)有著巨大的作用。

?????????據(jù)CVPR2021官網(wǎng)數(shù)據(jù),2021年在收錄的全部學(xué)術(shù)論文中,有關(guān)3D電腦視覺(jué)領(lǐng)域的論文有44篇,占據(jù)收錄總論文的六分之一。論文數(shù)量今次于它的是關(guān)于計(jì)算機(jī)深度學(xué)習(xí)技術(shù)的,有29篇??梢愿鶕?jù)這個(gè)列表看出未來(lái)圖像處理技術(shù)和計(jì)算機(jī)視覺(jué)領(lǐng)域未來(lái)的發(fā)展方向是3D視覺(jué)領(lǐng)域,計(jì)算機(jī)深度學(xué)習(xí)的方向上仍然有“寶藏”值得我們?nèi)ド钔?。詳?D電腦視覺(jué)領(lǐng)域的論文目錄,我們又能看到有關(guān)全景圖像拼接、處理、識(shí)別、分割、計(jì)算學(xué)習(xí)的論文占了大多數(shù)。相信其中必然會(huì)有能夠改變我們?nèi)粘I畹?,不僅僅是存在于理論中的“寶石”。

????????近年來(lái),在CVPR等諸多論壇上,來(lái)自中國(guó)的身影越來(lái)越多。來(lái)自中國(guó)科學(xué)院院士譚鐵牛更是擔(dān)任 CVPR 2021?四個(gè)大會(huì)主席之一,此外,CVPR 2021 程序委員會(huì)中還有多位華人學(xué)者,包括美國(guó)肯塔基大學(xué)教授楊睿剛、上海科技大學(xué)教授虞晶怡、中山大學(xué)副教授梁小丹等。這顯示出我國(guó)的數(shù)字信息技術(shù)得到了迅速的發(fā)展,但在軟件技術(shù)方面,還是落后于別人的。在華為等龍頭企業(yè)的帶領(lǐng)下,我國(guó)一馬當(dāng)先進(jìn)入了5G時(shí)代。極快的網(wǎng)速和帶寬給了人機(jī)交互無(wú)限的可能,在硬件上遠(yuǎn)超他人的優(yōu)勢(shì),也給了圖像處理技術(shù)廣闊的發(fā)展空間。無(wú)論是人工智能、自動(dòng)駕駛、AR等新興領(lǐng)域,相信在未來(lái)幾年都會(huì)是一片藍(lán)海。而圖像處理技術(shù)必須在計(jì)算機(jī)視覺(jué)呈現(xiàn)進(jìn)行進(jìn)一步的研究與發(fā)展[2]。在三維應(yīng)力研究上,尤其是對(duì)于軍事、商用勘察作業(yè)、全景圖像處理等方面進(jìn)行研究??偠灾?,人們對(duì)于圖像處理技術(shù)的質(zhì)量和速度要求越來(lái)越高,圖像處理和修復(fù)技術(shù)也隨著美圖等操作簡(jiǎn)單的圖像處理軟件被更多的運(yùn)用于人們的生活當(dāng)中。通過(guò)不斷地提升數(shù)字圖像處理技術(shù),可以使人們的工作生活更加便利,因此,必須要加強(qiáng)對(duì)數(shù)字圖像處理技術(shù)的研究,促使數(shù)字圖像處理技術(shù)更加科學(xué)、先進(jìn)、更好的滿足人們的應(yīng)用需求[2]?。而作為相關(guān)技術(shù)的研究和從業(yè)人員,更應(yīng)該關(guān)注世界上的圖像處理技術(shù)發(fā)展趨勢(shì)和進(jìn)度,互相學(xué)習(xí)合作共贏,也在互相較量的同時(shí),引領(lǐng)更多技術(shù)的爆發(fā)和進(jìn)步。

參考文獻(xiàn)

[1]?沈 ?銘. 用數(shù)字技術(shù)處理傳統(tǒng)照片——兼談老照片的修復(fù)[J]. 攝影與攝像. 2000(12):50-51.

[2]?景學(xué)紅. 數(shù)字圖像處理技術(shù)發(fā)展的趨勢(shì)分析[J]. 數(shù)字通信世界.2019(06):129.

[3]?曾艷紅. 基于金字塔式注意力機(jī)制的圖像修復(fù)技術(shù)[R]. CVPR. 2020.

[4]?Deepak Pathak. Context Encoders: Feature Learning by Inpainting[R]. CVPR. 2016.

[5]?Satoshi?Iizuka. Globally and Locally Consistent Image Completion[R].TOG. 2017.

[6]?Yu. Generajive image inpainting with contextual attention[R].CVPR.2018.

[7]?Lie. Image Inpainting for irregular Holes Using Partial Convolutions[R].ECCV.2018.

[8]?Conference Rank.CVPR[N].2019-04-23.

[9]?劉傳書. ?AI“論劍”就要到“華山”[N]. 科技日?qǐng)?bào).2017-05-04.

[10]?小 ?勻. CVPR 2021大獎(jiǎng)公布!何愷明獲最佳論文提名,代碼已開(kāi)源[N].新智元.2021-06-22.

[11]?Shanchuan Lin. Real-Time High-Resolution Background Matting[R].CVPR.2021.


【本科啟蒙論文】基于圖像修復(fù)淺談數(shù)字圖像處理技術(shù)的發(fā)展的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
新竹县| 长沙市| 长垣县| 饶阳县| 彭山县| 惠州市| 海伦市| 滦南县| 城市| 治多县| 太湖县| 黄大仙区| 荥经县| 宝山区| 英德市| 乐都县| 建昌县| 台北市| 邵阳市| 邹平县| 申扎县| 读书| 宜州市| 盈江县| 通山县| 蓬安县| 无为县| 吉安市| 桂林市| 兴隆县| 柳河县| 大渡口区| 金乡县| 阆中市| 嫩江县| 沈丘县| 正阳县| 镇江市| 孟州市| 新晃| 海南省|