AI告你侵權(quán)?別慌,都是人訓練出來的
前段時間
一位軟件工程師
Ben?Dickson
“破獲”一家
由AI“開辦”的
詐騙律師事務(wù)所
著實讓小編看到人工智能的強大
或者說“人工”的強大
上期,我們談到人工智能變成人工智障的趣事,這一期我們來聊聊這些人工智障背后的那些小秘密——人工神經(jīng)網(wǎng)絡(luò)。話不多說,我們先從Ben的視角看看這起離奇的案子。
某天,坐在家中的Ben?Dickson收到一封名為“DMCA版權(quán)侵權(quán)通知”的郵件,聲稱他所使用的一張圖片涉嫌侵權(quán),這就讓Ben有點摸不到頭腦
了,作為一名論壇老江湖,他深知版權(quán)的重要性,明明自己使用的圖片來自于一個免費的在線圖庫Pexels,為什么這張圖突然就有了法律上的“主人”了呢?
老辣的Ben?Dickson一頓追根溯源,調(diào)查到了一家名為Arthur?Davidson的法律事務(wù)所,打開其官網(wǎng),整個官網(wǎng)做的有模有樣,甚至連域名都是正規(guī)的,這家律所自2009年到現(xiàn)在,總共參與過420起案件,其中有380場勝訴,勝訴率高達90%。
但奇怪的是,這家如此厲害的律所卻從未上過新聞,甚至連谷歌都沒有相關(guān)的信息和報道。除此以外,盡管這家律所已經(jīng)成立了13年,但官網(wǎng)所用域名卻是在
2022年2月才剛剛建立的。當然,僅憑這些疑點去斷定這家律師是假的顯然不夠嚴謹。而在打開這些律師的詳情頁面后,他已經(jīng)可以確定這家
Arthur?Davidson絕對是一家假的律所。
Ben在經(jīng)過對比律師的照片后發(fā)現(xiàn),包括與他聯(lián)系的律師在內(nèi),這些名校出身的律師全部都是AI的“杰作”:他們的照片全部都是由生成對抗網(wǎng)絡(luò)GAN創(chuàng)建的圖片,也就是說這些人根本不存在。

既然這些人全都不存在,那么這起侵權(quán)郵件的騙局也不攻自破,而這其中所運用的人工智能技術(shù)讓身邊滿是“人工智障”的小編感到驚訝,這些新奇AI換臉技術(shù)是依靠什么實現(xiàn)的呢?這就不得不提到是時下大熱的深度學習了。
深度學習是機器學習領(lǐng)域的一個分支,20多年來,通過一系列的商業(yè)應(yīng)用主導(dǎo)了人工智能的研究,而深度學習的概念則來自于人工神經(jīng)網(wǎng)絡(luò)的研究。與人腦的認知結(jié)構(gòu)相似,深度學習也是根據(jù)層次化的概念體系來理解世界,通過不同層次中概念的關(guān)系來定義這些概念。
說?人話就是:像嬰兒認識這個世界一樣,由淺入深的學習。比如人們區(qū)別棕櫚樹和椰子樹,同樣是由樹干、樹枝、樹葉組成的植物,人們會先通過一些顯著的特
征進行?區(qū)別,再次細化后會通過樹皮、葉片裂紋等信息判斷,如果想要再深入一點,還會有花期、種植適宜溫度等,深度學習也是如此。
而隨著訓練數(shù)據(jù)量以及計算機軟硬件水平的飛速發(fā)展,深度學習的規(guī)模也逐漸擴大,精度也在不斷提高,在著名的ImageNet競賽上,AI在識別約1000類物體的準確率上已達到95%。當然,也有大量的深度學習模型被不斷地被開發(fā)出來,例如:
卷積神經(jīng)網(wǎng)絡(luò)
(Convolutional?Neural?Network,?CNN)
第一個解決重要商業(yè)應(yīng)用的神經(jīng)網(wǎng)絡(luò),適用于諸多領(lǐng)域且表現(xiàn)優(yōu)異。
循環(huán)神經(jīng)網(wǎng)絡(luò)
(Recurrent?Neural?Network,?RNN)
用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),能以很高的效率對序列的非線性特征進行學習?。
遞歸神經(jīng)網(wǎng)絡(luò)
(Recursive?Neural?Network)
主要用于自然語言處理和計算機視覺,與循環(huán)神經(jīng)網(wǎng)絡(luò)不同,它的結(jié)構(gòu)并非鏈狀而是樹狀結(jié)構(gòu)。
生成式對抗網(wǎng)絡(luò)
(Generative?Adversarial?Nerwork,GAN)
一種基于可微生成器網(wǎng)絡(luò)的一種生成式建模方法,主要解決的問題是從訓練樣本中學習新的樣本。
好的模型是深度學習能否成功的關(guān)鍵之一,通過這些優(yōu)秀的模型,人們已在商業(yè)領(lǐng)域成功實現(xiàn)了深度學習的部分價值,例如語音助手、刷臉支付、自動翻譯、圖片
識別等等。但就在深度學習實現(xiàn)價值的同時,我們可以發(fā)現(xiàn),深度學習的訓練數(shù)據(jù)量以及參數(shù)量也在以驚人的勢頭增長:支撐深度學習,或者說人工智能的重要因素
就是算力規(guī)模以及基礎(chǔ)設(shè)施。

這堵無形的墻在制約著人工智能發(fā)展的同時,也是促使其逐漸成熟的動力之一。在這方面,作為未來科技領(lǐng)航者的戴爾,擁有十分豐富的人工智能解決方案以及諸多適用于AI的基礎(chǔ)設(shè)施,助力企業(yè)在AI時代破浪前行。
例如新一代戴爾PowerEdge服務(wù)器,充分利用最新第三代英特爾?至強?Platinum處理器的優(yōu)勢,在提供極高可靠性的同時,兼顧高算力、高穩(wěn)
定性和敏捷性,幫助PowerEdge為至關(guān)重要的工作負載提供支持,PCle?Gen?4.0也極大的提高了吞吐性能;每臺服務(wù)器最多可配置最多六個
GPU加速器,能夠滿足嚴苛的數(shù)據(jù)密集型工作負載。

值得一提的是,戴爾PowerEdge服務(wù)器也擁有強大的自主智能,其內(nèi)部嵌入的OpenManage?Enterprise系統(tǒng)管理控制臺能夠減少落地步驟,節(jié)約開發(fā)人員寶貴的時間,幫助用戶實現(xiàn)自主部署、配置以及管理的基礎(chǔ)架構(gòu)。
當?然,訓練人工智能需要應(yīng)對各種不同的工作負載,除了算力以外,海量的數(shù)據(jù)以及數(shù)據(jù)的實時處理也是人工智能訓練的重中之重。對此,戴爾
PowerScale?作為橫向擴展的NAS存儲,可在單個文件系統(tǒng)中擴展PB級容量,它搭載的新一代OneFS系統(tǒng),能夠確保開發(fā)人員加快分析速度,更
快的獲取訓練結(jié)果。
面對極為嚴苛的人工智能工作負載,戴爾PowerScale可以憑借強大的自動分層技術(shù)以及橫向擴展結(jié)構(gòu),消除傳統(tǒng)存儲解決方案的性能瓶頸,為海量訓練數(shù)據(jù)及參數(shù)提供一致、可靠的性能。
人類大腦的進化是為了適應(yīng)不斷變化的外部環(huán)境以及由其引起的一系列新的挑戰(zhàn),人工智能就像人類大腦在新時代的一次全新的進化方向。目前,人工智能正在以迅猛的勢頭不斷發(fā)展,而戴爾科技也將以自身的科技優(yōu)勢支持企業(yè)在這片未知的領(lǐng)域中不斷前行。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??