生成式AI來(lái)了,我們還能相信自己的眼睛嗎?
有句老話(huà)叫做“眼見(jiàn)為實(shí)”,然而AI技術(shù)的迅猛發(fā)展正在改變這一切,我們可能很快就不再知道如何判斷什么是真的,什么是假的。
先來(lái)考考大家的眼力。
你覺(jué)得下圖中這位金發(fā)碧眼、面帶笑容的女士是真實(shí)存在的嗎?
答案是No,這是由人工智能合成的。
再看一張圖。你覺(jué)得下圖中這位女士像是人工智能合成的嗎?
答案是Yes。
上述這兩張圖均來(lái)自“ThisPersonDoesNotExist.com”網(wǎng)站。
不止這兩張圖片,“ThisPersonDoesNotExist.com”網(wǎng)站中,每次刷新出來(lái)的人物,都是現(xiàn)實(shí)中根本不存在的。
如果不知道真相,你是否根本無(wú)法判斷出真假?
這便是生成式AI的一種應(yīng)用。
生成式AI:未來(lái)的重要技術(shù)戰(zhàn)略
日前,Gartner發(fā)布了2022年重要戰(zhàn)略技術(shù)趨勢(shì)。其中,生成式人工智能(Generative Artificial Intelligence)位列12項(xiàng)重要戰(zhàn)略之首。
同時(shí)Gartner預(yù)計(jì),到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%,而目前這一比例還不到1%。
對(duì)于生成式AI,Gartner這樣定義:通過(guò)各種機(jī)器學(xué)習(xí)(ML)方法從數(shù)據(jù)中學(xué)習(xí)工件的組件(要素),進(jìn)而生成全新的、完全原創(chuàng)的、真實(shí)的工件(一個(gè)產(chǎn)品或物品或任務(wù)),這些工件與訓(xùn)練數(shù)據(jù)保持相似,而不是復(fù)制。
簡(jiǎn)單來(lái)說(shuō),生成式AI從數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο螅⑦\(yùn)用數(shù)據(jù)生成全新、完全原創(chuàng)的新內(nèi)容,可以服務(wù)于下一代的自動(dòng)編程、藥物開(kāi)發(fā)、視覺(jué)藝術(shù)、社交、商業(yè)服務(wù)、工程設(shè)計(jì)與流程。
同時(shí),它可以被用來(lái)檢測(cè)欺詐、虛假信息和身份盜竊。
對(duì)此,市場(chǎng)調(diào)研機(jī)構(gòu)Gartner高級(jí)研究總監(jiān)高挺解釋?zhuān)墒紸I不僅僅可以判斷、還可以創(chuàng)造,實(shí)際上AI當(dāng)前最大的用途就是判斷,意味著AI的用途將有結(jié)構(gòu)性變化。
“以前我們是讓AI不停的去做判斷、去做分類(lèi)。但是在未來(lái),很多時(shí)候是需要AI不再去進(jìn)行判斷,而是說(shuō)‘來(lái)幫我生成一段代碼’,這個(gè)代碼所做的事情是從1到100,AI也能自動(dòng)生成這個(gè)代碼了。”
生成式AI的關(guān)鍵技術(shù):GANs
回到文章開(kāi)頭,AI到底是如何生成肉眼識(shí)別不出的人臉圖片呢?
這就不得不談到生成式AI的關(guān)鍵技術(shù)——生成式對(duì)抗網(wǎng)絡(luò)(GANs, Generative Adversarial Networks ),這是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一,其本質(zhì)是一種深度學(xué)習(xí)模型。
2014年,研究人員首次使用計(jì)算機(jī),利用生成對(duì)抗網(wǎng)絡(luò)GANs,創(chuàng)造出了逼真的人臉。
在原理上,生成式對(duì)抗網(wǎng)絡(luò)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)相互對(duì)立,一個(gè)生成器和一個(gè)判別器。
生成器或生成網(wǎng)絡(luò)是一個(gè)神經(jīng)網(wǎng)絡(luò),負(fù)責(zé)生成類(lèi)似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容。判別器或判別網(wǎng)絡(luò)是負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)之間的神經(jīng)網(wǎng)絡(luò)。
這兩個(gè)神經(jīng)網(wǎng)絡(luò)都經(jīng)過(guò)交替周期訓(xùn)練,生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。
可以把GANs想象成一個(gè)造假者,一個(gè)在貓捉老鼠游戲中的警察,造假者正在學(xué)習(xí)傳遞假幣,而警察正在學(xué)習(xí)檢測(cè)假幣。漸漸地,雙方在對(duì)抗中都不斷完善。
生成式AI應(yīng)用遍地開(kāi)花
生成式AI的到來(lái),推動(dòng)了多個(gè)領(lǐng)域的數(shù)字化進(jìn)程,支撐著下一代的自動(dòng)編程、內(nèi)容開(kāi)發(fā)、視覺(jué)藝術(shù)、社交、商業(yè)服務(wù)、工程設(shè)計(jì)與流程等。
2019年,F(xiàn)acebook AI創(chuàng)建了一個(gè)能夠從存量視頻中提取可控角色的系統(tǒng)。
利用該系統(tǒng),可以從日常視頻中任意創(chuàng)建虛擬人物及各種姿勢(shì)動(dòng)作,可以將一個(gè)視頻中的真人轉(zhuǎn)換成一個(gè) 3D角色,并且可以將此角色及其相關(guān)動(dòng)作轉(zhuǎn)換到新背景上,生成的角色可以和不同的背景互動(dòng)。
2020年5月,OpenAI發(fā)布GPT-3,引起業(yè)界轟動(dòng),這個(gè)模型包含1750億個(gè)參數(shù),能夠自主生產(chǎn)文本、圖像、視頻,可以自己寫(xiě)對(duì)話(huà)和電影情節(jié),幾乎分辨不出哪個(gè)是真人書(shū)寫(xiě),哪個(gè)是機(jī)器書(shū)寫(xiě),甚至生成式音樂(lè)也取得了很快的進(jìn)展。
追溯到更早時(shí)間,中國(guó)AI公司影譜科技在2018年底發(fā)布MAGC智能影像生成引擎,這也是中國(guó)區(qū)最早提出的生成式AI的技術(shù)框架,并重新定義智能影像生產(chǎn)技術(shù)。
影譜科技MAGC智能影像生成引擎可以在極短時(shí)間內(nèi)生成一段個(gè)性化視頻內(nèi)容,亦可以對(duì)拍攝視頻進(jìn)行重構(gòu),如自動(dòng)錨定關(guān)鍵幀,根據(jù)幀內(nèi)容生成原圖像中沒(méi)有的、無(wú)違和感的內(nèi)容,再智能化生成一段AI視覺(jué)內(nèi)容。
目前,影譜科技MAGC智能影像生成引擎已率先應(yīng)用在傳媒娛樂(lè)領(lǐng)域,被知名電視臺(tái)、電信運(yùn)營(yíng)商、短視頻平臺(tái)廣泛采納。
除此之外,MAGC還廣泛應(yīng)用于數(shù)字人的3D成像、影視特效制作及數(shù)字孿生、虛擬主播、虛擬課堂等數(shù)字產(chǎn)權(quán)場(chǎng)景。
《Forrester 2019-2020年Video AI技術(shù)預(yù)測(cè)》報(bào)告顯示,智能影像生產(chǎn)技術(shù)解決了大規(guī)模視頻內(nèi)容制作和特效制作成本高的問(wèn)題。
使用智能視頻技術(shù)平臺(tái),可提高視頻內(nèi)容的生產(chǎn)效率,降低人工成本60%以上。
此外,包括迪士尼、NETFLIX、HBO、TRONC等娛樂(lè)傳媒巨頭均在嘗試用人工智能代替標(biāo)準(zhǔn)內(nèi)容制作的可能。
例如,迪士尼實(shí)現(xiàn)AI自動(dòng)生成動(dòng)畫(huà),只要通過(guò)文本描述某些活動(dòng),不需要注釋數(shù)據(jù)和進(jìn)行大量訓(xùn)練就能創(chuàng)建動(dòng)畫(huà),或一個(gè)粗略的故事版和電影劇本視頻。
而Netflix所采用的算法,則可以在這部?jī)?nèi)容中抽取任意符合觀影習(xí)慣和需求的畫(huà)面,然后把這些圖片制作成內(nèi)容的封面。
事實(shí)上,降低了內(nèi)容搜尋難度,提升視頻制作效率,生成式AI已經(jīng)初步證明了自身技術(shù)與產(chǎn)品的商業(yè)價(jià)值。
2020年9月上市的Unity是3D生成型AI的推動(dòng)者。
全球有超過(guò)一半的移動(dòng)、PC和主機(jī)游戲采用了其生成引擎來(lái)制作,其3D-AI技術(shù)也廣泛應(yīng)用于工業(yè)設(shè)計(jì)的3D模型搭建,VR/AR設(shè)備內(nèi)容創(chuàng)作以及影視特效制作。
一家名為Insilico Medicine(英科智能)的AI藥物研發(fā)公司也是生成式AI的應(yīng)用者。
該公司是一家抗衰老及癌癥治療藥物研發(fā)商。2015年,Insilico Medicine在全球范圍內(nèi)率先利用生成對(duì)抗網(wǎng)絡(luò)(GANs)和強(qiáng)化學(xué)習(xí)(RL)技術(shù),生成具有特定性質(zhì)的藥物分子結(jié)構(gòu)。
從應(yīng)用場(chǎng)景可以看到,生成式AI技術(shù)正在快速迭代進(jìn)化,從“生產(chǎn)”出發(fā),擴(kuò)展至全產(chǎn)業(yè)鏈。
謹(jǐn)防生成式AI的濫用
既然生成式AI可以生成逼真的視頻、文本、字幕等,這也意味著,該技術(shù)也會(huì)被濫用于詐騙、欺詐、造謠、偽造身份等違法場(chǎng)景。
Gartner預(yù)測(cè):“可以創(chuàng)建和生成超逼真的內(nèi)容的AI能力,將對(duì)人們相信自己的眼睛所看到的產(chǎn)生變革性的影響?!?
同時(shí),Gartner從AI市場(chǎng)的5個(gè)角度進(jìn)行了預(yù)測(cè),并就企業(yè)如何應(yīng)對(duì)和適應(yīng)這些未來(lái)的挑戰(zhàn)提出了建議:
到2025年,預(yù)先訓(xùn)練的AI模型將主要集中在1%的供應(yīng)商中,這將使AI的負(fù)責(zé)任地使用成為社會(huì)關(guān)注的問(wèn)題
在2023年,成功的賬戶(hù)接管攻擊將有20%使用Deepfake,它將會(huì)成為社會(huì)工程學(xué)攻擊的一部分
到2024年,將有60%的AI提供商會(huì)將緩解危害/濫用行為作為其軟件的一部分
到2025年,將有10%的政府通過(guò)使用合成AI來(lái)避免隱私和安全問(wèn)題
到2025年,工作場(chǎng)所75%的對(duì)話(huà)將被記錄和分析,以用于增加組織價(jià)值和評(píng)估風(fēng)險(xiǎn)
這些分析中的每一個(gè)都足以使AI觀察者引起足夠的關(guān)注,如果將這些預(yù)測(cè)結(jié)合起來(lái)時(shí),就可以勾勒出未來(lái)的嚴(yán)峻形勢(shì),其中涉及道德問(wèn)題,潛在的AI濫用以及工作場(chǎng)所隱私的喪失。
如果Gartner的分析師的預(yù)測(cè)準(zhǔn)確無(wú)誤,那么關(guān)于AI帶來(lái)的隱私和真相的影響的擔(dān)憂(yōu)必將成為未來(lái)幾年的主要話(huà)題,成功的企業(yè)將需要準(zhǔn)備迅速適應(yīng)這些擔(dān)憂(yōu)。
Gartner建議企業(yè)建立負(fù)責(zé)任的AI使用標(biāo)準(zhǔn),并優(yōu)先考慮“可以證明AI能夠清晰發(fā)展和解決相關(guān)社會(huì)問(wèn)題”的供應(yīng)商。
圍繞Deepfake和生成式AI的安全問(wèn)題,Gartner建議組織安排有關(guān)Deepfake的培訓(xùn),并指出:“我們現(xiàn)在正在進(jìn)入零信任的世界。
除非使用加密的數(shù)字簽名證明它是經(jīng)過(guò)認(rèn)證的,否則任何事物都不能被信任?!?
結(jié)語(yǔ)
過(guò)去言“有圖有真相”,但是現(xiàn)在視頻都不一定代表著真相。生成式AI技術(shù)一方面在多種場(chǎng)景得到了應(yīng)用,但另一方面也有著被濫用的風(fēng)險(xiǎn)。
未來(lái),在深度偽造與鑒別偽造之間,一場(chǎng)技術(shù)博弈即將展開(kāi)。