一、認(rèn)識(shí)Sora
Sora的這一次進(jìn)展可以說是既在意料之中,也在意料之外。
所謂在意料之中是指在ChatGPT誕生不久,AI專家們都已經(jīng)形成共識(shí),預(yù)判了大模型技術(shù)勢(shì)必要從單一的文本模態(tài)向多模態(tài)發(fā)展的基本趨勢(shì)。Sora只是順應(yīng)這一趨勢(shì)而發(fā)生重大事件之一,它的誕生宣告了文生視頻、視頻編輯與生成的最新進(jìn)展。
說意料之外,是當(dāng)我們親眼看到其生成的視頻時(shí),其畫質(zhì)之精良已經(jīng)堪比最先進(jìn)的電影工業(yè)的產(chǎn)物,由此而帶來的感覺與認(rèn)知上的沖擊是格外強(qiáng)烈的。從表面上來看,其在視頻長(zhǎng)度、質(zhì)量以及可控性等方面均達(dá)到當(dāng)前的最高水平,碾壓了同類競(jìng)爭(zhēng)對(duì)手。從深層次來看,正如OpenAI的官網(wǎng)文章所表達(dá)的,Sora絕不僅僅只是個(gè)視頻生成工具,它本質(zhì)上是現(xiàn)實(shí)世界的模擬器,能夠?qū)ξ锢硎澜纭⑷祟惿鐣?huì)以及人與世界的復(fù)雜關(guān)系進(jìn)行逼真模擬與生成。一直以來,計(jì)算機(jī)領(lǐng)域?qū)τ趶?fù)雜系統(tǒng)的模擬就是個(gè)難題,數(shù)字孿生、游戲引擎、虛擬現(xiàn)實(shí)、數(shù)字仿真、電影制作等等領(lǐng)域都涉及對(duì)現(xiàn)實(shí)世界的復(fù)雜系統(tǒng)模擬。可以說Sora的誕生宣告了人工智能在對(duì)現(xiàn)實(shí)世界的模擬方面能力達(dá)到了前所未有的水平,也可以說是對(duì)傳統(tǒng)相關(guān)工具形成了降維打擊態(tài)勢(shì)。
當(dāng)然,我們也不得不承認(rèn),Sora仍然存在一些局限,比如對(duì)于物理世界的一些瞬時(shí)事件(諸如杯子摔落的瞬間),現(xiàn)實(shí)世界的一些物理常識(shí)(比如說運(yùn)行的束絲機(jī)斷線不停機(jī)),以及一些細(xì)節(jié)呈現(xiàn)(比如有專家發(fā)現(xiàn)中國(guó)舞龍視頻場(chǎng)景中的中國(guó)字多屬于編造的錯(cuò)字),仍然存在著明顯問題。
這些問題從根本上來講可以歸結(jié)于高質(zhì)量、高精度數(shù)據(jù)的缺失,或者是相應(yīng)物理場(chǎng)景的數(shù)據(jù)稀缺。比如瞬時(shí)狀態(tài)的視頻在總體樣本中的累積時(shí)長(zhǎng)是相對(duì)較短的。但是我相信這些問題只要建立合理的診斷與發(fā)現(xiàn)機(jī)制,很快就可以通過增強(qiáng)長(zhǎng)尾場(chǎng)景的樣本供給,增強(qiáng)合成數(shù)據(jù),以解決相應(yīng)的問題。
Sora的重大意義在于宣告了AGI技術(shù)路線在世界模擬這一能力上已然走通,這是具有戰(zhàn)略意義的事件,剩下的細(xì)枝末節(jié)的提升與完善總體而言是屬于戰(zhàn)術(shù)層面。觀察OpenAI這幾年的發(fā)展,該公司似乎從不在戰(zhàn)術(shù)層面的問題上浪費(fèi)寶貴時(shí)間與資源,這一點(diǎn)是值得我們學(xué)習(xí)的。所以我們要以更積極的心態(tài)去看待Sora,承認(rèn)這個(gè)里程碑式的進(jìn)展的積極意義,深入思考它有可能給我們的人類社會(huì)所帶來的全新的機(jī)遇以及全新挑戰(zhàn)。
那么對(duì)于物理世界的這種模擬究竟難在哪里呢?此前的Runway和Pica,我們多少可以明顯看出其生成的諸多問題(比如威爾史密斯吃面條的視頻,史密斯的形象總體上是明顯扭曲)。事實(shí)上,這些問題歸根結(jié)底是在于其視頻所生成的內(nèi)容違背了現(xiàn)實(shí)世界的物理規(guī)律或人類社會(huì)的文化習(xí)俗。而Sora基本解決了這方面的問題,而且是能夠在更大時(shí)空范圍內(nèi)解決這一問題,時(shí)長(zhǎng)長(zhǎng)度從AI視頻生成的幾秒鐘時(shí)間拉長(zhǎng)到了一分鐘。在較長(zhǎng)時(shí)空范圍內(nèi)能夠生成遵循物理規(guī)律、社會(huì)習(xí)俗的視頻是十分困難的。要知道即便是幾秒鐘的視頻,其所表達(dá)的信息量也是十分巨大的,對(duì)于我們這世界的表達(dá)是驚人的。一個(gè)幾秒鐘的視頻就能泄漏關(guān)于我們所在世界的大部分秘密。比如“一個(gè)時(shí)尚的女子行走在東京街頭”這個(gè)視頻,揭示了人類這個(gè)物種的生物特征,展示了人類文化的基本形態(tài),展現(xiàn)了人類行走的形態(tài),暗含了地球的重力狀態(tài),呈現(xiàn)了豐富的人文環(huán)境,暗示了豐富多彩的人與世界的復(fù)雜關(guān)系……在一個(gè)一分鐘視頻所展示的世界中,其物理環(huán)境和人文環(huán)境之復(fù)雜度是驚人的。Sora能夠做到如此逼真的模擬,完全吻合物理規(guī)律、文化習(xí)俗、生活常識(shí),各種對(duì)象與要素之間的空間關(guān)系、時(shí)序關(guān)系也是合情合理。更為難得的是,即便在一些想象的場(chǎng)景,其所生成的“想象”視頻也是合乎人類的想象邏輯,而非是隨機(jī)亂象,其視頻生成的質(zhì)量完全達(dá)到了電影行業(yè)的最高水平。
傳統(tǒng)的計(jì)算機(jī)模擬仿真都需要借助復(fù)雜的數(shù)學(xué)模型。每一類物理現(xiàn)象有著復(fù)雜的數(shù)學(xué)模型,比如煙花爆炸、火焰噴發(fā)、海浪波動(dòng)、動(dòng)物行走。一分鐘視頻里面涉及太多模型,導(dǎo)致傳統(tǒng)計(jì)算機(jī)合成技術(shù)難以承受影視制作的高昂代價(jià)。2019年的“真獅版”的《獅子王》基本上代表了傳統(tǒng)計(jì)算機(jī)輔助生成技術(shù)在影視制作行業(yè)的最高水平。創(chuàng)作團(tuán)隊(duì)為了再現(xiàn)真實(shí)獅子的動(dòng)作、形態(tài)與毛發(fā),動(dòng)用了Maya、ZBrush、Houdini等建模軟件,還借助了VR拍攝設(shè)備和工具,比如Oculus Rift、HTC Vive等,累計(jì)制作成本接近1.5億美元。而現(xiàn)在Sora只需要一句自然語言提示就能生成與之相媲美的高質(zhì)量視頻段落。以此來看,影視制作行業(yè)的發(fā)展形態(tài)必被重塑。
二、Sora的產(chǎn)業(yè)影響
我相信Sora背后的技術(shù)絕不會(huì)停留在影視制作,具有重大商業(yè)價(jià)值的無人駕駛或許也將面臨一次重大機(jī)遇。無人駕駛非常重要的一個(gè)問題是借助無人駕駛汽車的感知設(shè)備(包括雷達(dá)和攝像頭),對(duì)汽車行駛路況和周邊環(huán)境進(jìn)行實(shí)時(shí)感知和建模。借助海量的駕車數(shù)據(jù)、交通攝像頭數(shù)據(jù),Sora從原理上來講是有可能在無人駕駛場(chǎng)景對(duì)汽車行駛環(huán)境進(jìn)行高精度模擬和建模的,其一旦能在無人駕駛形成應(yīng)用,無疑又給大模型產(chǎn)業(yè)注入全新推動(dòng)力。
Sora對(duì)現(xiàn)實(shí)世界的建模與模擬能力,相信很快就會(huì)在具有更高價(jià)值、更為廣闊的場(chǎng)景中取得應(yīng)用。工業(yè)制造、游戲引擎、數(shù)字孿生、教學(xué)仿真以及前幾年的元宇宙,都將從Sora背后的生成式世界模擬能力中受益。
比如說在我們的工業(yè)制造,也需要大量的專業(yè)性極強(qiáng)的仿真和模擬才能對(duì)設(shè)備運(yùn)行進(jìn)行診斷與預(yù)測(cè)。借助傳統(tǒng)工業(yè)機(jī)理模型的樣本合成,再借助Transformer架構(gòu)一個(gè)面向特定工業(yè)場(chǎng)景的Sora模擬器,從而極大提升工業(yè)場(chǎng)景模擬能力的泛化性,似乎是一個(gè)可行的技術(shù)路線。Sora背后的技術(shù)與傳統(tǒng)行業(yè)的深度融合將進(jìn)一步釋放生成式AI的產(chǎn)業(yè)價(jià)值,進(jìn)一步推動(dòng)AI與實(shí)體經(jīng)濟(jì)的深度融合,也有利于AI技術(shù)自身的進(jìn)一步迭代演進(jìn)。
我相信未來的科學(xué)發(fā)現(xiàn)也將從Sora的這次進(jìn)展中受益良多。Sora一個(gè)基本啟發(fā)在于數(shù)據(jù)的充分訓(xùn)練后,其可以遵循數(shù)據(jù)背后所蘊(yùn)含的基本原理進(jìn)行建模。Sora視頻生成中所呈現(xiàn)的多是物理規(guī)律、社會(huì)規(guī)律。事實(shí)上,科學(xué)認(rèn)知世界有著不同的側(cè)面,細(xì)分為不同的學(xué)科。我們是否也可以想象如何借助AI對(duì)其他學(xué)科,比如化學(xué)、生物等,也進(jìn)行類似的數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)。成就Sora的技術(shù)原理遷移到其他學(xué)科是可能的,因?yàn)楸举|(zhì)上所有學(xué)科基本上就是表達(dá)各類實(shí)體、概念的時(shí)空規(guī)律、因果規(guī)律。Sora至少已經(jīng)向我們展示了從視頻數(shù)據(jù)學(xué)習(xí)物理和社會(huì)相關(guān)的時(shí)空規(guī)律、因果規(guī)律的可能性。一旦能建模某個(gè)學(xué)科的規(guī)律,進(jìn)而能夠生成某個(gè)學(xué)科的現(xiàn)象,AI就一定能成為助推該學(xué)科發(fā)展的利器。
三、Sora的社會(huì)影響
AI能力的每一次進(jìn)步,給人類社會(huì)帶來的既是重大機(jī)遇,也是重大挑戰(zhàn)。我們?cè)诜e極擁抱這些全新機(jī)遇的同時(shí),也要嚴(yán)肅思考潛在挑戰(zhàn),并積極應(yīng)對(duì)。
AI的建模能力可以視作其對(duì)世界的“理解”能力。當(dāng)我們使用“理解”一詞時(shí)便暗含了存在這個(gè)行為的主體。在全部人類歷史上,理解的主體是人,但如果不承認(rèn)機(jī)器作為主體地位的話,便談不上所謂的機(jī)器“理解”。人類理解世界的結(jié)果也是為了表達(dá)世界,創(chuàng)造新的世界。從這個(gè)意義來講,當(dāng)機(jī)器能像人類一樣重建某個(gè)概念的實(shí)例(比如“在東京街頭行走的時(shí)尚女性”),便可被視作具備一定的理解能力。對(duì)機(jī)器而言,精準(zhǔn)建模就是“理解”世界的基本方式。Sora借助數(shù)據(jù)驅(qū)動(dòng)方式取得了對(duì)現(xiàn)實(shí)世界的驚人建模與模擬能力,這種能力甚至是遠(yuǎn)超人類對(duì)世界的認(rèn)知能力的。
機(jī)器對(duì)于世界的建模或認(rèn)知可能比人類更接近世界本原之真相。數(shù)千年來,人類一直采取各種方式認(rèn)知這個(gè)復(fù)雜的現(xiàn)實(shí)世界。神話、宗教、科學(xué)都是人類認(rèn)知世界的方式。但不管是哪一種認(rèn)知方式都是對(duì)世界本原的一種簡(jiǎn)化理解。日常生活中,人們傾向于使用語言表達(dá)對(duì)于世界的體驗(yàn);科學(xué)研究中,科學(xué)家傾向于用公式表達(dá)對(duì)世界的認(rèn)知。但符號(hào)公式一定程度上都是對(duì)非線性的復(fù)雜世界的一種簡(jiǎn)化還原。絕大部分經(jīng)典理論都是在各種假設(shè)與前提下才能建立,這些假設(shè)與前提都是人類認(rèn)知復(fù)雜世界所作出的妥協(xié)。
兩千多年來,人類從來沒有停止過對(duì)自身認(rèn)知能力的懷疑。先哲們的這種懷疑是完全值得我們重視的。世界的本原也許未必如人類所認(rèn)知的情形。數(shù)百億、千億參數(shù)的大模型可能比人類學(xué)習(xí)更加充分,其能夠?qū)W習(xí)到蘊(yùn)含于海量數(shù)據(jù)人類難以覺察、難以表達(dá)的暗知識(shí)、潛在規(guī)律。
機(jī)器對(duì)于世界認(rèn)知能力將顯著超越人類個(gè)體。如果將機(jī)器的建模能力認(rèn)定為是一種對(duì)世界的認(rèn)知能力,那么我們可能不得不承認(rèn),人類的認(rèn)知能力相對(duì)于機(jī)器認(rèn)知能力而言是存在著明顯缺陷的。人類的認(rèn)知總體而言是線性的、有限的、簡(jiǎn)單的。一直以來數(shù)學(xué)領(lǐng)域?qū)?fù)雜非線性系統(tǒng)的建模都是重大挑戰(zhàn)。在復(fù)雜決策時(shí),人能同時(shí)考慮的決策變量是十分有限的,所謂的抓大放小、抓住主要矛盾的決策方式,本質(zhì)上都是人類認(rèn)知能力不足情況下的妥協(xié)之計(jì)。然而,AI卻可以在數(shù)以百萬計(jì)、千萬計(jì)的決策變量下進(jìn)行決策。隨著人工智能的進(jìn)一步發(fā)展,機(jī)器的感知維度也更加多元。機(jī)器所感知的范圍遠(yuǎn)遠(yuǎn)超過人類,比如高清攝像頭可以將遠(yuǎn)在幾公里范圍之外的景象看得清清楚楚。機(jī)器的這類超級(jí)認(rèn)知能力仍然有待我們深入研究,用好機(jī)器的這種超級(jí)認(rèn)知能力將給人類發(fā)展創(chuàng)造全新機(jī)遇。
一定程度的自主學(xué)習(xí),人類先驗(yàn)知識(shí)的合理褪除,是成就Sora驚人效果的關(guān)鍵。事實(shí)上,人工智能最近幾年的發(fā)展一而再、再而三地說明,人類專家越少的干預(yù)反而越能產(chǎn)生好的模型效果。自然語言處理領(lǐng)域曾經(jīng)發(fā)生過每開除一個(gè)語言學(xué)專家,機(jī)器翻譯系統(tǒng)的效果就提升幾點(diǎn)的尷尬事實(shí)。這樣的故事也延續(xù)到了大模型時(shí)代。這不得不讓我們反思,人類對(duì)物理世界、人類社會(huì)皓首窮經(jīng)所積累的全部知識(shí),在發(fā)展機(jī)器智能面前似乎顯得毫無價(jià)值,甚至起著負(fù)作用。人類對(duì)于發(fā)展機(jī)器智能的真正價(jià)值似乎只在于設(shè)定一個(gè)認(rèn)知世界先驗(yàn)載體(Transformer等模型架構(gòu)),準(zhǔn)備好訓(xùn)練素材(高質(zhì)量訓(xùn)練數(shù)據(jù)),使用大規(guī)模算力進(jìn)行訓(xùn)練。想想人類的優(yōu)質(zhì)教育,何嘗不是搭建好良好的學(xué)習(xí)環(huán)境,準(zhǔn)備好所有的學(xué)習(xí)條件,給予學(xué)生充分訓(xùn)練與試錯(cuò)機(jī)會(huì),而不是填鴨式的知識(shí)灌輸和空洞的反復(fù)說教。人類的過往知識(shí)相對(duì)于機(jī)器而言似乎并不重要。想想人類社會(huì)代際間的經(jīng)驗(yàn)與知識(shí)傳承,我們這代人的知識(shí)與經(jīng)驗(yàn)又有多少會(huì)被我們的下一代所認(rèn)可而繼承呢?
激發(fā)人類的想象力。人類的想象力通常是在看到實(shí)物之后得到極大的激發(fā)。當(dāng)我們的創(chuàng)意還僅僅停留在文字或腳本階段時(shí),它對(duì)我們的心靈的撞擊仍然是有限的,親眼所見帶來的感官體驗(yàn)對(duì)心靈的震撼是難以言表的。從這個(gè)意義上來講,Sora的出現(xiàn)降低了創(chuàng)意和想象的視覺實(shí)現(xiàn)代價(jià)和門檻,它將極大地激發(fā)人類的想象力。人類的想象力或許會(huì)在AI工具的助力下實(shí)現(xiàn)一次躍遷或升級(jí)。
Sora進(jìn)展也在刷新我們對(duì)于人類創(chuàng)造能力的理解。從AI實(shí)現(xiàn)視角來看,人類創(chuàng)造的本質(zhì)或許就是在更大的內(nèi)容或者理論生成空間中進(jìn)行合理選擇。ChatGPT和Sora這一類大模型在海量數(shù)據(jù)的喂養(yǎng)下,對(duì)現(xiàn)實(shí)世界進(jìn)行了壓縮表達(dá),進(jìn)而可以以較低的信息損失度還原世界本原。在大模型的生成過程可以視作是在更大語義空間上進(jìn)行高效的內(nèi)容枚舉或檢索,這個(gè)語義空間可能比人類所能理解的語義空間大得多,這也將幫助人類拓展想象空間,提升人類的創(chuàng)造力。
人人都能創(chuàng)作的時(shí)代即將到來。Sora的大規(guī)模應(yīng)用將會(huì)極大地降低視頻創(chuàng)造、內(nèi)容創(chuàng)作的專業(yè)門檻。內(nèi)容生成的速度、質(zhì)量、效率都會(huì)前所未有地提高。文化娛樂行業(yè)的井噴式發(fā)展或許將成為現(xiàn)實(shí)。未來我們的小學(xué)生,但凡有足夠創(chuàng)意并且能夠用自然語言表達(dá)自己的創(chuàng)作腳本,都有可能制作一部屬于自己的影視作品。但是值得注意的是,創(chuàng)造過程的另一個(gè)必要環(huán)節(jié)在于評(píng)價(jià)。什么是符合人類真善美標(biāo)準(zhǔn)的,仍然還需要以人類的尺度與標(biāo)準(zhǔn)進(jìn)行檢視。人是萬物的尺度,在AI時(shí)代仍然適用。對(duì)于AI生成內(nèi)容,人類是唯一合格的評(píng)價(jià)者,人是AI的造物主,也是AI的尺度。
人人皆可創(chuàng)造看上去帶來了一個(gè)所謂“AI平權(quán)”的美好未來。但從長(zhǎng)遠(yuǎn)來看,它也可能帶來一些潛在的社會(huì)問題。人人都是導(dǎo)演、人人皆可制作,這意味著什么?藝術(shù)作品的總量可能遠(yuǎn)遠(yuǎn)超出生命的長(zhǎng)度(即便壽命得以翻倍),即便窮盡一生也難以體驗(yàn)可能萬分之一優(yōu)秀文化遺產(chǎn)。審美對(duì)象的廉價(jià)與泛濫或造成人類審美情趣的倒退、體驗(yàn)欲望的消失。
每天吃肉,吃肉的欲望就會(huì)大大降低;天天過生日,生日的驚喜就會(huì)喪失了。人類的審美體驗(yàn)所賴以實(shí)現(xiàn)的感覺與情感會(huì)在高頻刺激下變得麻木而遲鈍。美之為美或許正在于它的稀缺性。我們偶爾看一場(chǎng)《熱辣滾燙》電影一定會(huì)為了主人公的執(zhí)著與努力而深深感動(dòng),但是如果在AI技術(shù)加持下每天給你生成一部“打雞血”題材的電影,你的靈魂只怕只會(huì)麻木到直打哈欠。偶爾一次的藝術(shù)經(jīng)驗(yàn)是人生體驗(yàn)的升華,每天都喝雞湯,那大概率就是PUA。提不起興趣,打不起精神,本已經(jīng)是現(xiàn)代人的通病。Sora等直擊人類體驗(yàn)的AI技術(shù)恐將進(jìn)一步放大的人類的無意義感。
無孔不入的AI應(yīng)用,不加節(jié)制的AI濫用給人類帶來的更可能是灰暗的明天。AI的大規(guī)模使用或許會(huì)使我們?nèi)松械拿繒r(shí)每刻都更加高效、更富意義。我們?nèi)松拿糠置棵牖蛟S在AI的助力下都能成為我們的高光時(shí)刻。然而,偉大是相對(duì)于平庸而言的。人類唯有經(jīng)歷日常的平庸現(xiàn)實(shí)體驗(yàn)才能感受那如電光石火一般轉(zhuǎn)瞬即逝的審美或崇高體驗(yàn)。每時(shí)每刻都是高光時(shí)刻也就從根本上毀滅了高光時(shí)刻對(duì)于人生的意義。我們生活中的每時(shí)每刻如果都被AI賦能,恐將加速人類生存意義的毀滅。日常生活的“無意義”的最大意義或許就是在于成就那片刻的重大“意義”。AI的應(yīng)用應(yīng)該給人們?nèi)粘I畹陌l(fā)呆與無聊留有余地,要為人類在未來AI時(shí)代的快速發(fā)展留下其在嬰童期田園漫步的美好回憶。與物理世界的直接交互體驗(yàn),近乎刀耕火種一般的田園體驗(yàn)或許將是AI時(shí)代更令人珍惜的片刻。
伴隨通用人工智能技術(shù)的進(jìn)一步發(fā)展,人類文明或許將進(jìn)入一個(gè)“亂糟糟”的盤整期,其基本特征是“剪不斷,理還亂”。剪不斷的是難以割舍的人工智能給我們帶來的先進(jìn)生產(chǎn)力,以及隨之而來的巨大社會(huì)福利。理不亂的是AI作為一種新型智能體,盲目插足人類的倫理道德與情感事物,從而攪亂人類的精神世界。
在AI技術(shù)之前,人類的精神世界完全百分之百體現(xiàn)的是人類自身的意志。伴隨著AI制作工作的大量使用,未來的藝術(shù)作品還有多大程度上是在體現(xiàn)人類的創(chuàng)作意志,這是個(gè)值得思考的問題。看看Sora在人類有限提示下完成的視頻生成,其生成內(nèi)容可以說已經(jīng)不是人類意志的完整體現(xiàn)。或許會(huì)有人說,Sora畢竟還是依賴人類的提示,提示不就在體現(xiàn)人類的意志么。那么要知道,同一段提示,不同的AI工具,甚至是同一個(gè)工具的不同版本或者不同輪次的生成,其結(jié)果都有差異。這個(gè)差異所在就是機(jī)器“意志”之體現(xiàn)。所以AI已經(jīng)在人類提示基礎(chǔ)上植入了來自模型的“意志”。或許會(huì)有人說,Sora也是從人類制作的視頻所學(xué)習(xí)的,其學(xué)習(xí)的數(shù)據(jù)源頭是人類社會(huì)產(chǎn)生的,體現(xiàn)的是人類意志。但是一方面訓(xùn)練AI的數(shù)據(jù)是個(gè)集合體,其體現(xiàn)的是人類群體的創(chuàng)作意志;另一方面隨著合成數(shù)據(jù)的大量使用,機(jī)器泛化能力已經(jīng)進(jìn)一步增強(qiáng),創(chuàng)作者通過Sora這類AI工具所體現(xiàn)的個(gè)人自由意志的成分可能會(huì)逐漸減少。
隨著Sora等視頻生成技術(shù)的大規(guī)模應(yīng)用,人類的感知與認(rèn)知功能紊亂是個(gè)值得擔(dān)憂的問題。當(dāng)AI生成做到了以假亂真,人類的感覺和知覺系統(tǒng)已經(jīng)無法判斷真?zhèn)巍,F(xiàn)實(shí)世界和虛擬世界的邊界日益模糊,將造成人類感知與認(rèn)知功能紊亂與障礙。越來越多的人看到了Sora生成視頻后發(fā)出了現(xiàn)實(shí)世界的懷疑。當(dāng)我們將來沉浸在由人工智能所生成的虛擬世界的時(shí)候,其逼真程度與現(xiàn)實(shí)就完全沒有差別。那么影視作品《西部世界》中所描繪的人機(jī)共生社會(huì)所存在的一系列問題將不可避免的在人類社會(huì)出現(xiàn)。在一個(gè)以假亂真的虛擬世界中,射殺一個(gè)虛擬智能體,這是人類在情感上能接受的事實(shí)嗎?人類的認(rèn)知功能的紊亂,勢(shì)必會(huì)帶來進(jìn)一步的我們的情感和倫理事務(wù)的混亂等一系列問題。所以一個(gè)人類文明盤整期到來似乎是必然,在這個(gè)盤整期我們需要重新劃定AI應(yīng)用的邊界,建立AI應(yīng)用的準(zhǔn)則。
人類幾千年來所建立起來知識(shí)體系面臨著崩塌的風(fēng)險(xiǎn)。這一風(fēng)險(xiǎn)隨著人工智能技術(shù)的進(jìn)步可能會(huì)日益增大。以人類理解世界的方式所建立起來的認(rèn)知世界本原的知識(shí)體系,是在人類的直覺經(jīng)驗(yàn)基礎(chǔ)之上建立起來的。在AI生成對(duì)人感知能力的強(qiáng)大沖擊下,人類越加不再確信自己的感知與認(rèn)知能力,這勢(shì)必會(huì)引發(fā)人們對(duì)已經(jīng)建立的知識(shí)體系的懷疑,勢(shì)必會(huì)質(zhì)疑對(duì)世界本原的所建立已有認(rèn)知。
AI大發(fā)展時(shí)代,如何重建人類的認(rèn)知體系,如何重拾認(rèn)知世界的信心,都是未來我們需要積極回應(yīng)的命題。從積極角度來看,機(jī)器的認(rèn)知體系至少是人類現(xiàn)有認(rèn)知體系的有益補(bǔ)充。人類擅長(zhǎng)構(gòu)建抽象的、符號(hào)化、離散的、簡(jiǎn)潔的知識(shí)體系;而機(jī)器擅長(zhǎng)構(gòu)建具象的、數(shù)值化、連續(xù)的、復(fù)雜的知識(shí)體系。
四、對(duì)于AI發(fā)展所應(yīng)秉持的基本態(tài)度
那么,對(duì)于AI的發(fā)展,我們應(yīng)該秉持一種什么樣的態(tài)度呢?
AI發(fā)展具有時(shí)代必然性,是先進(jìn)生產(chǎn)力的代表。為此,我們應(yīng)該以積極心態(tài)擁抱AI技術(shù)浪潮的到來,同時(shí)做好AI發(fā)展所引發(fā)的社會(huì)變革的應(yīng)對(duì)與準(zhǔn)備工作。很多人認(rèn)為AI是平權(quán)的機(jī)會(huì)。事實(shí)上,如果不加以合理的干預(yù)和監(jiān)管,AI更可能成為集權(quán)的利器。很多人認(rèn)為AI是人類發(fā)展的超能力,但如果不加以合理的干預(yù)和監(jiān)管,人類會(huì)被這種能力反噬。好萊塢電影漫威電影不止一次的告誡人類超級(jí)英雄很容易被其超能力所反噬,這多少是對(duì)當(dāng)下人類社會(huì)發(fā)展近況的一種隱喻。沒有對(duì)于AI的積極干預(yù)、引導(dǎo)與規(guī)范,AI有可能成為人類社會(huì)發(fā)展之不可承受之重。所以,人必須也終將成為AI的尺度,AI的發(fā)展只能以人類的福祉為唯一依據(jù)與標(biāo)準(zhǔn)。