新聞 > 科教 > 正文

Sora要把抖音們團滅了

OpenAI推出的全新生成式人工智慧模型 Sora是這幾天討論最多的話題了,一是說世界將被改變,大佬也紛紛發言表達自己的看法,但都沒人能說准 Sora將要顛覆什麼。

正月還未過完,科技界便發生3件大事。

一是英偉達推出 Chat With RTX,將每個人的電腦變成本地化系統大模型;

二是谷歌 AI推出了 Gemni1.5版本,與 GPT-4相比,可處理超過100萬個 token的輸入窗口;這兩件事似乎與普通人的日常生活還有一定距離。

但第三件事卻刷爆了每個人的朋友圈—— Sora的發布。它是 OpenAI推出的全新生成式人工智慧模型。

一、網傳世界將被改變

2月16日凌晨,OpenAI發布了重磅更新,推出了首個文生視頻模型 Sora。用戶通過文本指令,可使 Sora直接生成長達60秒的視頻,包含精細的背景、主體,靈活的多角度鏡頭,以及多個富有情感色彩的角色。

Sora發布後短短2天內,迅速成為全球網際網路熱議的焦點,關於其將徹底改變影視業和短視頻行業的預測層出不窮。

Sora還沒有對公眾開放,據《MIT Technology Review》報導,OpenAI目前沒有計劃向公眾發布 Sora,能夠使用 Sora的只有相關程序人員、安全測試人員以及經過 OpenAI挑選的少量創作者和藝術家。

除了應對監管與潛在危害的風險,OpenAI的當務之急是將 Sora交予視覺藝術家、設計師和電影製作人進行測試。可以看出,這套文生視頻模型將優先面向影視相關行業,OpenAI也希望通過專業人員的評估獲得相關反饋,以推動模型進步。

此前,生成式 AI已逐漸通過利用自動化、個性化和優化技術,重塑了媒體、廣告、金融和教育等多個行業的運作方式,提高了生產效率、優化了決策過程。而 Sora的誕生意味著 AIGC(人工智慧生產內容)的時代或許已經來臨,Sora這類工具也或許將深遠地顛覆未來的內容創作與商業格局。

我們注意到 OpenAI已經更新了48個由 Sora生成的視頻 demo,在經過我們反覆觀看與分析後得出了以下看法:

1. Sora脫穎而出是因為它克服了「物理難題」

相較於同類產品10秒的創作上限,Sora生成視頻長達60秒,其生成內容的精細畫面已經達到與現實世界難以區分的程度。此外,Sora生成內容的主體與背景環境的一致性更是令人震撼。

但最關鍵的地方還是在於 Sora對於世界模型的掌握。通過學習,Sora能了解現實世界的運行常識與物理規律。而以往的擴散模型只能實現文本與3D模型的普通轉換,無法直接嵌入在一個虛擬的物理世界中。

簡單來說,以往用文生視頻給人的感覺更像是「會動的圖片」,其中視頻背景與主體之間缺乏動態交互,無法跨越「真實」的門檻。

而以 Sora生成的視頻「海盜船在咖啡杯中纏鬥」為例,其水面流體動力學以及運動規模比例的物理難點都得到解決。

英偉達高級研究科學家 Jim Fan甚至表示:」 Sora是一個數據驅動的物理引擎「,」是一個可學習的模擬器,或「世界模型」」。

2. Sora的升級速度會快得嚇人

Sora這類 AIGC工具的能力基於大數據訓練,和此前的 Chat GPT一樣,具有網絡效應,這種效應使得其疊代進化的速度異常迅速,且這種速度無法用摩爾定律來準確衡量。

但與 Chat GPT不同的是,Sora生成的 AI內容對普通人來說更為直觀,更容易在大量用戶與從業者之中獲取反饋。由於短視頻是當前世界的主流娛樂方式和信息媒體,其廣泛的信息來源和傳播渠道為 Sora的自我學習和提升提供了有力支持。

雖然早期 Sora也出現過對物理的錯誤理解,如「果汁從杯底灑出」,但這也能表明 Sora正在不斷地自主探索物理世界,這種通過糾錯與學習的升級方式,更符合未來人們對「智能」的理解。

所以 Sora對於創作的內容理解將不斷升級,綜合水平已經大大超越了此前熱門的 Runway和 Pika,隨著大數據的不斷累積,Sora的發展前景目前看不到盡頭。

360創始人周鴻禕表示,一旦 Open AI的人工智慧把所有的電影、視頻都看一遍,這就離 AGI真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現。

3.普通人使用 Sora的創作質量並不會輸於多數專業人士

曾經,拍攝一張照片需要購入昂貴的相機,學習調整各種參數,而沖洗照片則涉及複雜的化學試劑和多個步驟。然而,隨招數碼相機和智慧型手機的出現,每個普通人都能隨時隨地拍攝和觀看照片。這使得傳統的攝影師的專業性逐漸只能通過構圖、採光、個人風格等抽象因素來展現。

如今,Sora也將帶來這樣的改變。隨著其大模型的完善和自我學習能力的增強,Sora能讓一個完全沒有影視製作和藝術設計經驗的普通人直接生成一段符合他描述的視頻,而這段視頻所帶來的效果和科幻大片高成本製作的特效不相上下。

這意味著,未來的網文作者在寫作文章的同時,也可能獨自完成一部小說改編的玄幻短片。而對於特效製作和虛擬場景搭建的專業人士來說,如果高成本製作的畫面最終與草根作者的作品相差無幾,這無疑會給他們帶來不小的壓力。

4.對於短視頻創作者而言,真實的、富有情感的內容價值將無限上升。

短視頻創作者應當深入思考的是,在 Sora等工具推動 AIGC發展的背景下,短視頻作為主流的信息獲取渠道,其中必將充斥大量由 AI生成的內容,而整活、風景、敘事等視頻分類更是生成內容的「重災區」。

並且隨著 AIGC技術的不斷進步,用戶已難以辨別內容是否由 AI創作,這使得用戶和創作者去區分內容真實性的重要性降低。

但不論 Sora有多麼「理解」世界,也無論其生成的視頻內容有多麼逼真,它們始終是數字模擬的產物,無法替代真實拍攝所展現的現實。因此,為了在未來避免被生成視頻內容的洪流所淹沒,短視頻創作者如果專注於真實拍攝,並通過深入的情感展現來觸動觀眾,將會取得更好的效果。

二、對 Sora的預測

自 Sora發布以來,影視行業首先受到了廣泛關注。尤其是 Sora生成視頻的特效最為驚艷,與好萊塢大片相比也毫不遜色。很多人認為 Sora能降低影視行業視覺特效的製作成本,從而改變影視行業的製作模式和產業鏈。

我們團隊也迅速將 Sora生成的幾段視頻分享給了影視和攝影行業的從業者。幾位視效專家表示,對於寫實類的視頻,Sora的生成效果並不真實。普通人可能只會覺得有點怪,因為大部分的失真問題都出在光影方面。

對於 Sora生成的 CG(計算機動畫)類小場景視頻,他們表示整體上很到位,甚至目前很多相關 CG製作公司的作品完全不能與 Sora相比。

儘管 Sora在生成 CG方面表現出色,同時能以極低的成本製作出震撼的60秒視頻內容,但一部電影並非由多個60秒的片段簡單拼湊而成。

影視行業往往需要製作宏大且連貫的場景,而目前的 Sora還無法滿足這種需求,此外,Sora生成的內容在細節方面也很難經得起專業的考驗。

60s短視頻對敘事的要求與長視頻電影完全不同,類似的是,AI可以寫出一個還不錯的段子笑話,但很難寫出幾十上百萬字的優秀小說。

我們認為,儘管 Sora有強大的生成與學習能力,但在要求表達大量內容和細節的場景時仍顯得力不從心。目前,Sora還無法完全替代人工來接替影視創作的工作。然而,不可否認的是,Sora是一個出色的概念創意工具。尤其是其在小場景視頻中的優勢,預示著它將對廣告行業、創意行業產生深遠的影響。

另一個備受關注的領域是視頻平台。數據顯示,目前國內短視頻用戶的規模在10億以上,其中抖音2022年的年收入達到了700億美金以上,快手也實現了900億人民幣的年收入。

然而,面對這樣一個龐大的市場,在 Sora發布之前,所有的視頻生成工具都未能達到商業化或工業化生產的標準。

與 Pika和 Runway相比,Sora不僅提供了精美的畫質,其視頻內容也更為豐富多樣,同時視頻時長也增加了十多倍。如果用於短視頻創作,這將極大提升用戶的新鮮感。然而,當眾多創作者都選擇利用 Sora輸出內容從而被動「同質化」時,如何確保自己的作品質量出眾,這才是使用 Sora真正的問題。

AIGC的興起降低了整活、追熱點和段子視頻化的門檻,導致單純依賴生成視頻不足以維持創作者的競爭力。目前看來,小說、敘事類自媒體可能更能充分發揮 Sora的優勢,因為 Sora尚無法生成具有獨特調性和核心創意的視頻。

因此,對於視頻平台的內容創作者來說,Sora並不能替代他們自身的創意和靈感,而只能作為輔助工具來提升創作效率和質量。

就 Sora目前所生成的視頻而言,優秀作品主要集中在動物、遠景建築和幻想場景等領域。這些視頻在過去往往需要創作者支付高昂的版權費用以使用。因此,Sora的出現很可能首先顛覆素材版權行業。

Sora的強大生成能力同時伴隨著對社會秩序的潛在巨大破壞力,因此,不可避免地會吸引一些居心叵測的人利用其進行詐騙、勒索、誹謗等不法行為。

可以預見的是 Sora的正式推出不但要面臨自身的疊代優化,還要面臨世界多個國家和地區的嚴格監管,我們認為短期內 OpenAI並不會向公眾發布 Sora。但無論 Sora何時向用戶發布,它都將進一步證明 AI已經成為人類社會不可或缺的一部分。

Sora的出現無疑是 AI發展的一個巨大成功。它在人類現有知識基礎和世界模型的基礎之上,疊加了相關的自我學習技術,這無疑是 AI發展的正確道路之一。AI企業將很容易利用這種模式打造各行業的超級工具。

前些年,元宇宙、VR、人工智慧等概念風起雲湧,但始終沒有具象化的產物出現。如今,Meta頭顯已經擁有千萬銷量;英偉達通過 AI概念市值達到了1.7萬億美元;蘋果公司也發售了自己的頭顯設備 Apple Vision Pro;OpenAI旗下的人工智慧產品也在不斷更新換代。可見,一個圍繞虛擬與人工智慧的時代正以不可逆的架勢向我們襲來。

責任編輯: 李華  來源:ZAKER科技 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2024/0222/2021083.html