新聞 > 科教 > 正文

ChatGPT 一天「吃」50萬度電,AI的盡頭是能源?

人們通常認為我們吃下去的糧食是用來幹活的,但其實思考的能耗才是最高的,比如僅占體重2%的大腦消耗了人體20%的能量。同理,人工智慧也是很耗能的,雖然今天的人工智慧仍處於初級階段,但其能耗已經不容忽視了。如果未來科學家們真的開發出類似人腦的超級通用人工智慧,我們有能力為其供電嗎?地球的環境承受得了嗎?

——作者:袁越 

因為ChatGPT的橫空出世,2023年被稱為人工智慧(AI)元年。這款由美國人工智慧公司OpenAI開發的通用聊天機器人於2022年11月30日正式上線,僅用兩個月的時間就吸引了超過一億的活躍用戶,創下消費級網絡應用程式擴張速度的世界紀錄。

ChatGPT的成功迅速引來了一批跟風者,比如微軟(Microsoft)很快將GPT-4引入新版必應(Bing)搜索,還推出了基於GPT-4的辦公軟體人工智慧助手Microsoft 365 Copilot。

谷歌(Google)則推出了基於自己開發的大語言模型(LLM)的搜尋引擎Bard,並很快升級為一款全新的生成式人工智慧聊天機器人Gemini。

百度不甘示弱,於2023年3月16日發布了自己的大語言模型文心一言,揭開了人工智慧國產化的序幕。阿里和科大訊飛等國內公司也立刻跟進,紛紛推出了自己的人工智慧應用。用戶們不但可以和人工智慧對話,還能讓人工智慧幫助自己查詢各類信息、翻譯外文資料、設計旅遊行程,甚至幫自己寫論文或者寫代碼。

很快地,基於大語言模型的人工智慧便擴展到文本應用之外的其他領域。2023年3月25日,一家總部設在舊金山的人工智慧公司Midjourney推出了V5版本,用戶可以通過提示詞來創作一幅畫。這個軟體連同OpenAI推出的DALL·E 3,在網際網路上掀起了一波人工智慧繪畫熱,至今方興未艾。

3月18日,英偉達執行長黃仁勛在聖何塞舉行的英偉達GTC開發者大會上發表主題演講。此次開發者大會重點介紹新的晶片、軟體和人工智慧處理器技術。

進入2024年之後,這股人工智慧熱潮不但火勢未減,反而越燒越旺。先是基於DALL·E 3技術的視頻生成應用Sora於2月15日上線,其令人驚嘆的視覺效果迅速火遍全球,讓很多視頻工作者哀嘆自己即將失業。兩個星期之後,Suno AI的V3版本上線,用戶可以通過提示詞免費創作兩分鐘的歌曲或者音樂,其質量同樣讓人驚嘆,這回輪到音樂工作者擔心自己的職業前途了。

事實上,人工智慧超強的領域擴展能力和水平提升速度讓幾乎所有行業的人都產生了不同程度的緊迫感,仿佛這是一頭隨時可以變身或者膨脹的怪獸。但是,也有一些人相信人工智慧對於電力的需求將會限制它的發展速度,其中就包括阿姆斯特丹自由大學(Vrije University Amsterdam)的網際網路能源與經濟研究者阿萊克斯·德弗里斯(Alex de Vries)。他在2023年10月18日出版的《焦耳》(Joule)雜誌上撰寫了一篇文章,討論了人工智慧潛在的能源緊缺問題。

這裡所說的能源不是使用端個人設備的耗電,而是人工智慧模型的訓練和使用耗能。其中訓練大模型是一項相當複雜的任務,輸入的數據量和分析這些數據所需的算力都是天文數字。公開數據顯示,光是GPT-3的訓練過程就消耗了1287MWh(兆瓦時,1兆瓦時相當於1000度電)的電能,大約相當於1000戶普通中國家庭一年的耗電量。

這個耗電量不算少,尤其要考慮到這只是一款軟體在準備過程中的能耗,真可謂是前無古人了。但人工智慧的高能耗絕不僅僅體現在前期訓練上,其後續的使用過程才是最耗電的。

眾所周知,每當我們在電腦上輸入一個新網址,或者在手機上點開一個新視頻時,我們手裡的終端設備都要和某個數據中心(data center)的伺服器發生信息交換。數據中心還會根據任務的不同對輸入數據進行或繁或簡的計算,這些過程都是需要消耗能量的。根據德弗里斯那篇文章所提供的數據,全球搜尋引擎排名第一的谷歌每搜索一次的平均能耗約為0.3Wh(瓦時),看似很低,但考慮到谷歌每天平均需要處理90億次搜索請求,累積起來就是個很大的數字了。

如果未來谷歌用Gemini代替谷歌搜索,即把所有的搜索請求全都用大語言模型來處理一遍的話,其能耗將會成倍增長。谷歌母公司「字母表」(Alphabet)的董事長約翰·亨尼斯(John Hennessy)在2023年初接受媒體採訪時承認,如果未來谷歌搜索全盤人工智慧化的話,平均每次搜索的能耗將至少提高到原來的10倍,即每次搜索耗電3Wh。這樣算下來,未來谷歌的人工智慧搜尋引擎每天的能耗將達到27GWh(吉瓦時,1吉瓦時相當於100萬度電),即2700萬度電;每年的總能耗將達到9.855TWh(太瓦時,1太瓦時相當於10億度電),即98.55億度電。

數據中心能源消耗巨大

在這篇文章中,德弗里斯還從供給側對人工智慧的耗電情況進行了估算。目前全球人工智慧公司的伺服器市場幾乎被英偉達壟斷了,其全球市場份額高達95%以上,所以僅從英偉達這家公司的出貨情況就能計算出一家人工智慧公司的能耗數據。舉例來說,按照一家獨立研究機構SemiAnalysis的計算,OpenAI大約需要3617個英偉達HGX A-100伺服器來支持其ChatGPT的使用,這些伺服器一共包含28936個圖形處理器(GPU),每天的總能耗高達564MWh,即56.4萬度電。

同理,這家機構估計如果谷歌搜索全盤人工智慧化的話,將需要512821個英偉達HGX A-100伺服器。如果按照每個伺服器的額定功率為6.5kW來計算的話,光是這些伺服器每天就將消耗80GWh的電力,相當於每年耗電29.2TWh。另一家獨立研究機構New Street Research的估算結果稍低,認為谷歌的人工智慧改造將需要40萬個英偉達伺服器,每天耗能62.4GWh,每年耗電22.8TWh。這兩個估算結果要比前文從需求側給出的計算結果高一些,但屬於同一個數量級。

考慮到谷歌公司2021年全年的能耗僅為18.3TWh,當年人工智慧部門的能耗僅為10%~15%這一事實,未來谷歌如果全盤人工智慧化的話,其總體能耗將會是一個令人震驚的數字。根據德弗里斯文章中的估算,僅僅谷歌的人工智慧部門幾年後的年耗電量就有可能和愛爾蘭全國的電力消耗量(29.3TWh)相當。要知道,三峽水電站全年的發電量大約為100TWh。換句話說,僅僅谷歌一家公司的人工智慧部門就有可能在不遠的將來消耗掉三峽水電站三分之一的電力。

那麼,全球的情況是怎樣的呢?國際能源署(IEA)不久前剛剛發布了2024版的全球電力報告,發現2022年的全球數據中心、人工智慧和加密貨幣這三大板塊的總耗電量達到了460TWh,幾乎占到全世界總用電量的2%。其中加密貨幣貢獻了大約0.4%,也就是說數據中心和人工智慧大約消耗了全球總用電量的1.6%。其中40%的能耗來自計算,40%來自冷卻,20%來自其他設備。隨著ChatGPT的異軍突起,國際能源署預計到2026年時這三大板塊的總用電量將翻番,達到1000TWh左右的水平,相當於增加了一個瑞典或者德國的總用電量。

國際能源署的估算之所以沒有像前文所說的那樣增加10倍,除了未來電腦晶片的計算效率不可避免地增加,以及人工智慧大模型算法的改進之外,最大的原因就是晶片供應不足。德弗里斯的那篇文章也認為,以英偉達現在的晶片製造能力是不可能立刻為谷歌提供512821個HGX A-100伺服器的。再加上如今GPU價格居高不下,谷歌為了購買這些伺服器需要投資至少1000億美元,這將導致谷歌的盈利模式崩潰,所以谷歌也不大可能願意出這筆錢。

但是,這些專家學者全都低估了科技公司進軍人工智慧市場的雄心壯志。今年2月,OpenAI 執行長山姆·奧特曼(Sam Altman)在接受媒體採訪時表示,他正在試圖說服阿聯政府投資7萬億美元在中東建立一個晶片製造廠,打破英偉達在這個行業的壟斷地位。一個月之後,一家名為The Information的科技媒體爆料說微軟將和OpenAI 一起合作建設一個名為「星際之門」(Stargate)的超級數據中心,為規劃中的人工智慧部門提供算力。據說這個數據中心將會配備數百萬個定製GPU,總投資額高達1150億美元。

這些新進展清楚地表明,人工智慧的發展速度遠遠超出了所有人的預期,其結果要麼是這一領域未來的能源消耗將會拖累人類的減排努力,要麼是氣候變化的緊迫性將會嚴重阻礙人工智慧的發展速度。到底哪一種結局最有可能呢?為了尋找答案,本刊記者對這一領域的權威研究者阿萊克斯·德弗里斯進行了專訪。

阿姆斯特丹自由大學的網際網路能源與經濟研究者阿萊克斯·德弗里斯

三聯生活周刊:請問你當初是如何進入這一研究領域的?

德弗里斯:我是荷蘭中央銀行的數據分析師,2014年我創辦了一家名為Digiconomist的研究與諮詢公司,專門研究數字加密貨幣的網絡欺詐問題。2016年我讀到一篇文章,說比特幣每一次交易所消耗的電能相當於一個普通美國家庭一天半的耗電量。我對這一事實感到非常不解,想不通為什麼一次看似很普通的網上交易需要消耗這麼多能量。於是我開始調查這件事,並在公司網站上公布了調查結果。之後我創建了比特幣能量消耗指數(Bitcoin Energy Consumption Index),並定期更新。很多機構找到我,希望能獲得更詳細的信息,於是我開始研究數字加密貨幣的環境足跡,並為各種學術期刊撰寫了多篇論文,討論了數字貨幣的能量消耗、水資源消耗和原材料消耗等被大眾忽視的環境問題。

三聯生活周刊:我們雜誌曾經在2022年報導過比特幣的能耗問題,當時尚有大約250萬枚比特幣未被開採出來。兩年後的今天,這一數字已經降到了大約200萬枚,這是不是意味著挖礦的成本又增加了?

德弗里斯:據我所知,今年比特幣的挖礦成本上升了50%,達到了每枚比特幣至少3萬美元的高位(取決於礦場電費),但現在比特幣的市值也到達了6萬美元左右,所以挖礦仍然是可以賺錢的。比特幣這個行業的能耗其實完全取決於比特幣的價值,如果高於挖礦成本的話,這個行業就會繼續存在下去。所以說,如果未來比特幣的價格越來越高的話,這個行業的耗電量一定會越來越高。

三聯生活周刊:你為什麼把注意力從比特幣轉移到人工智慧上來了呢?

德弗里斯:這是很自然的事情,因為人工智慧和數字加密貨幣一樣,都是很熱門的領域,但其環境足跡卻都不被大家重視,普通民眾對兩者巨大的能量消耗沒有概念,需要有人來為大家科普這方面的知識。

三聯生活周刊:國際能源署最近剛剛發表了一份報告,預測全球數據中心和加密貨幣的能量消耗有可能在未來的3年裡加倍。你怎麼看?

德弗里斯:我當然同意,因為國際能源署的預測是基於我去年在《焦耳》上發表的那篇文章做出的。我當時是根據供給側(也就是伺服器)的能耗情況做出的預測,2023年英偉達一共交付了大約10萬個人工智慧伺服器,年耗電量為5.7~8.9TWh,這個數字已經相當可觀了。我預計2027年英偉達將會交付150萬個伺服器,年耗電量將會達到85.4~134TWh,比很多中等國家的耗電量都大,而這就是國際能源署報告中那些預測的來源。但我沒想到的是,今年的全球晶片銷售情況比我當初預測的最高值還要高,所以我認為我在那篇文章中所做的推斷還是偏保守了。

另外,我那篇文章只計算了晶片本身的能耗,沒有把數據中心的冷卻耗能考慮在內,一般數據中心的冷卻能耗會占到總能耗的50%以上。

上述這兩個因素疊加在一起,會讓未來人工智慧的能源危機比我當初預測的更加嚴重。

三聯生活周刊:從供給側來計算能耗和從需求側來計算能耗會有什麼差別?

德弗里斯:目前看差別不大,因為現在是人工智慧的高速發展時期,對算力的需求非常高,晶片生產多少就能賣出多少,而且一定會處於滿負荷工作狀態,所以對於能耗來說,唯一的限制因素就是供給側,也就是晶片的供應量。而人工智慧領域的晶片市場又是被一家公司(英偉達)壟斷的,所以從供給側來計算能耗既簡單又準確。不過,如果將來供給側出現變化,導致供貨充足的話,僅從供給側計算能耗就不一定準確了。

三聯生活周刊:英偉達剛剛推出了一款全新的人工智慧伺服器Blackwell B200,內部封裝了2080億個電晶體,比上一代H-100伺服器多了兩倍多,運行速度提升了30倍。因此,雖然其額定功率比上一代伺服器增加了近一倍,但單位算力的能耗卻下降了。如果這個趨勢繼續下去的話,未來人工智慧行業的能耗會不會不升反降呢?

德弗里斯:我認為不會,因為人工智慧的核心原則就是以大為美,這一點和環境保護是正相反的。眾所周知,人工智慧大模型做得越大,其表現就越穩定,輸出信息的質量就越高,比起競爭對手也就越有優勢,所以晶片能效的提升一定會促使人工智慧公司進一步增加算力,以期打敗競爭對手。類似的情況在加密貨幣領域也發生過,隨著挖礦效率的提升,挖礦者反而加大了對設備的投入。相比之下,環保運動追求小而美,兩者在原則上是衝突的,所以設備效率提升所帶來的環保效應一定會被增加的設備投入抵消掉,最終反而增加了能耗,著名的傑文斯悖論(Jevons Paradox)很早就預言了這一現象的存在。〔註:傑文斯悖論是19世紀英國經濟學家威廉·斯坦利·傑文斯(William Stanley Jevons)首先提出來的,他發現煤炭的使用效率越高,對煤炭的需求量就會越大,而不是正相反。〕

晶片效率飛速提升的另一個後果就是增加了電子垃圾。以前數據中心設備的平均壽命大約是6年,現在則縮短了一半,用3年就不得不報廢了。

三聯生活周刊:一些學者認為,人工智慧雖然耗電量很高,但這項技術提高了很多其他行業的生產效率,所以總的來說是對環境有利的,你怎麼看?

德弗里斯:這個說法當然是有一定道理的,這就是為什麼我認為人工智慧要比加密貨幣好得多的原因。但人工智慧的發展雖然從經濟角度來看很可能是好的,但從環境角度來看卻不一定,因為效率的提高往往意味著需求的提高,後者經常會遠大於前者,原因同樣是我前面提到過的傑文斯悖論,這方面已經有太多先例了。

三聯生活周刊:根據國際能源署的統計,目前全球一共有大約8000個數據中心,其中33%在美國,16%在歐洲,10%在中國。2022年美國數據中心一共消耗了200TWh的電力,占美國總電力消耗的4%,這是一個很高的比例,以至於很多人開始懷疑美國到底能不能完成減排指標。但起碼在理論上,數據中心可以建在任何地方,比如那些擁有充足可再生能源潛力的開發中國家。中國西部有著充足的風光資源,而且當地人煙稀少,完全可以通過建造更多的數據中心來消化多餘的可再生能源電力。如果全世界都這麼做的話,人工智慧的能源危機就沒那麼大了吧?

德弗里斯:我不認為這會從根本上解決這個問題,因為今天的可再生能源並沒有多到可以揮霍的程度。絕大多數國家的可再生能源依然緊缺,化石能源的占比依然很高,通過可再生能源發出來的電應該被用於替換火電,這才是最緊迫的事情。

事實上,即使是在已開發國家,數據中心的尋址建設也變得越來越困難了。比如Meta公司(前Facebook,即臉書)最近想利用荷蘭豐富的風力發電資源在我的家鄉建設一個數據中心,但被當地政府拒絕了,因為我們想把風電用在其他更有價值的地方。

這樣的案例還有很多,說明數據中心的吸引力正在下降。比如瑞典曾經在2017年制定了一項針對數據中心的稅收優惠政策,試圖利用本國豐富的水電資源把數據中心吸引過去。但去年他們取消了這項政策,因為他們發現比起巨大的能源消耗,數據中心所能提供的就業機會非常少,遠不如把這些電力用在其他領域來得更加划算。再比如,冰島也不再發展比特幣和數據中心產業了,而是決定把多餘的廉價電力用來種蔬菜,因為他們意識到比起虛無縹緲的比特幣,還是蔬菜產業對保障本國的糧食安全更有價值。

三聯生活周刊:如果我們相信世界能源署的數據是準確的,那麼無論是2022年的460TWh還是2026年的1000TWh,都算不上是多麼可怕的數字。人們真正擔心的是人工智慧產業潛在的指數級增長潛力。如果這個行業真的像某些行業大佬所說的那樣出現指數級增長,那才是真正的危機時刻。你覺得這樣的可能性有多大?

德弗里斯:預測未來是天底下最難的事情,所以我也說不好。但我認為現在的高科技公司大都非常擅長造勢,大佬們也特別喜歡說大話,比如山姆·奧特曼就說人類未來需要開發出可控核聚變發電的能力才能應對人工智慧巨大的能源需求。我個人相信人工智慧產業在短期內的高速增長應該是大概率會發生的事情,但從中長期來看,答案並不是那麼地顯而易見,因為我認為人類並不需要那麼強的人工智慧,也不是所有人都想使用ChatGPT。比如現在的ChatGPT經常會犯錯,所以很多人發現自己還得對ChatGPT給出的答案再核實一遍,於是使用它的熱情便降低了。

總之,我認為人工智慧產業真不一定會向著科技公司大佬們預測的那個方向發展,未來並不確定。

阿波羅網責任編輯:李華

來源:三聯生活周刊

轉載請註明作者、出處並保持完整。

家在美國 放眼世界 魂系中華
Copyright © 2006 - 2024 by Aboluowang

投稿 投稿