《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > Sora一旦推出,峰值算力需要75萬張H100GPU

Sora一旦推出,峰值算力需要75萬張H100GPU

2024-03-28
來源:鳳凰網科技
關鍵詞: Sora H100 GPU 人工智能

Sora何時推出?大約在年底。它非常受歡迎,一旦投入使用,不僅會對影視行業造成沖擊,而且會在視頻網站、社交媒體、電商平臺,以及教育等領域得到廣泛應用。它的物理世界模擬器的作用,以及“世界模型”的潛力也非常巨大。

問題來了,它需要多大算力?

風險投資機構Factorial Funds的Matthias Plappert,最近對Sora模型進行了剖析。他們推算的主要依據,是論文Scalable Diffusion Models with Transformers 中的數據。Sora模型在一定程度上是基于論文中所提出的、基于Transformer的架構的DiT (Diffusion Transformers)。論文的第一作者William Peebles目前在OpenAI負責Sora研究團隊。

作者假設Sora推出后,將在Tiktok和Youtube上得到廣泛的應用,推算出需要的算力相當于72萬張英偉達H100 GPU。對比一下,目前Meta擁有的總算力,相當于65萬張H100。

下面我們介紹下其中關于訓練與推理的部分:

從DiT到Sora訓練計算量的外推

關于Sora的細節信息非常少,但我們可以再次查看顯然是Sora基礎的DiT論文,并從中推斷出相關的計算數字。最大的DiT模型DiT-XL有6.75億個參數,總計算預算約為10^21次浮點運算。為了更容易理解這個數字,這相當于大約0.4個Nvidia H100 GPU運行一個月(或一個H100運行12天)。

但是目前DiT僅對圖像建模,而Sora是一個視頻模型。Sora可以生成長達1分鐘的視頻。如果我們假設視頻以24幀/秒編碼,一個視頻最多包含1440幀。Sora的像素到潛在映射似乎在空間和時間上都有壓縮。如果我們假設與DiT論文中相同的壓縮率(8倍),我們最終在潛在空間中得到180幀。因此,在直觀地將DiT外推到視頻時,我們得到了180倍的計算量倍增因子。

我們進一步認為,Sora的參數量明顯大于6.75億個。我們估計200億參數的模型是可行的,這使我們在計算量上比DiT再多出30倍。

最后,我們認為Sora使用的訓練數據集比DiT大得多。DiT在批量大小為256時經過300萬步訓練,即總計使用了7.68億張圖像(但要注意同一數據被重復使用了多次,因為ImageNet僅包含1400萬張圖像)。Sora似乎是在圖像和視頻的混合數據集上進行訓練的,但除此之外我們幾乎一無所知。因此,我們簡單假設Sora的數據集中有50%是靜止圖像,50%是視頻,并且數據集比DiT使用的大10到100倍。然而,DiT在相同的數據點上反復訓練,如果有更大的數據集可用,這種做法可能是次優的。因此,我們認為4到10倍的計算量倍增因子是一個更合理的假設。

將上述因素綜合考慮,并分別計算額外數據集的低估計和高估計,我們得到以下計算結果:

* 數據集低估計: 10^21次浮點運算 x 30 x 4 x (180/2) ≈ 1.1x10^25次浮點運算

* 數據集高估計: 10^21次浮點運算 x 30 x 10 x (180/2) ≈ 2.7x10^25次浮點運算

這相當于4,211至10,528個Nvidia H100 GPU運行1個月的計算量。

推理計算與訓練計算的比較

另一個值得考慮的重要因素,是訓練計算與推理計算之間的對比。訓練計算量非常大,但這是一次性的成本。相比之下,推理計算量雖然小得多,但每一次生成都意味著一次推理計算。因此,推理計算量會隨著用戶數量的增加而擴大,并變得越來越重要,特別是當一個模型被廣泛使用時。

因此,觀察“收支平衡點”是很有用的,即消耗在推理計算上的計算量,超過了訓練期間消耗的計算量的時間點。

1.png

(左圖對比DiT的訓練與推理計算,右圖對比Sora的訓練與推理計算。對于Sora部分,我們的數據基于上文估計,因此不是完全可靠。我們還展示了兩種訓練計算的估計:一種低估計(假設數據集大小的倍增因子為4倍)和一種高估計(假設為10倍)。)

在上述數字中,我們再次利用DiT來推算Sora。對于DiT,最大的模型(DiT-XL)每步使用524×10^9次浮點運算,DiT使用250步擴散生成單張圖像,因此總計為131×10^12次浮點運算。我們可以看到,收支平衡點在生成760萬張圖像后達到,此后推理計算將占主導。作為參考,用戶每天大約上傳9500萬張圖像到Instagram。

對于Sora,我們將浮點運算次數外推為524×10^9次 × 30 × 180 ≈ 2.8×10^15次。如果我們仍然假設每段視頻需250步擴散,那就是每段視頻總計708×10^15次浮點運算。作為參考,這大約相當于每小時每個Nvidia H100生成5分鐘視頻。

收支平衡點在生成1530萬(低估計)到3810萬(高估計)分鐘視頻后達到,之后推理計算將超過訓練計算。作為參考,每天約有4300萬分鐘視頻上傳到YouTube。

需要注意的是:對于推理來說,浮點運算次數并不是唯一重要的因素。內存帶寬也是另一個重要因素。此外,現有研究正致力于減少所需的擴散步數,這可能導致推理計算量大幅降低,因此推理速度會更快。訓練和推理階段的浮點運算利用率也可能有所不同,在這種情況下,它們就變得很重要了。

不同模型之間的推理計算量比較

我們還觀察了不同模態下不同模型的每單位輸出推理計算量。這里的想法是,看看不同類型模型的推理計算量級別有多大差異,這對于規劃和預測計算需求有直接影響。重要的是,我們要理解,由于不同模型工作于不同的模態,每個模型的輸出單位也不盡相同:對于Sora,單個輸出是一段1分鐘長的視頻;對于DiT,是一張512x512像素的圖像;而對于Llama 2和GPT-4,我們將單個輸出定義為一份長度為1000個token的文本文檔。

2.png

(比較不同模型每單位輸出的推理計算量,對于Sora是1分鐘視頻,對于GPT-4和LLama 2是1000個token的文本,對于DiT是單張512x512像素的圖像。我們可以看到,我們對Sora推理的估計比其他模型昂貴,要高出數個數量級。)

我們比較了Sora、DiT-XL、LLama 2 70B和GPT-4,并以對數刻度繪制了它們的浮點運算次數。對于Sora和DiT,我們使用上文的推理估計值。對于Llama 2和GPT-4,我們使用經驗公式浮點運算次數=2×參數數量×生成的token數來估計。對于GPT-4,我們假設它是一個混合專家 (MoE)模型,每個專家有220B參數,每次前向傳遞激活2個專家。需要注意的是,GPT-4的這些數字未得到OpenAI的確認,因此也需要謹慎對待。

我們可以看到,基于擴散模型如DiT和Sora的推理算力需求要大得多:DiT-XL(6.75億參數)的推理計算量,大約與LLama 2(700億參數)相當。我們還可以看到,Sora的推理算力需求比GPT-4高出數個數量級。

需要注意的是,上述許多數字都是估計值,并且依賴于簡化的假設。例如,它們并未考慮GPU的實際浮點運算利用率、內存容量和帶寬限制以及諸如推測解碼等高級技術。

如果類似Sora的模型占有重要市場份額時的推理計算量

在這一部分,我們根據Sora的計算需求,推測如果AI生成視頻在流行視頻平臺如TikTok和YouTube上占有重要市場份額,將需要多少英偉達H100 GPU來運行類似Sora的模型。

我們假設每小時每個H100生成5分鐘視頻(詳見上文),相當于每天每個H100生成120分鐘視頻。

TikTok:每天1700萬分鐘視頻(3400萬個視頻x平均30秒長度),假設AI滲透率50%。

YouTube:每天4300萬分鐘視頻,假設AI滲透率15%(主要是2分鐘以下的短視頻)。

AI每天總計生成視頻:850萬+650萬=1070萬分鐘。

為支持TikTok和YouTube的創作者社區,需要89000張英偉達H100 GPU。

由于以下因素,這一數字可能偏低:

我們假設100%的浮點運算利用率,并未考慮內存和通信瓶頸。實際上50%的利用率更為現實,需要乘以2倍。

需求不會均勻分布在時間上,而是具有突發性。峰值需求尤其成問題,因為需要相應更多GPU來滿足所有流量。我們認為,應考慮峰值需求再增加2倍,作為所需最大GPU數量。

創作者可能會生成多個候選視頻,從中挑選最佳。我們保守地假設,平均每個上傳視頻要生成2個候選視頻,再增加2倍。

總計在峰值時需要大約72萬臺英偉達H100 GPU。

這說明了我們的觀點:隨著生成式AI模型變得越來越受歡迎和受到依賴,推理計算將占主導地位。對于基于擴散的模型如Sora,這種趨勢會更加明顯。

另外需要注意,如果擴大模型規模,推理計算需求也會大幅增加。另一方面,更優化的推理技術和整個技術棧上的其他優化措施,可能會在一定程度上抵消這種影響。


雜志訂閱.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美在线欧美在线| 欧美午夜精品伦理| 亚洲午夜精品久久久久久app| 久久精品二区| 久久成人免费日本黄色| 午夜日韩激情| 欧美一级夜夜爽| 性做久久久久久免费观看欧美| 亚洲一区国产精品| 亚洲四色影视在线观看| 一区二区三区视频在线观看| 日韩亚洲欧美成人一区| 亚洲免费观看| 99re66热这里只有精品3直播 | 欧美一区三区三区高中清蜜桃| 亚洲免费网站| 欧美永久精品| 亚洲第一网站| 亚洲人妖在线| 一区二区三区免费网站| 在线视频精品一| 亚洲视频一区二区| 亚洲男女自偷自拍图片另类| 亚洲免费在线观看视频| 欧美一区二区视频在线| 久久精品成人| 美日韩精品免费| 欧美成人免费观看| 欧美日韩国产一区| 国产精品乱人伦一区二区| 国产欧美二区| 伊人婷婷欧美激情| 最新中文字幕一区二区三区| 亚洲美女视频网| 亚洲一区二区在线免费观看视频| 欧美亚洲在线观看| 亚洲国产精品久久久久秋霞影院| 亚洲精品老司机| 亚洲在线黄色| 久久精品视频在线| 好看的日韩av电影| 曰本成人黄色| 亚洲韩国日本中文字幕| 日韩午夜三级在线| 亚洲免费影视第一页| 久久精品一二三区| 日韩亚洲欧美精品| 亚洲男人第一av网站| 久久久久久电影| 欧美劲爆第一页| 国产精品久久久久久久7电影| 国产欧美一区二区精品性色| 一区二区三区在线免费播放| 91久久综合| 亚洲伊人一本大道中文字幕| 亚洲动漫精品| 在线综合视频| 久久久久久久一区二区| 欧美日本亚洲视频| 国产日本欧美一区二区三区在线| 在线观看亚洲a| 中文国产成人精品| 亚洲国产高清一区| 亚洲永久在线观看| 免费在线观看一区二区| 国产精品区一区二区三区| 亚洲国产91精品在线观看| 亚洲午夜精品一区二区三区他趣 | 一区二区不卡在线视频 午夜欧美不卡' | 欧美性猛交xxxx乱大交退制版 | 亚洲人精品午夜| 亚洲欧美激情四射在线日| 亚洲国产婷婷香蕉久久久久久99| 中日韩美女免费视频网站在线观看| 欧美一区二区三区四区视频| 欧美激情视频免费观看| 国产婷婷精品| 洋洋av久久久久久久一区| 亚洲成在线观看| 亚洲欧美日韩综合| 欧美精品aa| 国模私拍视频一区| 亚洲一二三区视频在线观看| 亚洲精品视频中文字幕| 欧美专区在线播放| 欧美视频在线一区二区三区| 亚洲福利在线观看| 香蕉久久久久久久av网站| 一本到12不卡视频在线dvd| 美女国产精品| 国产日韩1区| 亚洲天堂网在线观看| 99国产精品久久久| 亚洲精品视频免费| 伊人久久男人天堂| 午夜精品成人在线| 亚洲欧美卡通另类91av| 欧美精品www在线观看| 国内一区二区三区在线视频| 亚洲一区二区三区影院| 99精品99| 欧美国产高清| …久久精品99久久香蕉国产| 性色av一区二区怡红| 香蕉乱码成人久久天堂爱免费| 欧美日韩国产不卡在线看| 亚洲成人在线观看视频| 久久精品官网| 久久精品国产视频| 国产视频不卡| 亚洲欧美另类中文字幕| 亚洲免费影视第一页| 国产精品sm| av成人激情| 亚洲无亚洲人成网站77777 | 亚洲视频在线观看| 亚洲午夜激情网页| 欧美性天天影院| 中文国产成人精品久久一| 亚洲伊人一本大道中文字幕| 欧美日韩一区二区三区| 日韩一级免费| 亚洲一区二区免费看| 欧美视频一区二| 一区二区三区日韩在线观看| 亚洲一区www| 国产精品高清在线观看| 亚洲一区免费看| 欧美一区二区三区视频在线观看 | 国产美女精品| 性欧美暴力猛交69hd| 欧美在线视频免费播放| 国产午夜精品久久久| 欧美一级午夜免费电影| 噜噜噜噜噜久久久久久91| 在线观看视频一区二区欧美日韩| 宅男精品视频| 亚洲国产婷婷香蕉久久久久久| 久久精品一区二区三区中文字幕| 久久综合色88| 亚洲黄色免费网站| 一区二区三区视频观看| 欧美丝袜一区二区| 亚洲在线观看免费视频| 欧美一区二区三区日韩视频| 国内精品久久久久久| 亚洲欧洲日本一区二区三区| 欧美极品一区二区三区| 中文国产成人精品久久一| 亚洲欧美国产va在线影院| 国产精品日本精品| 欧美在线在线| 欧美高清在线一区二区| 一本大道久久a久久精品综合| 午夜精品一区二区三区四区| 国产性色一区二区| 最新日韩在线视频| 欧美日韩综合在线| 亚洲欧美日韩国产精品| 久热精品在线| 一本到高清视频免费精品| 欧美一区二区日韩| 永久免费视频成人| 一区二区三区鲁丝不卡| 国产欧美一区二区精品性| 亚洲级视频在线观看免费1级| 欧美精品videossex性护士| 亚洲先锋成人| 老司机67194精品线观看| 亚洲久色影视| 久久国产天堂福利天堂| 亚洲国产一区二区视频| 亚洲女同精品视频| 精品999在线观看| 亚洲自拍偷拍一区| 一区二区在线观看视频| 国产精品99久久久久久久vr | 久久精品成人| 亚洲精品免费网站| 久久精品国产亚洲精品| 最新国产拍偷乱拍精品| 欧美一区二区三区在线播放| 亚洲国产成人av在线| 欧美专区18| 亚洲最新视频在线| 蜜乳av另类精品一区二区| 一区二区日韩免费看| 久久夜色精品国产噜噜av| 一本大道久久a久久综合婷婷| 久久人人爽爽爽人久久久| 一本色道婷婷久久欧美| 久久亚洲欧美国产精品乐播| 一本色道久久88精品综合| 久久香蕉精品| 亚洲一区在线观看免费观看电影高清| 久久久五月婷婷| 亚洲伊人观看| 欧美特黄一级| 亚洲美女诱惑| 黄色另类av|