本文來源:品玩
在所有嫉妒$英偉達(NVDA.US)$大賺特賺的科技大廠里,$美國超微公司(AMD.US)$肯定是最憋屈的一個。
(相關資料圖)
他們是常年相愛相殺的老對手。熟悉PC電腦市場的人都知道,一直以來英偉達RTX系列顯卡的主要對手就是AMD Radeon系列顯卡。
在最新的幾次顯卡迭代中,英偉達憑借光線追蹤和DLSS(深度學習超級采樣)等獨家技術拉開了和AMD的差距,在消費級市場占據優勢。
這種情況在數據中心領域被復制。本來,AMD的數據中心業務稱得上可圈可點,歐洲速度最快的超級計算機LUMI和美國橡樹嶺國家實驗室的Frontier超級計算機使用的都是AMD的處理器與加速器。
但由于半導體周期和全球經濟疲軟等各種因素影響,2023財年第一季度,AMD數據中心的營收是13億美元,按年同比沒有增長,與之形成鮮明對比的是英偉達數據中心業務營收達42億,更恐怖的是其預計的第二季度的營收將達到100億。
當然你也不能全怪AMD,實際上英偉達一騎絕塵于所有芯片廠商,目前它的市值是AMD的五倍還多(一個有趣或諷刺的事實是,AMD的市值高于英特爾)。
因為英偉的GPU被普遍認為是大模型LLM訓練與推理所必不可少的“關鍵基礎設施”,在生成式AI爆發的大背景下,算力成為了新的石油,每個人都在竭盡全力地爭奪。
AMD現在想要改變人們這一固有看法。
6月13日,AMD在一場名為AMD數據中心和技術首映的發布會上公布了一系列新技術和產品。從這個名字我們就能看出來,AMD聚焦的非常精準,就是數據中心產品。
最吸引人的是名為MI300X的GPU,它直接對標了英偉達的H100——目前最先進的GPU,訓練大模型必不可少的基礎設施。
MI300X有高達192GB內存,提供5.2TB的帶寬,AMD宣稱相比上一代使用CDNA 2 架構的 MI250 提高了8倍性能和5倍效率。而MI300X內存不論密度還是容量都高于英偉達H100。
由于內存巨大,大規模神經網絡甚至不需要借助外部帶寬來傳輸數據,僅在芯片內部就能實現運行。蘇姿豐Lisa Su——AMD的強人CEO,中文世界昵稱蘇媽,笑容滿面的宣稱單個MI300X就能運行800億參數的大模型。
AMD第一款超級芯片誕生了。
與超級芯片相伴的自然是超級計算機,英偉達有DGX,AMD則推出了名為 Instinct(直覺)的計算平臺。它由八個MI300X組成,因此擁有高達1.5TB的HBM3內存。
除了MI300X外,這個系列還有一款早先已經發布的MI300A,它不是純GPU而是APU,即在一顆芯片上同時集合了CPU和GPU,晶體管數量較MI300X略少,為1460億個,針對的也是數據中心市場。
縱觀MI300系列產品,目標可謂十分精準——一切為了大模型。蘇姿豐預計到2027年AI芯片市場將達到1500億美元規模,這意味著它的復合年增長率超過50%——在全球經濟緩慢復蘇的大背景下,這顯然是個讓人垂涎的巨大市場。
理工科出身,從小就被譽為神童的蘇姿豐發布產品時往往給人一種“堆料”的感覺——具體好不好用先不說,咱的誠意先擺在這里了。
蘇媽靠這種“誠意”,幾乎一己之力將AMD從10年前的糟糕境地中拉了出來,當時AMD的股價長期在個位數。MI300系列同樣給人這種感覺,關鍵數據指標上十分“頂”——內存更大意味著單個GPU提供了更強的性能,這實際上等同于降低成本。
然而發布會舉行的當天,AMD的股價應聲下跌超過3%,而英偉達市值第二次超過萬億美元。
這是為什么?
1、比硬實力更重要的東西
什么東西比硬實力更重要?時間。
市場對于AMD反應不佳的原因歸納起來有兩點,都和時間有點關系。
其一是,MI300X在第三季度才能提供樣品,第四季度才正式生產,那么伴隨工藝磨合與產能爬坡等一系列問題的逐步解決,大批量出貨不會早于2024年中,相比之下,英偉達H100是2022年10月上市的,也就是說AMD比它的競品晚了至少18個月才進入市場,這對任何領域的后發者都不是一個好消息,更不用說一日千里進步的AI加速器市場了,何況AMD面對的還是在該領域占據近60%份額的巨無霸。
第二是有關英偉達的先發優勢,這種優勢不僅在于英偉達更早、更大規模地進入并行計算領域,更在于它已經為之打造了一個軟硬件一體協調的生態——人們使用CUDA軟件充分發揮英偉達GPU的性能,而CUDA生態連接著開發者和AI生態產業鏈上下游——平臺生態成為一條寬而深的護城河。硬件遷移或許是容易的,但核心技術、代碼、開發環境的整體搬遷則要傷筋動骨得多。
AMD有什么理由說服別人轉換到Instinct平臺?實際上在6月13日的這場發布會上,AMD沒有公布MI300X的任何客戶,相比之下英偉達6月2號在COMPUTEX發布DGX GH200 超級計算機的同時就介紹了三個已經下單的大客戶:谷歌云、Meta和微軟。每一個都如雷貫耳。
除了時間之外,一些對技術路線的討論也給AMD的“硬實力”蒙上了一層陰影,比如192GB的大內存。
由于采用了更適合AI計算的HBM3,而不是DDR5內存規格,MI300X面臨著兩個問題,第一它的售價不會太便宜,因為HBM3工藝復雜成本高昂,而如果MI300X的售價(AMD還沒有公布任何價格信息)哪怕接近H100,都會讓它的吸引力大打折扣。
第二,采用HBM3內存并不是AMD的獨家發明,而是業界通行做法。英偉達Grace Hopper 超級芯片里的GPU同樣使用了HBM3內存(96GB),因此它無法構成顯著的技術護城河——甚至,超越的方法都不限于一種。比如英偉達的NVLink技術可以在幾乎無損的情況下串聯256個Grace Hopper 超級芯片,這讓超級計算機的內存容量高達144TB。
2、AMD的軟實力解法
AMD自己不會不知道這些問題,特別是英偉達CUDA護城河,想要突破這種時間積累起來的優勢,非得想一些絕招不可。
其實AMD有自己類似CUDA的GPU生態軟件系統,名叫ROCm,但一直以來都存在諸多缺點,比如操作系統長期只支持Linux,一度只適配高端顯卡等等,加上參加革命比較晚,讓ROCm始終無法穩定構建一個強大的開發生態——相比之下CUDA有超過400萬以上的開發者。
于是AMD想到了合作。在發布會上AMD公布了兩項合作,一個是PyTorch基金會,這讓ROCm(也就是AMD芯片)能夠全面支持PyTorch 2.0。
另一個合作對象則是人工智能初創公司Hugging Face。雙方的合作將確保AMD的硬件針對Hugging Face的模型進行優化,以充分發揮像MI300X這種硬件的潛力。AMD宣稱在初步的測試中,MI250在BERT-Large訓練上比競品快了1.2倍,而GPT2-Large訓練上則快了1.4倍。
這種合作對吸引開發者和客戶轉投AMD平臺有一定的吸引力。Hugging Face是一個主張開源的模型服務提供商,平臺上托管了數以萬計的預訓練模型和數據集,許多企業正在利用這個平臺構建、訓練和部署自己的AI模型。
這恰好能補上AMD在平臺生態上的短板,因為ROCm實際上也是基于開源項目編寫的,它不限定編程技術,框架上除了支持PyTorch外,還有Tensorflow,甚至通過HIP,ROCm能夠實現對CUDA的完全兼容。與Hugging Face的合作將讓ROCm與其開源庫無縫集成,也就是說Hugging Face的模型在AMD芯片上能夠做到開箱即用而不需要開發者復雜的調試。
Hugging Face已經在官網表示,Transformer架構和生成式AI模型都將得到這種支持,這顯然將促進AMD的生態繁榮,意味著很快我們將能看到基于AMD芯片原生訓練的大模型。
3、極速變動的市場與不愿被壟斷的需求
Hugging Face是目前十分活躍的人工智能領域獨角獸企業,模型托管服務和開源特性讓它成為了許多大廠的合作伙伴。
僅僅今年上半年,Hugging Face就宣布了與亞馬遜云和IBM的合作,還進一步深化了和微軟Azure原本就有的緊密關系。
AMD只是Hugging Face一連串合作列表里最新一個而已。它的加入標志著大模型和生成式AI的興起正在使云服務提供商和芯片提供商為開發者提供更多基礎服務——不僅包括算力,也包括各種基礎模型的調用。
這正是AMD缺乏而Hugging Face具有顯著優勢的領域。Hugging Face的口號之一是讓人工智能民主化,這也就意味著它從根本上反對任何對市場的壟斷和獨占行為,同AI產業的上下游緊密協作不僅有利于讓更多的人受益于最新的軟硬件技術,還通過引入競爭讓這些技術變得更具性價比——也就是所謂民主化了。
“開源意味著可以自由地基于廣泛的軟硬件中構建解決方案。”在與AMD合作的博客文章最后如此說到。
這顯然為AMD在AI領域的奮起直追創造了條件,因為“民主化”的另一種說法就是“生態繁榮”,而繁榮的生態構建了英偉達最寬廣的護城河。
AMD還有機會。路透社曾在AMD發布會前后腳宣稱亞馬遜云正在考慮使用AMD的最新產品,這讓AMD的股價應聲而漲——因為大家都非常關注英偉達潛在的替代選項。
實際上包括谷歌、Meta等在內的云服務大廠都在打自研芯片的主意,為的就是不再白白給處于近乎壟斷地位的英偉達交“算力稅”,五月時甚至一度傳出微軟在和AMD展開芯片領域合作。
大家這種不約而同的反應恰恰反映了如今AI產業正處于一個激烈變革的時間節點,它孕育著機會。對AMD來說這一場戰役也不容有失:AI產業爆發的另一面是整個行業大環境的下行壓力進一步加大,巨頭們投入GPU的預算越多,留給數據中心別的業務的錢就越少——而這在過去是AMD營收的重要來源。
蘇姿豐把人工智能上升為AMD的“最高戰略優先級”,MI300X是她最新的得意之筆,但正如我們前面所分析的,硬實力之外AMD還需要有更巧的軟實力打法,才能在這場千載難逢、劇烈變動卻又森嚴的競爭版圖中為自己掙得應有的地位。
2006年,AMD收購ATI獲得了圖形處理技術,由此展開了和英偉達在GPU領域漫長的競爭。現在,這場比賽正式進入了名為“人工智能”的新賽季。
我們拭目以待。
編輯/Corrine
關鍵詞: