AI晶片三強混戰
誰能終結NVIDIA的統治?

近期AI晶片市場再次掀起波瀾。7月11日,Intel就在北京舉行了AI產品戰略暨Gaudi2的新品發表會,宣佈將在中國推出第二代深度學習加速器——Habana Gaudi2。而這次的發表也意味著Intel、NVIDIA與AMD三大晶片強權,在AI時代展開正面交鋒的序幕,比拚誰能終結過往NVIDIA獨大的統治呢?

Gaudi 2:新一代性價比之王

Gaudi 2是由Intel在2019年斥資20億美元收購的AI初創公司Habana Labs 所設計。以色列的AI晶片廠的背景,專注為資料中心提供可程式設計深度學習的加速器,在2019年推出第一代Gaudi晶片被Intel收購後,於2022年推出的Gaudi 2在性能和記憶體方面有了顯著提升,使其成為市場上橫向擴展AI訓練的一大解決方案。

發表會上,Intel資料中心與人工智慧事業部總經理Sandra Rivera詳細介紹了Gaudi 2的性能,並將其與NVIDIA高端GPU A100和H100進行了對比。根據6月公佈的MLCommons MLPerf基準測試(被普遍認為是最具信服力的AI性能測試基準)結果,Gaudi 2在GPT-3模型、電腦視覺模型ResNet-50、Unet3D以及自然語言處理模型BERT上,均取得比A100更優異的成績。儘管與H100相比還有一定差距,但Intel表示,Gaudi 2的每瓦性能大約是A100的兩倍。同時隨著性能的進一步優化,預計在今年9月,Gaudi 2的性價比將超越H100,成為NVIDIA100系列中強有力的競爭對手。

性價比,是Gaudi 2對抗NVIDIA100系列的一個核心優勢。此外,Gaudi2也是僅有向GPT-3大模型訓練基準提交性能結果的解決方案之一。這也讓Intel在眾多挑戰者中脫穎而出,成為最具競爭力的對手。Intel還透露,計畫在2025年將Gaudi產品線與GPU產品線整合為統一架構的新產品,提供更好的軟體適配能力與AI處理能力,以滿足市場多樣化的需求。

GPU“二號玩家”AMD的奮起直追

Intel並非首個向NVIDIA發起衝鋒的晶片巨頭。去年6月,AMD推出了CPU+GPU架構的Instinct MI300,進軍AI訓練市場。今年6月,他們進一步優化了MI300,推出了高達192 GB HBM記憶體的MI300X,以滿足日益增長的大模型訓練需求。

大摩分析師Joseph Moore此前給出樂觀指引稱,AMD已看到來自客戶的“穩定訂單”,公司2024年的AI相關營收有望達到4億美元,最高甚至可能達到12億美元——這一預期是此前的12倍之多。

新一輪競逐

儘管NVIDIA在模型訓練和推理上的GPU優勢明顯,擁有平行計算能力和記憶體頻寬等優點,以及統一計算設計架構CUDA的封閉生態,綁定了大量開發者,但隨著市場對大型AI模型訓練需求的增長,NVIDIA的產能出現限制,訂單已經排到2024年,H100在明年一季度前都處於售罄狀態。Intel與AMD也絕不會讓NVIDIA獨美,都在抓緊時間嘗試各自的方案。

除了Intel、AMD和NVIDIA這三大晶片強權,市場上仍有更多巨頭摩拳擦掌準備加入競爭。Google自研的定制晶片Tensor Processing Unit(TPU)已經進入第四代;Meta Platforms在7月18日宣佈將與高通合作,採用高通晶片在手機和個人電腦上運行Meta的新大型語言模型Llama 2;同時,Musk也在xAI會議上表示準備自研AI晶片,這些巨頭希望打破「AI晶片=NVIDIA」的現狀,在這個萬億級市場中分一杯羹。

在AI晶片市場,不會有一家獨大,圍繞著資料中心的創新遠未停止,特別是隨著大模型的流行,各個科技巨頭不斷加入,全新的競逐才剛剛拉開序幕。