一覺醒來,次又感覺整個(gè)朋友圈都被 AMD 和 蘇媽刷屏了。次又
一開始還有點(diǎn)奇怪,次又最近AMD 也沒發(fā)什么新的次又游戲 CPU 和顯卡啊。
點(diǎn)進(jìn)去才知道原來是次又前兩天,AMD 在大洋彼岸的次又加州圣何塞召開自己的年度 AI 盛會(huì) Advancing AI 。
嚇得我趕緊去補(bǔ)看了下我 “女神” 蘇媽又帶來了什么新鮮玩意兒。次又
在練了兩個(gè)小時(shí)的次又英語聽力之后,我逐漸感覺到,次又事情好像不太對(duì)勁啊 ——
怎么會(huì)上發(fā)的次又都是服務(wù)器GPU,開發(fā)者平臺(tái)這些東西,次又好像跟我這個(gè)臭打游戲的次又,還有廣大的次又普通消費(fèi)者沒什么關(guān)系啊。
蘇媽,次又你變了!次又
可當(dāng)我又回過頭去研究了下,才發(fā)現(xiàn) AMD 看著是一本正經(jīng)地在講 AI ,但是整個(gè) keynote 透露出來的味道還是我們熟悉的那種 AMD YES 的感覺。
按照我們的習(xí)慣,我們還是先來看看這次新發(fā)布的產(chǎn)品吧。
首先是這兩年大家關(guān)注比較多的 GPU,最新的 AI 芯片 Instinct MI350 系列。
該系列中的 MI355 被蘇媽單獨(dú)拎了出來講,只見蘇媽滿臉自豪地給我們介紹:
MI355 采用 3nm 制程及 3D 先進(jìn)封裝技術(shù),集成了 1850 億個(gè)晶體管,搭載 288GB HBM3e 內(nèi)存,內(nèi)存帶寬為 8TB/s,在 FP4、FP6 精度下峰值算力達(dá) 20PFLOPS,單個(gè) GPU 可運(yùn)行 5200 億個(gè)參數(shù)的大模型。
整體的 AI 能力上,MI355X 跑 LLama 3.1 的神經(jīng)網(wǎng)絡(luò)吞吐量比上一代 MI300X 高出了 35 倍。
用來跑具體的大模型的話,MI355X 的性能同樣出色。
在Deepseek-R1、Llamma 4 Maverick 和 Llama 3.3 70B 上,MI355X 的性能分別是前代產(chǎn)品的3倍、3.3 倍和 3.2 倍。
可能蘇媽自己也知道這樣嘰里咕嚕地講參數(shù)跟自己上一代比一比,大家看了會(huì)覺得很無聊,所以干脆不裝了 ——
直接拉上隔壁老黃家的產(chǎn)品進(jìn)行了一個(gè)我們熟知的賽博斗蛐蛐。
按照蘇媽的說法,AMD MI350 系列的內(nèi)存容量是 NVIDIA GB200 的 1.6 倍。
具體的AI的性能表現(xiàn)上,運(yùn)行 DeepSeek-R1 或 Llama3.1 時(shí),AMD MI355X 每秒產(chǎn)生的 tokens 比 NVIDIA B200 多 20%~30%。
不光是性能,AMD 在傳統(tǒng)強(qiáng)項(xiàng)上也沒放過 NVIDIA :MI355X 每美元可提供的 tokens 比 NVIDIA B200 產(chǎn)品多 40%。
主打一個(gè)性能我跟你差不多,但我比你便宜,可以說相當(dāng)適合那些嫌 NVIDIA 太貴的企業(yè)買回來搭自己的 AI 數(shù)據(jù)中心了。
但是細(xì)心的差友,應(yīng)該發(fā)現(xiàn)了 —— 不對(duì)啊蘇媽,這個(gè) B200 我怎么記得是 NVIDIA 上一代的產(chǎn)品了?
還真是,我查了下發(fā)現(xiàn),B200是 NVIDIA 在2024 年在 NVIDIA 年度開發(fā)者盛會(huì) GTC 上發(fā)布的。
GB200 也是在這場大會(huì)上發(fā)布的,它由兩顆 B200 GPU 與一顆 Grace CPU 芯片組合而成。
而 NVIDIA 的當(dāng)代產(chǎn)品,是今年 3 月 19 日在 NVIDIA 年度開發(fā)者大會(huì)上發(fā)布的 B300 和 GB300。
好在即使是面對(duì) NVIDIA 當(dāng)代的產(chǎn)品,蘇媽的 MI355X 也絲毫不虛。
單從 FP4、FP6 精度下的峰值算力原始數(shù)據(jù),MI355X 以 20PFLOPS 領(lǐng)先于 NVIDIA 的B300 的 15PFLOPS 。
而GB300 由于是一個(gè)集成化的計(jì)算平臺(tái),與單芯片 MI355X 的直接算力對(duì)比需結(jié)合實(shí)際系統(tǒng)部署場景。
不過就推理性能提升幅度而言,GB300 相比 GB200 提升 1.5 倍,在復(fù)雜 AI 推理任務(wù)的實(shí)際運(yùn)行中,可能也就和 MI355X 打的有來有回吧。
看來雖然我們不知道為啥蘇媽在發(fā)布會(huì)上慫了,只敢對(duì)比友商上一代的產(chǎn)品,但我們?nèi)匀豢梢苑判牡暮俺瞿蔷洌?/p>
AMD, YES!
然而喊完這句之后,我仍然要說一句,AMD 當(dāng)下在 AI 市場的處境,仍然不算樂觀。
根據(jù)財(cái)報(bào)統(tǒng)計(jì),2024 年一年,AMD 旗下的數(shù)據(jù)中心業(yè)務(wù)收入為 126 億美元,全年增長 94%。
光看這個(gè)數(shù)字的確是夠驚人了,但蓋不住老黃更猛:
NVIDIA 在2024年與 AMD 增速相同,規(guī)模卻達(dá)到 1152 億美元,是 AMD 的 10 倍左右。
而在去年的全球數(shù)據(jù)中心 GPU 市場中, NVIDIA 靠一己之力直接拿下了94% 的份額,而 AMD 仍然只有可憐的 4%。
顯然,AMD 也是能看到這樣這樣的處境的,所以在這次的 Advancing AI 2025 上,我們也看到了它的努力。
不光是在GPU 性能上努力追上了 NVIDIA ,在生態(tài)建設(shè)上,也開始一步一步地往前走了。
比如推出全新 AI 軟件棧 ROCm 7.0。相比前代,ROCm 7.0 的推理性能提升至 4 倍以上,訓(xùn)練性能提升 3 倍 。
性能上的提升倒是其次,最重要的是它對(duì) GPT、Llama 4、DeepSeek 等多款主流大模型提供 Day 0 級(jí)支持,意味著但凡這些大模型發(fā)布了更新版本,開發(fā)者們都能借助 ROCm 7.0 迅速開展相關(guān)開發(fā)工作,大大縮短了開發(fā)周期。
看來 AMD 還是一如既往地貼心。
不光如此 AMD 還推出了 AMD 開發(fā)者云,他們的這么做的設(shè)想是,能讓開發(fā)者無需自行搭建復(fù)雜的硬件環(huán)境,通過云平臺(tái)即可便捷地獲取 AMD 先進(jìn)的 AI 硬件資源,
這對(duì)廣大的 AI 開發(fā)者,尤其對(duì)于小型團(tuán)隊(duì)和個(gè)人開發(fā)者而言,無疑是個(gè)更大的好消息。
另外,蘇媽在 Advancing AI 的現(xiàn)場給我們帶來了另一個(gè)驚喜:
下一代 AI 芯片 MI400 系列將于明年發(fā)布,MI400 系列將由 AMD 和 OpenAI 聯(lián)合研發(fā),OpenAI 為 MI400 系列的訓(xùn)練和推理需求提供了重要反饋 。
所有這些加起來,看著是不是有點(diǎn)當(dāng)年 AMD 在消費(fèi)級(jí) CPU 那味兒了。
想當(dāng)年,看著英特爾在消費(fèi)級(jí) CPU 領(lǐng)域一家獨(dú)大,接過爛攤子的蘇媽,硬是頂住了壓力微微一笑, 先是抱住了臺(tái)積電的 “大腿”,轉(zhuǎn)身又拿出了 “ Zen ” 架構(gòu),性能哐哐的就追上了英特爾。
更絕的是,AMD 性能追上來了,但價(jià)格反而要比英特爾更劃算。那句經(jīng)典的 AMD YES 就是這么來的。
看到 AMD 銳龍?zhí)幚砥鬟@么能打,游戲本廠商們也坐不住了。以前大家基本都圍著英特爾轉(zhuǎn),現(xiàn)在紛紛開始推出搭載 AMD 處理器的游戲本。
就這樣 AMD 靠著制程工藝的突破、架構(gòu)的革新、超高的性價(jià)比,當(dāng)然啦游戲本廠商的支持,成功在消費(fèi)級(jí) CPU 市場,尤其是游戲本市場,把英特爾從神壇上拉了下來,上演了一場精彩絕倫的逆襲大戲。
雖然 AI 和云計(jì)算領(lǐng)域玩法和邏輯不一定跟當(dāng)年的消費(fèi)級(jí) CPU 完全一樣,現(xiàn)在的 NVIDIA 也不見得就是當(dāng)年的英特爾。
在這些領(lǐng)域,AMD 能不能再來一次大逆襲,還不可知。
但我們還是很開心地看到,AMD 即使處在不利的地位,也依然能保持清醒,腳步踏實(shí)地走自己的路。
我也很希望,AMD 能夠繼續(xù)保持,找準(zhǔn)時(shí)機(jī)在 AI 和云計(jì)算領(lǐng)域啃下更多的市場。
雖說這跟我一個(gè)臭打游戲的沒啥關(guān)系,但總想著這個(gè)市場老是只能看到老黃穿著皮衣在上面侃侃而談,多少有點(diǎn)無聊。
總得多點(diǎn)別的身影嘛,我看蘇媽這會(huì)這套紅色的裝扮就挺不錯(cuò)的。
直播吧5月30日訊 遼寧鐵人外援姆本扎獲得中甲第9輪最佳球員...
2025-07-1836