AMD Zen 3: AnandTech 專訪 Mark Papermaster

科技公賣局
Oct 19, 2020

--

AMD 在本月初發表了四款Ryzen 5000系列 Zen 3 CPU,從最高階16C/32T的 5950X,到中階6C/12T的5600X,AMD不再只是個「比Intel便宜」的選擇,而是能從單核心性能、多線程性能、售價,以及能耗,全方位主宰桌機處理器市場的領導品牌。

Ryzen 5000產品將在11月5號上架,在我們等待的同時,AnandTech的資深編輯Dr. Ian Cutress與AMD CTO Mark Papermaster進行訪談,以下內容翻譯自翻譯自 AnandTech專欄:

IC: 當Ryzen系列初次發表的時候,我採訪到Dr. Lisa Su,他和我提到AMD的市場定位讓公司在設計新的高性能x86處理器時,能夠跳脫傳統思維。現在AMD站上了該市場的頂點,AMD內部團隊是如何不被勝利沖昏頭,穩扎穩打得繼續創新呢?

MP: 我們團隊對於今日的成就當然非常驕傲,他們是業界中數一數二有創意的團隊。我們也是經過辛苦耕耘,才能用Zen 3站上現在的領先地位,我們接下來的產品規劃也將非常有可看性。當然,我們的團隊依舊保持著謙卑的態度,這點從Zen 3的設計上就可以看出來。我們並不是用甚麼神奇的招數來提升性能,而是從CPU架構上的各個面向來著手,透過提升效能、降低與記憶體間的延遲,來達到全方位的提升。

相較於去年中發表的Zen 2,Zen 3帶來了19% 的IPC提升,這是項非常了不起的成就。我們會繼續苦幹實幹,用硬底子的設計能力,為消費者帶來更多的性能提升。

IC: 我想談談這19%的IPC提升,Zen 3在架構上做出了變革,讓原先只有四核共享16MB cache的CCX,變成每個CCX有8核共享32MB cache,CCX核心數的增加在提升性能上的貢獻有多少?還是有其他架構變革也對性能提升有顯著效果嗎?

MP: CCX架構的變更讓我們大大降低遊戲時CPU與記憶體之間的延遲。遊戲市場是我們的高性能處理器很重要,而在玩遊戲的時候,遊戲軟體會高度依賴其中一個線程,而那個線程的性能要仰賴L3 cache的大小。因為如果他能使用L3 cache,就不必使用系統記憶體(ram)。將八核心都放在同一個CCX中共享32MB的L3 cache大大降低了延遲,進而提升了性能。當然除此之外,我們對於整個CPU架構都有所改進,但CCX的變革是性能提升的主因。

IC: 每個核心可用的L3 cache加倍真的是蠻大的變動。如你所說,這讓CPU不用頻繁的使用系統記憶體。但這個做法不會同時增加L3 cache內部的延遲嗎?除了讓L3 cache翻倍外,取用L3 cache的核心數也加倍了,這樣的變革應該也有些代價吧?

MP: 我們團隊不論是在邏輯運算,或是實體結構上的設計都下足了工夫。在架構大改的情況下,讓邏輯運算的方式與實體結構能互相配合,不會改了結構卻拖累了運算,增加延遲,得此失彼。這背後需要到非常高深的設計功力,才讓我們得以透過改變架構來提升性能

除此之外,通常在提升性能的同時,能耗也會隨之上升。況且我們沒有改變製程,依舊維持台積電七奈米的工藝。有些人自然就會認為Zen 3相較Zen 2會更耗能,但我們並沒有。我們不僅改進了CCX,也讓Zen 3的能耗維持跟Zen 2一樣的水準。

至今每代Ryzen發表,我們都維持在同一個AM4插槽、同一個能耗水準,卻也都帶來很大的性能提升。

IC: 說到製程,我們聽到的說法是Ryzen 5000使用了與Ryzen 3000XT系列相同的台積電七奈米工藝(較原先Ryzen 3000系列七奈米稍有進步),Ryzen 5000系列還有其他製程上的改進嗎?

MP: 運用在運算核心上的製程依舊維持七奈米工藝,這代表我們也繼續沿用舊有的PDK(process designing kit)。所以電晶體方面我們還是遵循台積電原有的設計原則。晶圓廠在生產的過程會逐步精進製程,提升良率和品質,每季都會有微調。這就是你所指的稍有進步,但它依舊是台積電的七奈米製程。

IC: 從Zen 2到Zen 3,除了19%的IPC提升,在每瓦性能方面也有24%的提升,這代表你們在供電上也有所加強,能否多跟我們談談這部分?

MP: 我們非常重視供電管理,我們的每個CPU中都有一套完整的微控制器以及供電管理系統。每代產品都會針對這部分改進,我們對於這24%的提升很自豪。在Precision Boost上的改良讓我們能更精確的利用CPU內部各個感知器的參數去調控時脈與電壓。更有彈性、更精確的供電管理讓整體效率更高。

IC: Zen 2處理器的I/O die在閒置待機時的耗電量並不低,有時可達13到20瓦,據說Zen 3也使用相同的I/O die。你們有為了改進能耗而對I/O die做出改變嗎?還是就繼續使用與Zen 2相同的I/O die。

MP: I/O die上的持續進步讓我們能夠帶給消費者更好的性能。我們在設計Ryzen時就仔細考量,讓消費者不用更換平台,能在同一個AM4插槽上,得到性能提升。能耗一直是我們很重視的一塊,Zen 3上主要是透過CCX以及核心與cache之間的改良來改進能耗。(註Mark這段回答的有點迂迴,並沒有很直接的表示I/O die上有沒有改進,但從最後一句看來,應該是沒有改I/O哈哈)

IC: 有關AMD在I/O接口以及用電量的部分,現在你們的產品支援PCI-E Gen 4並使用七奈米的製程,唯獨I/O die的部分還是在使用Global Foundries的12/14奈米製程,未來會在這部分做出改良嗎?

MP: 我們在每一代產品都有做出改良,未來我們將全面採用PCI-E Gen 5,我們的下一代產品中會對運算核心、I/O接口、記憶體控制元件做出改良。

IC: 說到你們的chiplets架構,我們注意到CCX除了裡面的核心數增加,chiplets連接CPU外部的線路,原先是在兩個CCX之間,現在被移至兩個CCX的外圍,這樣的作法能在能耗或延遲上帶來什麼好處嗎?

MP: 這就是我先前提到的,要讓邏輯運算與實體結構上的變革互相配合,為了提升整體性能,有時也要在某些部分做出犧牲。這次採用新的CCX與cache配置,降低了運算核心與cache間的延遲,但把控制線路移置CCX的外圍意味著我們會有較長的線路,但同時,它所連接的部分也對於延遲較不敏感,較長的線路所帶來的延遲對它影響不大,所以CPU整體的性能還是能有所提升。

IC: AMD在過去表示Infinity Fabric的設計也會隨著CPU一起改良,針對能耗以及頻寬方面做出改進,這次採用Zen 3架構的Ryzen 5000系列上有使用新的Infinity Fabric設計嗎?

MP: 我們加強了Infinity Fabric的資料安全性。Zen 3架構最大的賣點是在運算性能上的提升,Infinity Fabric也有因此得到改善,我們接下來會再提供更詳細的資料跟大家。

IC: 不論是AMD還是Intel,在製作CPU時都開始使用特挑晶片(binning),但這也讓超頻的空間變得有限。從你的角度來看,像是Precision Boost Overdrive這類軟體(讓CPU有時可以超過原先設定的時脈),會逐漸因為特挑而式微嗎?還是它會繼續演進?

MP: 我們的目標一直都很明確 — 讓CPU達到它所能承受最高的時脈。我們在Zen 3上達到了4.9 GHz的表現。特挑晶片也是我們很重視的一塊,我們的CPU經過許多測試,讓它在各種用途下都能提供消費者很好的表現。但同時,我們的顧客也很聰明,他們會針對自己特定的用途,透過超頻強化性能,我們將會持續支援超頻的功能,讓顧客能依照自己的需求,調整CPU的表現。

IC: 你剛剛提到了Infinity Fabric的資安,AMD通常是怎麼處理CPU的資安漏洞呢?Zen 3上有新增甚麼功能來應對資安問題嗎?

MP: 我們在設計CPU時一直都把資安放在優先順位,像是針對旁路攻擊(side channel attack)這類在x86架構上常見的資安漏洞進行防堵。我們在加密技術上有很大的進展,不論是記憶體甚至虛擬主機的情況下都能提供保障。面對其他像是Return Oriented Programming (ROP)等資安攻擊也都會有應對方案。我們之後會再針對資安進行詳細說明。

IC: 你覺得資安對於消費者是不是沒那麼重要,只有企業用戶比較在意這方面的問題? AMD對於企業跟消費者產品的資安是分開還是一起設計的?

MP: 我們在資安上並不會區分消費者或企業用戶。當然,企業用戶通常有一些特殊的需求,但我們相信不論是誰都應該得到相同的待遇與重視。過去我們的確在企業端下比較多功夫,但現在我們一視同仁。

IC: 回到Zen 3的IPC提升,你在發表會的時候提到這19%的進步是來自不同微架構(microarchitecture)上的改良。其中包含Load/store指令元件 (load/store units)以及micro-op cache和prefetcher updates,我知道在Zen 3上市前你還會再詳細解說本次架構上的變革,但能不能先跟我們透露一點這部分的消息?

MP: Load/store指令上的強化是本次IPC提升的一大關鍵,它與執行單位(execution unit)的通量(throughput)息息相關,它讓我們能加大執行單位以及它的通量,我們提升了每個運算週期的載入和儲存指令(load/store),未來我們會再針對這部分詳細解釋

IC: 處理器越大,它的能耗自然也會上升,你們對於這方面有甚麼對策嗎?

MP: 這點我們會從實體結構以及運算方式下手。就像Zen 3雖然使用跟Zen 2一樣的製程,卻能有較前代更好的性能,這背後牽扯到我們剛提到的供電管理、實體結構、邏輯運算的互相配合。

IC: Zen 3 是Zen系列的第三個世代,接下來AMD還會推出Zen 4甚至Zen 5。Jim Keller曾經說過,架構改良要從最容易的地方進行調整,但總有一天會面臨大改整個架構,從你們公布的時間軸來看,AMD距離大改架構也不遠了。能否跟我們談一下你們接下來會對Zen系列進行甚麼樣的改良,還有對於Zen的後繼架構會如何設計呢?

MP: 對我而言,Zen 3 就是大改過後的新架構,它還是Zen系列的產品,但它並不是單純承繼先前Zen系列的小改款。

IC: x86處理器的市場競爭激烈,同時還要面對ARM系統逐日升高的威脅。ARM聲稱自家的Neoverse V1設計可以達到近似x86處理器的IPC表現,而且每年可以提升30%的性能,同時又有很低的能耗表現。AMD面對來自其他架構的競爭,有甚麼對策嗎?

MP: 我們會繼續追求更高的性能。不論你採用哪個ISA,增加性能的手段都和增加電晶體數量脫不了關係。我們選擇開發x86的產品因為目前多數的軟體在這個平台上的表現最好,生態系也最完整,這讓大家更容易採用我們的產品。這個市場只會更加競爭,我們的對策很簡單,就是繼續向前,提升我們的性能。

IC: Zen 3相較前一代有很大的性能提升,但目前似乎還沒聽到AMD用CPU來加速AI運算。這是能夠靠增加運算核心和浮點運算能力來達成的嗎?還是這需要改良其他像是指令集等等的方式來加速AI運算?

MP: Zen 3的運算性能是本次研發重點,Zen 2在部分層面有著領先對手的性能,而Zen 3則是要達到全方位的性能制霸。浮點運算當然也是其中之一,我們有對浮點以及乘積累加運算單元(multiply accumulate units)做出改良,這對AI的運算像是推論(inferencing)這類常使用CPU來執行的東西有所提升。除此之外,時脈上的提升也對這類運算的效能有所幫助。我們並沒有在這次產品中加入新的數學運算模式。

IC: AMD有打算要發布加速AI運算的數學函數庫嗎(math libraries)?

MP: 我們接下來會逐步釋出這些AI相關的數學函數庫。

IC: Zen 2 Ryzen和EPYC的成功都跟你們的chiplets有關,體積小、高良率、又再經過特挑。但近期我們開始看到其他廠商用台積電七奈米製程做出單晶片結構(monolithic)的處理器,最大的甚至可以到600m2。隨著你們的市佔逐漸增加,AMD未來會繼續增加CPU上chiplets的數量嗎?

MP: Zen 2產品有著很棒的性能,在設計上又很有彈性,生產良率也很高,而且這都是在七奈米還未完全成熟的情況下達成。未來你會看到更多的chiplets設計被用在更多地方,即便我們的對手在初期並不看好這個設計理念,我們會繼續使用這個方式設計我們的產品。

Chiplets設計並不一定適用於每種處理器(CPU、GPU、加速器等等)的設計,但我相信它會繼續在業界佔有一席之地,尤其是在AMD。

IC: 說到這裡,近期你們的競爭對手也宣布將在他們的產品上採用類似的chiplets結構,你認為chiplets的用途可以多廣?

MP: Chiplets設計也不是處處都適合,這取決於你的用途。這背後也牽扯到產品的供應鏈,我們必須確保它有最好的性能,並且能夠穩定的生產出產品,這之間的平衡是我們在設計每個產品的時候都要考量的。

IC: 台積電近期發表了3D Fabric的設計,其中包含了他們在封裝技術的每個層面。AMD已經在產品中結合了一部分的2.5D封裝技術,你們未來是否會採用台積電其他3D封裝技術?

MP: 我們一直都和晶圓廠在封裝技術上緊密合作,未來幾年我們將在封裝以及interconnect技術上有很大的突破,這將讓AMD在晶片設計上有更多的彈性,像是我們能把品質好的晶片封裝在一起。這對我們這個行業來說就像美夢成真一樣。

IC: AMD一直在開拓新的市場,像你們近期發表了首款適用於Chromebook的Zen處理器。有哪個市場是你們未來想要踏入的嗎?像是物聯網或車用電腦。

MP: 我們一直都在觀望其他相關的市場。我們在嵌入式系統(embedded system)的市場逐步成長,這也會是我們未來繼續耕耘的一塊。但我們對於某些大家很關注的市場並不一定有興趣,因為它跟我們的研發路線不太相關。我們的路線是提供市場高性價比的產品,而我們也會繼續往這個方向前進。

--

--

科技公賣局

為您帶來關於桌機、主機、手機等各式消費性電子產品的新聞與分析