『深度文』x86架構與ARM架構的差異 https://bit.ly/3AXCHPL
x86與ARM,複雜指令集與精簡指令集
隨著Apple推出最新的ARM架構晶片,越來越多人開始問到底ARM架構和intel的x86架構有什麼不同,本篇將會介紹ARM與x86架構,並介紹兩者之間的差異。
x86架構
x86屬於 複雜指令集計算機(CISC)架構,早期為了節省程式設計師的設計時間,開發出單一指令包含複雜操作的程式碼,來簡化設計程式所需的程式行數,當時幾乎所有CPU都是採用CISC架構。
優點:
x86屬於CISC架構,特點是可以為工程師在開發軟體時節省很多時間,也可以讓新系統使用一個包含舊系統的指令集合,這樣就可以在新系統上使用舊系統的軟體。簡而言之就是對開發軟體的工程師來說使用CISC架構是省時而且輕鬆的。
缺點:
為了將更多的指令打包進一個小小的CPU上,就會需要將更多複雜的電晶體設計在晶片上,而更強大的功能就意味著更複雜的設計,如此便會導致像是耗電、高發熱量,並且由於x86自家設計上會先用解碼器先將複雜指令變成類似於RISC的指令,再給核心執行,這樣一來整體上執行工作效率會變得比較差,處理資料速度也會比較慢。
ARM架構
ARM屬於 精簡指令集計算機(RISC)架構,相較於CISC,RISC架構只包含簡單基本的指令,再用這些基本的指令組合成複雜指令,最廣泛的應用是在手機晶片上,早期的手機晶片因為功能較簡單,體積也不能太大,因此只包含簡單基本指令的RISC架構晶片就比複雜的CISC架構晶片更適合作為手機的計算晶片。
優點:
因為相較於x86架構,ARM所屬的RISC架構不需要複雜的晶片設計,所以RISC在相同晶片條件下RISC的執行速度是CISC的2-4倍。而且可以做到讓晶片體積縮小、降低功耗、節省成本、提高效能,並且也可以比CISC應用更多先進技術來開發下一代晶片。
缺點:
ARM因為是RISC架構,晶片上只有基本且簡單的指令,這樣工程師在寫程式碼執行相同任務時,RISC架構相較CISC架構就需要寫更多程式,打個比方,現在要寫程式執行“丟雞蛋”這個任務:
CISC架構下工程師只要寫『拿起雞蛋>丟出雞蛋』這樣簡單的指令
而在RISC架構下,工程師需要將動作分解成多個步驟,就要寫成『朝雞蛋伸出手臂>用手抓住雞蛋>將手臂伸回>將手臂抬起>手臂朝目標方向甩動>手放開雞蛋』。
因此工程師會需要花更多時間在編輯程式碼,軟體開發時間增加,軟體所占容量也會增加。
小結:
X86架構所採用的複雜指令所帶來的速度提升早已經被花費在解碼上的時間所抵銷甚至拖慢,另外因為x86架構的晶片設計較為複雜,x86架構晶片會在製成上比ARM架構晶片還要難生產。
另外x86架構晶片也會比較耗能,發熱量也較大,因此目前除了個人電腦因為x86平台還有大量相容的軟體生態所以還在用x86外,ARM及其他RISC架構的指令集已經成為當今最流行的晶片架構。舉凡手機,平板及目前當紅的物聯網都是採用RISC架構的指令集。
但話又說回來,雖然現在CISC跟RISC看似不同的兩種架構,不過隨著兩者的發展,CISC會需要克服耗能,運算速度的問題;而RISC的設計也正在變得複雜 (不是向著CISC的方向),兩者之間的界線將隨著世代更迭變得越來越模糊。
或許在未來的某一天兩者將難以分辨,但可以確定隨著兩者的發展及碰撞,終將為人類帶來更快更節能的晶片。
『深度文』x86架構與ARM架構的差異 https://bit.ly/3AXCHPL


2022-12-01_0729462022-12-01_0730202022-12-01_072957

ARM架構 - 維基百科,自由的百科全書 https://bit.ly/3gSleS4
ARM架構,過去稱作進階精簡指令集機器(英語:Advanced RISC Machine,更早稱作艾康精簡指令集機器,Acorn RISC Machine),是一個精簡指令集(RISC)處理器架構家族,其廣泛地使用在許多嵌入式系統設計。由於節能的特點,其在其他領域上也有很多作為。ARM處理器非常適用於行動通訊領域,符合其主要設計目標為低成本、高效能、低耗電的特性。另一方面,超級計算機消耗大量電能,ARM同樣被視作更高效的選擇[3]。安謀控股(ARM Holdings)開發此架構並授權其他公司使用,以供他們實現ARM的某一個架構,開發自主的系統單晶片和系統模組(system-on-module,SoC)。 ARM架構 - 維基百科,自由的百科全書
ARM架構版本從ARMv3到ARMv7支持32位元空間和32位元算數運算,大部分架構的指令為定長32位元(Thumb)指令集支持變長的指令集,提供對32位元和16位元指令集的支持),而2011年發佈的ARMv8-A架構添加了對64位元空間和64位元算術運算的支持,同時也更新了32位元定長指令集[4]。
至2009年為止,ARM架構處理器佔市面上所有32位元嵌入式RISC處理器90%的比例[5],使它成為占全世界最多數的32位元架構之一。ARM處理器可以在很多消費性電子產品上看到,從可攜式裝置(PDA、行動電話、多媒體播放器、掌上型電玩和計算機)到電腦週邊設備(硬碟、桌上型路由器),甚至在導彈的彈載計算機等軍用設施中都有他的存在。在此還有一些基於ARM設計的衍伸產品,重要產品還包括Marvell的XScale架構和德州儀器的OMAP系列。
2011年,ARM的客戶報告79億ARM處理器出貨量,占有95%的智能手機、90%的硬盤驅動器、40%的數字電視和機上盒、15%的微控制器、和20%的移動電腦[6]。在2012年,微軟與ARM科技生產新的Surface平板電腦,AMD宣布它將於2014年開始生產基於ARM核心的64位元服務器芯片,[7]2016年,日本富士通公司宣布「京」超級計算機的後繼機種將採用ARM架構[3],該超級電腦於2019年5月定名為「富岳」[8],2020年6月於TOP500奪冠[9][10][11]。 ARM架構 - 維基百科,自由的百科全書
2016年7月18日,日本軟銀集團斥資3.3兆日元(約合311億美元)收購了安謀控股[12]。
ARM架構 - 維基百科,自由的百科全書
自2005年,每年超過一億的手機銷售約98%使用了ARM處理器[13]。截至2009年,占大約90%的嵌入式32位RISC處理器[14]和ARM處理器被廣泛使用在消費性電子產品,包括個人數字助理(PDA)、平板電腦、移動電話、數字媒體和音樂播放器、手持式遊戲遊戲機、計算器和計算機外圍設備(如硬盤驅動器和路由器)。
除了消費電子,ARM架構處理器也開始用於以往x86、x64處理器獨大的個人電腦、伺服器。而在2020年成為TOP500排名第一的「富岳」為首部奪冠的ARM架構超級電腦。
歷史
一顆主要用於路由器的科勝訊公司ARM處理器
用於松下多媒體播放機的晶片
ARM的設計是艾康電腦公司於1983年開始的發展計畫。
這個團隊由Roger Wilson和Steve Furber帶領,著手開發一種類似進階6502架構的處理器。Acorn電腦有一大堆建構在6502處理器上的電腦,因此能設計出一顆類似的晶片即意味著對公司有很大的優勢。
Acorn RISC Machine:ARM2
用在BBC Micro上的ARM1 second processor
團隊在1985年時開發出樣本「ARM1」,而首顆真正能量產的「ARM2」於次年投產。ARM2具有32位元的資料匯流排、26位元的定址空間,並提供64 Mbyte的定址範圍與16個32-bit的暫存器。暫存器中有一個作為程式計數器,其前面6位元和後面2位元用來保存處理器狀態標記。ARM2可能是全世界最簡單實用的32位元微處理器,僅容納了30,000個電晶體(六年後的摩托羅拉68000包含了70,000顆)。之所以精簡的原因在於它不含微碼(這大概占了68000的電晶體數約1/4至1/3);而且與當時大多數的處理器相同,它沒有包含任何的快取。這個精簡的特色使它只需消耗很少的電能,卻能發揮比Intel 80286更好的效能[15]。後繼的處理器「ARM3」則備有4KB的快取,使它能發揮更佳的效能。
Apple、DEC、Intel、Marvell:ARM6、StrongARM、XScale
在1980年代晚期,蘋果電腦開始與艾康電腦合作開發新版的ARM核心。由於這專案非常重要,艾康電腦甚至於1990年將設計團隊另組成一間名為安謀國際科技(Advanced RISC Machines Ltd.)的新公司。也基於這原因,使得ARM有時候反而稱作Advanced RISC Machine而不是Acorn RISC Machine。由於其母公司ARM Holdings plc於1998年在倫敦證券交易所和NASDAQ掛牌上市[16],使得Advanced RISC Machines成了ARM Ltd旗下擁有的產品[17]。
這個專案到後來進入「ARM6」,首版的樣品在1991年釋出,然後蘋果電腦使用ARM6架構的ARM 610來當作他們Apple Newton產品的處理器。在1994年,艾康電腦使用ARM 610做為他們個人電腦產品的處理器。
在這些變革之後,內核部份卻大多維持一樣的大小——ARM2有30,000顆電晶體,但ARM6卻也只增長到35,000顆。主要概念是以ODM的方式,使ARM核心能搭配一些選配的零件而製成一顆完整的CPU,而且可在現有的晶圓廠裡製作並以低成本的方式達到很大的效能。
ARM的經營模式在於出售其IP核,授權廠家依照設計製作出建構於此核的微控制器和中央處理器。最成功的實作案例屬ARM7TDMI,幾乎賣出了數億套內建微控制器的裝置。
迪吉多曾購買這個架構的產權並研發出「StrongARM」。在233 MHz的頻率下,這顆CPU只消耗1瓦特的電能(後來的晶片消耗得更少)。這項設計後來為了和英特爾的控訴和解而技術移轉,英特爾因而利用StrongARM架構補強他們老舊的i960產品。英特爾後來開發出他們自有的高效能架構產品XScale,之後賣給了邁威爾科技。
2020年11月11日,蘋果公司發布基於ARM芯片(Apple M1)的蘋果桌上型電腦和筆記本電腦,2021年4月21日,蘋果公司發布基於M1 CPU的24 吋Mac和新iPad Pro
ARM架構 - 維基百科,自由的百科全書 https://bit.ly/3gSleS4

ARM架構 - 維基百科,自由的百科全書


2022-12-01_073408

x86泛指一系列基於Intel 8086且向下相容的中央處理器指令集架構。最早的8086處理器於1978年由Intel推出,為16位元微處理器x86 - 維基百科,自由的百科全書
該系列較早期的處理器名稱是以數字來表示80x86。由於以「86」作為結尾,包括Intel 8086、80186、80286、80386以及80486,因此其架構被稱為「x86」。由於數字並不能作為註冊商標,因此Intel及其競爭者均在新一代處理器使用可註冊的名稱,如Pentium,來描述x86架構下的處理器產品。現時英特爾將其稱為IA-32,全名為「Intel Architecture, 32-bit」,一般情形下指代32位元的架構。 x86 - 維基百科,自由的百科全書
x86 - 維基百科,自由的百科全書 https://bit.ly/3isv90O
x86架構於1978年推出的Intel 8086中央處理器中首度出現,它是從Intel 8008處理器中發展而來的,而8008則是發展自Intel 4004的。8086在三年後為IBM PC所選用,之後x86便成為了個人電腦的標準平台,成為了歷來最成功的CPU架構。
其他公司也有製造x86架構的處理器,計有Cyrix(現為威盛電子所收購)、NEC集團、IBM、IDT以及Transmeta。Intel以外最成功的製造商為AMD,其早先產品Athlon系列處理器的市場份額僅次於Intel Pentium。
8086是16位元處理器;直到1985年32位元的80386的開發,這個架構都維持是16位元。接著一系列的處理器表示了32位元架構的細微改進,推出了數種的擴充,直到2003年AMD對於這個架構發展了64位元的擴充,並命名為AMD64。後來英特爾也推出了與之相容的處理器,並命名為Intel 64。兩者一般被統稱為x86-64或x64,開創了x86的64位元時代。
值得注意的是英特爾早在1990年代就與惠普合作提出了一種用在安騰系列處理器中的獨立的64位元架構,這種架構被稱為IA-64。IA-64是一種嶄新的系統,和x86架構完全沒有相似性;不應該把它與x86-64或x64弄混。
設計
x86架構是重要地可變指令長度的CISC(複雜指令集電腦,Complex Instruction Set Computer)。字組(word, 4位元組)長度的記憶體存取允許不對齊記憶體位址,字組是以低位位元組在前的順序儲存在記憶體中。向後相容性及Intel量產製程經常領先業界一直都是在x86架構的發展背後一股驅動力量(設計的需要決定了這項因素而常常導致批評,尤其是來自對手處理器的擁護者和理論界,他們對於一個被廣泛認為是落後設計的架構的持續成功感到不解)。但在較新的微架構中,x86處理器會將常用的x86指令盡全力以硬體線路執行,不常用者則轉換為更像RISC的微指令再予執行,從而獲得可與RISC比擬的超純量效能,而仍然保持向下相容。x86架構的處理器一共有四種執行模式,分別是真實模式,保護模式,系統管理模式以及虛擬V86模式。
在這篇簡短的文章中出現的指令和暫存器助憶符號的名稱,都在Intel檔案中有所指定以及使用在Intel組譯器(Assembler)中(和相容的,比如微軟的MASM、Borland的TASM、CAD-UL的as386等等)。一個以Intel語法指定的指令"mov al, 30h"與AT&T語法的"movb $0x30, %al"相當,都是會被轉譯為兩個位元組的機器碼"B0 30"(十六進制)。你可以發現在這段程式中的"mov"或"al",都是原來的Intel助憶符號。如果我們想要的話,我們可以寫一個組譯器由程式碼move immediate byte hexadecimally encoded 30 into low half of the first register(移動立即值位元十六進制編碼30到第一個暫存器的低半部位),來產生相同的機器碼。然而,傳統上組譯器(Assembler)一直使用Intel的助憶符號。
x86組合語言會在x86組合語言文章中有更詳細的討論。
運作模式
真實模式
在真實模式下,記憶體的存取是被區段開來。為了得到最後20位元的記憶體位址,要將區段的位址往左移動4位元,並且加上偏移的位址。因此,真實模式下總共可以定址的空間是220位元組,或者是1MB,於1979年是相當讓人印象深刻的象徵。在真實模式下有兩種定址模式:near和far。在far模式,區段跟偏移都需要被指定;在near模式,只需要偏移模式被指定,而記憶體區段是由適當的區段暫存器獲得。以資料而言是使用DS暫存器,程式碼是CS暫存器,堆疊是SS暫存器。舉個例子,如果DS是A000h且SI是5677h,DS:SI會指向記憶體的絕對位址DS × 16 + SI = A5677h
在這種架構下,兩對不同的區段/偏移可以指向一個相同的絕對位址。因此如果DS是A111h且SI是4567h,DS:SI會指向跟上一段相同的A5677h。除了異值同址重複性之外,這種架構無法同時一次擁有4個以上的區段。此外,CS、DS和SS是為了程式正確功能而必須的,因此僅僅只有ES可以被用來指向其他的地方。這種模式原本是為了與Intel 8085相容,導致程式設計師永無止盡的痛苦。
除了以上所說的,8086也擁有16-bit的32K(其變種 Intel 8088 是8-bit的64K)輸入輸出空間,以及一個由硬體支援的64K(一個區段)記憶體堆疊。只有words(2位元組)可以被推入到堆疊中。堆疊是由記憶體的上端往下成長,他的底端是由SS:SP指向。有256個中斷,可以由硬體或是軟體同時組成。中斷是可以串連在一起,使用堆疊來儲存返回被中斷的程式位址。
16位元保護模式
Intel 80286可以在不改變任何東西下,支援8086的真實模式16位元軟體,然而它也支援額外的工作模式稱為保護模式,可以將可定址的實體記憶體擴充到16MB,可定址的虛擬記憶體最大到1GB。這是使用節區暫存器來儲存在節區表格中的索引值。處理器中有兩個這樣的表格,分別為GDT和LDT,每一個可以儲存最多8192個節區的描述子,每一個節區可以給予最大到64KB的記憶體存取。節區表格提供一個24位元的基底位址(base address),可以用此基底位址增加想要的偏移量來創造出一個絕對位址。此外,每一個節區可以被賦予四種權限等級中的一種(稱為"rings")。
儘管這個推出的功能是一項進步,但是他們並沒有被廣泛地使用,因為保護模式的作業系統無法執行當時的真實模式軟體。這樣的能力只有在隨後80386處理器的虛擬86模式中出現。
在同時,作業系統比如OS/2嘗試使用類似桌球的方法,讓處理器在保護和真實模式間切換。這樣都會讓電腦變慢且不安全,像是在真實模式下的程式可以輕易地使電腦當機。OS/2也定義了限制性的程式設計規則允許"Family API"或"bound"程式可以在真實模式或保護模式下執行。然而這是給原本為保護模式下設計的程式有關,反之則不然。保護模式程式並不支援節區選擇子和實體記憶體之間的關係。有時候會錯誤地相信在16位元保護模式下執行真實模式的程式,導致IBM必須選擇使用Intel保留給BIOS的中斷呼叫。事實上這類的程式使用任意的選擇子數值和使用在上面提到的「節區運算」的方式有關。
這個問題也在Windows 3.x上出現。這個推出版本想要在16位元保護模式下執行程式,而先前的版本只能在真實模式下執行。理論上,如果Windows 1.x或2.x程式是寫得「適當」且避免使用節區運算的方式,它就有可能在真實和保護模式兩者下執行。Windows程式一般來說都會避免節區運算,這是因為Windows實作出軟體的虛擬記憶體方式,及當程式不執行時候,搬移記憶體中的程式碼和資料,所以操作絕對位址的方式是很危險的;當程式不執行時,被認為要保持記憶體區塊的「handles」,這樣的handles已經非常相當於保護模式的選擇子。在保護模式下的Windows 3.0執行一個舊的程式,會觸發一個警告對話盒,建議在真實模式下執行Windows(推測還是仍然可以使用擴充記憶體,可能是在80386機器用EMM386類比,因此它並不被局限於640KB)或是從廠商那更新到新的版本。好的行為之程式可能可以使用特別的工具來避免這樣的對話盒。不可能有些GUI程式在16位元保護模式下執行,且其它GUI程式在真實模式執行,可能是因為這會需要兩個分開的環境且會依於前面所提到的處理器在兩個模式間的桌球效應。從Windows 3.1版開始,真實模式就消失了。
32位元保護模式
Intel 80386推出後,也許是到目前為止x86架構的最大躍進。除了需要值得注意的Intel 80386SX是32位元架構但僅只有24位元定址(和16位元資料匯流排)。除此之外其他架構都是32位元 - 所有的暫存器、指令集、輸出輸入空間和記憶體定址。為了能夠在後者所說的功能工作,要使用32位元擴充的保護模式。然而不像286,386所有的區段可以使用32位元的偏移量,即使記憶體空間有使用區段,但也允許應用程式存取超過4GB空間而不需要區段的分隔。此外,32位元保護模式提供分頁的支援,是一種讓虛擬記憶體得以實現的機制。
沒有新的通用暫存器被加入。所有16位元的暫存器除了區段暫存器外都擴充為32位元。Intel在暫存器的助記符號上加入「E」來表示(因此擴充的AX變成EAX,SI變成ESI,依此類推)。因為有更多的暫存器數量、指令、和運算單元,因此機器碼的格式也被擴充。為了提供與先前的架構相容,包含執行碼的區段可以被標示為16或是32位元的指令集。此外,特殊的前置符號也可以用來在16位元的區段包含32位元的指令碼,反之亦然。
分頁跟區段的記憶體存取是為了支援現在多工作業系統所必須要的。Linux、386BSD、Windows NT和Windows 95都是一開始為386所發展,因為它是第一顆提供可靠地程式分離記憶體空間的支援(每個程式擁有自己的定址空間)以及可以在必要的情況下打斷他們程式的執行(使用ring,一種x86保護模式下權力分級的名稱)。這種386的基本架構變成未來所有x86系列發展的基礎。
Intel 80386數學輔助運算處理器也在整合到這個CPU之後的x86系列中,也就是Intel 80486。新的FPU可以幫助浮點數運算,對於科學計算和圖形設計是非常重要。
系統管理模式
Intel首次在80386SL將系統管理模式引入x86體系結構。
虛擬86模式
主條目:虛擬86模式
功能擴充
MMX
1996年Intel的MMX(AMD認為這是矩陣數學擴充Matrix Math Extensions的縮寫,但大多數時候都被當成Multi-Media Extension,而Intel從來沒有官方宣布過詞源)技術出現。儘管這項新的科技得到廣泛宣傳,但它的精髓是非常簡單的:MMX定義了八個64位元SIMD暫存器,與Intel Pentium處理器的FPU堆疊有相重疊。不幸的是,這些指令無法非常簡單地對應到由原來C編譯器所產生的指令碼中。MMX也只局限於整數的運算。這項技術的缺點導致MMX在它早期的存在有輕微的影響。現今,MMX通常是用在某些2D影片應用程式中。
3DNow!
1997年AMD推出3DNow!,是對於MMX的SIMD的浮點指令增強(針對相同的MMX暫存器)。儘管這些也沒有解決編譯器的難題,但這項技術的推出符合了PC上的3D休閒娛樂應用程式之崛起。3D遊戲開發者和3D繪圖硬體製造商在AMD的AMD K6和Athlon系列處理器上,使用3DNow!來幫助增加他們的效能。微軟後來也在其開發的Direct X7.0中加入針對3DNow!的最佳化,使當時的Athlon處理器在3D遊戲效能上首次全面超過對手英特爾的Pentium 3處理器。
SSE
在1999年Intel推出SSE指令集,增加了八個新的128-bit暫存器(不跟其他的暫存器重疊使用)。這些指令類似於AMD的3DNow!,主要是增加浮點數運算的SIMD指令。
SSE2
2001年英特爾推出SSE2指令集,增加了:
完整地補充了整數指令(與MMX相似)到原來的SSE暫存器。
64位元的SIMD浮點運算指令到原來的SSE暫存器。
第一個的增加導致MMX幾乎是過時可以捨棄的,第二個則允許這些指令可以讓傳統的編譯器現實地產生。
SSE3
於2004年隨著Pentium 4處理器的改版Prescott核心推出。SSE3增加特定的記憶體和thread-handling指令來提升Intel超執行緒的效能,在科學計算方面也有增強。
SSE4
2007年1月,Intel公開發表使用其45奈米製程"Penryn"晶片家族的PC和伺服器。"Penryn"是這一系列依據英代爾Core微架構之筆記型電腦、桌上型電腦和伺服器晶片家族的代號,首次正式發布時共有16款處理器,除了一款Intel Core 2 Extreme QX9650是針對普通桌上型電腦市場外,其餘的雙核Xeon 5200系列和四核5400系列都是伺服器處理器。基本上Penryn是繼Merom之後的縮小版Core 2 Duo,再加上47條新的SSE4指令集等額外配備。SSE4指令集之首次發表時間為2006年9月的英特爾開發者論壇(IDF,Intel Developer Forum)。
另外,x86處理器製造廠商AMD也在該公司K10架構的Phenom處理器中,加入4條新的SSE4A指令集。注意,SSE4與SSE4A無法彼此相容。
x86 - 維基百科,自由的百科全書 https://bit.ly/3isv90O
x86組譯指令lea,是Load Effective Address的縮寫,其優勢是:
LEA指令具有單時鐘周期,執行效率很高。
是CPU位址生成單元參與運算的,而不是ALU參與運算的,所以在管線上不會與上下文的算術邏輯指令產生流水相關
INTEL指令集中不存在很多RISC機器所具有的三運算元算術運算指令,比如像ARM的"add r0,r1,r2",而LEA指令恰好提供了同樣的功能,以類比「三元算術邏輯指令」。例如:lea ebx ,[eax+edx]
在組合語言程式設計中,在需要取得一個變數位址時,使用lea是很方便的。而mov指令則常常出錯,因為在微軟MASM組譯語法中,label和variable是不同的:addr不可前向參照,offset則能;addr可以處理局部變數而 offset則不能。
x86暫存器
16位元
自Intel 8086和8088起,有14個16位元暫存器。其中四個(AX, BX, CX, DX)是通用目的(儘管每個暫存器都有附加目的;舉個例子:只有CX可以被用來當作loop(迴圈)指令的計數器。)每個暫存器可以被當成兩個分開的位元組存取(因此BX的高位元可以被當成BH,低位元則可以當成BL)。除了這些暫存器,還有四個區段暫存器(CS、DS、SS、ES)。他們用來產生記憶體的絕對位址。還有兩個指標暫存器(SP是指向堆疊的底部,BP可以用來指向堆疊或記憶體的其它地方)。兩個指標暫存器(SI和DI)可以用來指向陣列的內部。最後,有旗標暫存器(包含狀態旗標比如進位、溢位、結果為零,等等)。以及IP是用來指向目前執行指令的位址。
32位元
自Intel 80386起,四個通用暫存器(EAX, EBX, ECX, EDX),它們較低的16位元分別與原本16位元的通用暫存器(AX, BX, CX, DX)重疊共享。指標暫存器(EIP, EBP, ESP, ESI, EDI)。區段暫存器除了原本的(CS、DS、SS、ES),另外新增(FS、GS),但是區段暫存器在32位元模式下改做為記憶體區塊的選擇子暫存器。旗標暫存器被擴展為32位元,較低的16位元與原本在16位元下的旗標暫存器重疊共享。
64位元
MMX暫存器(MM0~MM7),它們分別與浮點運算器〈FP0~FP7〉相重疊,所以MMX與浮點運算不可同時使用,必須透過切換選擇要使用哪一種。
AMD64
英特爾原本已經決定在64位元的世代推出新的架構IA-64技術的Itanium處理器產品線來接替取代x86,但它與x86的軟體天生不相容,因此藉以各種形式來執行x86的軟體,不過,效率十分低下,加之處理器本身和軟體移植的成本難以控制,因此這個計畫最終告吹。
AMD自行把32位元x86(或稱為IA-32)拓展為64位元,並命名為x86-64或Hammer架構,而後更名為AMD64架構,並曾禁止使用之前的名字來稱呼這一架構[1]。以這個技術為基礎的第一個產品是單核心的Opteron和Athlon 64處理器家族。由於AMD的64位元處理器產品線首先進入市場,且微軟也不願意為英代爾代號為Yamhill的64位元版x86處理器開發第三個不同的64位元作業系統,英代爾被迫採納AMD64架構且增加某些新的擴充到他們自己的產品,命名為EM64T架構(顯然他們不想承認這些指令集是來自它的主要對手),EM64T後來被英代爾正式更名為Intel 64。
這個架構也被稱為 64位元拓展架構,即x64,譬如四個通用暫存器(RAX, RBX, RCX, RDX)是由32位元的(EAX, EBX, ECX, EDX)64位元擴展而來,相應的還有 指標暫存器(RIP, RBP, RSP, RSI, RDI),以及增加八個通用暫存器(R8~R15)等等。 這些資源只可在x64處理器的64位元模式下使用,在用來支援x86軟體的遺留模式和相容模式中是不可見的。
128位元
自SSE起,SIMD的暫存器XMM0 - XMM15.
256位元
SIMD registers YMM0 - YMM15.
512位元
SIMD registers ZMM0 - ZMM31.
指令字首
分為4組,每組用1個位元組編碼。每組在指令中至多指定1個字首值。4組的順序可以任意。
第1組鎖與重複(Lock and repeat)
鎖(LOCK)編碼為:F0H。用於互斥存取共享記憶體的操作。
非零時重複(REPNE/REPNZ)編碼為:F2H。用於字串操作指令。
為零時重複(REP/REPE/REPZ)編碼為:F3H。用於字串操作指令。
第2組
段覆蓋(Segment override):CS、SS、DS、ES、FS、GS的段覆蓋字首的編碼分別是2EH、36H、3EH、26H、64H、65H.
分支提示(Branch hints),用於條件分支指令Jcc。提示分支不發生編碼為2EH;提示分支發生編碼為3EH。
第3組運算元長度覆蓋(Operand-size override)編碼為66H。用於在16位元與32位元運算元切換。
第4組位址長度覆蓋(Address-size override)編碼為67H.用於在16位元與32位元位址切換。
指令碼
長度為1、2或3位元組,此外ModR/M中還可能有3位。對於雙位元組指令碼或三位元組指令碼,其中的第1個位元組為0FH,用於與指令字首區分。
ModR/M與SIB
許多指令的記憶體運算元需要使用ModR/M位元組作為定址模式說明符。其中的mod與r/m組合,共有32個值,表示8個暫存器與24種定址模式。reg/opcode表示暫存器號或者額外的3位指令碼,其具體含義依賴基本指令碼。Mod與R/M的5位表示的第一運算元(源與目的運算元中定址方式更複雜的那個運算元,指令碼中的「方向位」direction bit(d)給出源或目的運算元哪個是第一運算元)的定址方式如下 x86 - 維基百科,自由的百科全書
x86 - 維基百科,自由的百科全書 https://bit.ly/3isv90O


ARM架構處理器的由來與優勢:從智慧型手機到超級電腦
二月 11,2022ARM架構處理器的由來與優勢:從智慧型手機到超級電腦 - GIGABYTE 技嘉科技 https://bit.ly/3Umi6LT
ARM架構處理器是主流x86處理器架構以外的不同選擇,原本在行動裝置上穩居市占龍頭,如今,也逐漸在伺服器和資料中心產品中出現。技嘉科技是高性能伺服器產品的知名品牌,發表本篇《科技指南》文章,回顧ARM處理器的發展過程,介紹ARM產品的優勢與特性,並且推薦適用於不同領域的技嘉科技伺服器解決方案,協助您解決在工作上可能遇到的問題。
行動通訊技術快速發展,智慧型手機已成為生活中不可或缺的一部分,而行動裝置廣泛使用的「ARM處理器」,也逐漸跨入伺服器解決方案領域。舉例來說,聞名全球的「富岳」超級電腦,正是以ARM技術架構為基礎。即使ARM是好幾十年前就問世的產物,如果至今您還沒有機會進一步了解,這是很好的機會,一次弄清楚ARM的由來與優勢。
時光倒轉到1981年12月1日,英國廣播公司(BBC)推出BBC Micro家用電腦,早已消失在歷史洪流中的這台微型電腦,當時由艾康電腦公司(Acorn Computers)設計生產。1985年,艾康電腦開發出「ARM1」處理器,當時ARM是Acorn RISC Machine的縮寫,日後又改為Advanced RISC Machines的縮寫。由於ARM1和其所延伸出來的處理器產品(俗稱ARM處理器)採用RISC精簡指令集設計架構,ARM處理器的最大優勢,正是卓越的能源效率和更低的總體擁有成本(TCO)。回到現在,ARM處理器已經擺脫微型電腦,成為行動裝置普遍採用的電腦晶片,應該一點也不令人意外。《詞彙學習:常聽別人說精簡指令集電腦RISC,你知道那是什麼嗎?》
過去十多年來,ARM處理器成為高效能運算(HPC)與雲端資料中心的秘密武器。2014年,日本理化學研究所攜手富士通,宣布開發「京」超級電腦的後繼機型,轉向著手研發A64FX高效能運算專用的ARM處理器,新的超級電腦命名為「富岳」,在2020年6月奪下超級電腦TOP500排名首位。由此可見,ARM處理器與HPC、雲端運算等先進技術應用完美接軌,提供突破性的運算威力
技嘉科技憑藉著在伺服器市場長年深耕的產品應用經驗和堅強的研發實力,在既有的x86架構伺服器產品線之外,從2013年開始投入ARM伺服器研發,並攜手ARM處理器業界領袖安培運算(Ampere Computing),推出一系列支援Ampere® Altra®與Ampere® Altra® Max的伺服器解決方案。ARM處理器的眾多優點,包括大量核心數大幅提升效能,低功耗與低廢熱特性,及絕佳的TCO,再加上ARM的雲端原生屬性,使得ARM處理器不但適合行動裝置,也將是雲端運算、邊緣運算和AI人工智慧應用的最佳助手。
接下來的章節中,我們將簡單介紹ARM處理器的發展過程,並列出ARM產品的具體優勢,以及技嘉科技的全系列ARM伺服器產品,協助您做決定,是否在您的工作上適合使用ARM伺服器?
ARM:精簡指令集設計架構處理器的佼佼者
您知道嗎?人類透過相同的「語言」互相溝通,電腦亦同。
我們常聽到,現在主導伺服器與個人電腦的處理器架構叫做「x86」;所謂的「架構」,指的是「指令集架構(ISA)」,就是電腦最基本的語言,攸關所有程式設計,及電腦如何執行所接收的命令。不同公司推出的處理器產品,可能採用不同或相同的指令集架構,例如AMD和Intel都採用主流x86架構,也就是說,Intel系統能執行的作業系統或軟體,同樣能在AMD系統上執行。
一般來說,指令集架構可分類成早期的複雜指令集(CISC),包含x86;以及後期的精簡指令集,其中最顯眼的代表莫過於ARM。《詞彙學習:常聽別人說複雜指令集電腦CISC,你知道那是什麼嗎?》
起源於1950到1970年代的複雜指令集,那時人們希望透過功能強大、一次可以做很多事情的指令,來降低使用組合語言進行軟體開發的成本,並節約珍貴的記憶體容量,因此,衍生了極度複雜的指令編碼長度、多樣化的資料定址模式和數量不足的資料暫存器。精簡指令集的誕生,萌芽於1980年代,人們開始重視處理器的效能與成本,因半導體製程的進步而容量逐漸充沛的記憶體,進一步推進高階程式語言編譯器的急速發展。
在這樣的背景下,艾康電腦創造了低耗能、生產成本低的ARM處理器,是這票精簡指令集風潮中的一員,而且時間證明,是其中最重要者。從1985年第一顆ARM1問世,到2021年的36年當中,全世界累積生產超過兩千億顆ARM處理器,超過所有其他處理器架構加起來的總和,這也讓ARM穩坐最普及指令集架構的寶座。
留意科技新聞的您,可能有注意到ARM的精采故事還在進行中。2016年,日本軟銀集團收購發展ARM相關技術的安謀控股(ARM Ltd.)。2020年9月,領導繪圖技術與人工智慧發展的GPU巨頭輝達Nvidia,宣布將以四百億美元的天價,從軟銀手上買下ARM,引起宣然大波,更引發各國政府監管機構的調查;最新消息報導,收購案宣布破局,安謀可能公開上市,這足以證明ARM帶給資訊產業界的驚人價值。《詞彙學習:花你一分鐘,一次看懂關於GPU圖形處理器》
ARM處理器的獨特性與優點
在電腦工業歷史上出現過的精簡指令集有如過江之鯽,但為何ARM能如此獨樹一幟?進而成為現今最成功的指令集架構?ARM成為最常見的處理器類型,在人類生活中無所不在,背後的成功因素,不外乎是以下這四個原因:
● 更多核心數、效能功耗比更佳
處理器的核心數,不完全取決於所採用的指令集架構;不過,主流x86處理器搭載的核心,大多是設計較為複雜、數量較少的核心。ARM處理器的特色是,一顆處理器包含很多設計較為簡單的核心,例如一顆Ampere® Altra® Max CPU,最多可容納高達128顆核心。把運算工作分配給許多核心來處理,比把所有工作都交付給同樣幾顆處理器來得更有效率,也因此,ARM處理器每顆核心提供絕佳的效能功耗比(performance per watt)。
● 超高能源效率,解決散熱問題
一般而言,精簡指令集的能源效率優於複雜指令集,因為所採用的簡單指令,都可在一個時脈週期內完成。這表示晶片可使用較少量的電晶體,無須耗費大量電路去實做複雜的處理器控制單元或彌補不利於指令管線化與平行化的缺陷,可盡其所能地將電晶體「預算」砸在提升效能的刀口上。因此,ARM處理器的能源效率超高,所產出的廢熱也相對比較低,這對於行動裝置很重要,因為可提升續航力,放在口袋內的裝備當然也不能太燙!這些特性對伺服器也很有幫助,因為有效排除廢熱,可提升伺服器的效能與穩定性。
以上這四個特色,是ARM處理器穩坐最普及指令集架構寶座的原因。原先只有智慧型手機、平板電腦等行動裝置受惠於ARM,如今資料中心的伺服器產品也開始導入ARM處理器,甚至有超級電腦使用ARM打破世界紀錄。
● 降低總體擁有成本,提高投報率
使用精簡指令集的ARM處理器,本身設計和製造方面較為便宜,因此深受廉價行動裝置所青睞。能源效率高、容易散熱等特性,也有助於降低使用ARM的總體擁有成本,尤其在用電量較高的伺服器機房或伺服器農場,如果改用ARM伺服器,也許可以降低營運成本。
● 雲端原生特性
近年來,ARM處理器特別強調這個賣點,因為ARM長期被行動與邊緣運算裝置所使用,因此非常適合在雲端運算環境中使用。如今,有越來越多邊緣裝置和雲端的伺服器連線,如果伺服器同樣採用ARM指令集架構,將有助於降低裝置與裝置間溝通的延遲。因此我們看到,雖然x86架構並未從個人電腦與伺服器領域跨入行動裝置的領域,ARM卻成功採取「農村包圍城市」策略,從行動裝置反撲資料中心,如今已成為很有競爭力的另類選項。
適用雲端與邊緣的ARM架構伺服器與x86高度互補
介紹技嘉科技的ARM架構伺服器產品線之前,先討論一下「ARM vs. x86」這個議題。前面提到,今日主導企業IT架構與資料中心的x86伺服器,受益於Intel和AMD兩家公司在個人電腦市場的長期投入,其強項在於可縮短服務反應時間和密集資料處理的優異單執行緒效能,累積數十年的完整軟體生態系統,及適用於各類應用場域的通用特性。
不過,從雲端到邊緣,都充滿了ARM架構伺服器大顯身手的發揮空間。對於講究核心數量、能源效率及可擴充性的領域,ARM伺服器可說是掌握主場,例如在5G、AI和深度學習等方面的應用。ARM軟體生態系目前可能落後x86,但已經在逐步建立當中,而在嶄新開發、尚未建構生態系的新領域,ARM在這方面可能不足之處,也較不構成問題。
挑選技嘉科技ARM伺服器,部署嶄新應用領域
技嘉科技長期跟隨技術脈動,早在2013年開始投入ARM伺服器解決方案的技術研發,當時64位元版本的AArch64(或稱ARM64)剛問世不久,提供超越傳統32位元版本的運算效能。過去幾年,技嘉科技和其他ARM技術研發者建立良好的合作關係,更是在2019年,協助安培運算建立「雪山」平台(Mt. Snow)的CRB (Customer Reference Board),這是一台單插槽機架式伺服器,搭載含有八十顆64位元核心的單顆Ampere® Altra®處理器。技嘉長年建造ARM架構伺服器,並可利用所累積的經驗,依照不同使用情境迅速調整內部的零組件組合,發表全新伺服器款型,滿足不同垂直領域的應用需求。
2021年,技嘉科技發表超過十款ARM伺服器產品,可處理例行運算工作、講究圖形處理器GPU效能的工作負載、HPC叢集和超融合基礎架構(HCI)的應用,以及邊緣運算工作。如果看到這邊,您對於ARM感到興趣,想知道這些高效能、低TCO、能源效率佳、雲端原生的處理器能如何幫助您的工作,只要衡量您較常處理哪些運算工作,就能挑出最適合您的技嘉ARM架構伺服器。《詞彙學習:常聽別人說超融合基礎架構,你知道那是什麼嗎?》
無論您較常處理邊緣運算、高密度運算、GPU運算或是一般例行運算工作,技嘉科技都有提供適合您的伺服器產品,將ARM處理器的眾多優勢與技嘉長年累積的伺服器科技研發經驗結合,保證滿足您的工作需求。
● R系列機架式伺服器
技嘉R系列機架式伺服器是資料中心的通才,適合各種不同需求,可用來達成效能、可靠性與彈性之間的理想平衡。搭載ARM處理器的R152-P30、R152-P31和R152-P32伺服器產品,符合1U(一個機架單位)的機殼規格,R272-P30、R272-P31、R272-P32和R272-P33則符合2U機身規格。這些產品皆搭載單顆Ampere® Altra®處理器,提供十六條DIMM、兩條Gen4 M.2插槽、兩條1GbE LAN、專屬管理通訊埠,及PCIe Gen4擴充插槽。
● G系列GPU協同運算伺服器
透過GPGPU加速卡,能輕鬆處理經優化的分散式運算工作,技嘉G系列GPU協同運算伺服器是這方面的專家,搭載ARM處理器的款型包括G242-P31、G242-P32、G242-P33及G242-P34,透過異質運算,讓中央處理器和圖形處理器達成綜效。以G242-P31這款產品為例,2U機身內可容納高達四張NVIDIA ® A100 PCIe Gen4加速卡,還有一雙80+ Platinum 1600W (240V)電源供應器。G242-P32這款產品則是由輝達指定使用,包裝在NVIDIA Arm HPC Developer Kit解決方案當中。
● H系列高密度伺服器
H262-P60是搭載ARM處理器的高密度伺服器,2U機身內含四個不同節點,支援高達八顆處理器。單一節點支援十六組DDR4記憶體插槽,傳輸速度最高達 3200MHz,此外還提供六組2.5吋SATA硬碟槽、一組M.2插槽、兩組半高半長插槽、一組OCP 3.0插槽、雙1GbE LAN連接埠,以及一組網路管理連接埠。系統內搭載機箱管理控制器(CMC),整合每個節點遠端管理晶片的資訊,實現機箱系統層級的管理與節點監控。H262-P60的額外特色,就是可搭載安培運算新推出的Ampere® Altra® Max處理器,單顆CPU容納高達128顆核心。
● E系列邊緣運算伺服器
技嘉E252-P30、E252-P31兩款產品,將ARM處理器的特殊優勢導入先進的邊緣運算領域。秘訣在於,這些伺服器的機身更輕巧短小,2U機殼經過改良,機身寬與高維持標準的439 x 86公厘,但長度從標準的660公厘以上,縮減到只有449公厘,同時保持技嘉一貫的高效能運算表現、平衡系統配置,及佳化的散熱效果。前置式I/O設計便於在狹小空間內保養與維修,機身各處有許多免工具的貼心設計,可輕鬆安裝及維護。
了解更多:
《關於技嘉邊緣運算伺服器產品的更多介紹》
《北流、工研院和NVIDIA指定採用的技嘉5G邊緣運算解決方案》
技嘉科技推出搭載Ampere® Altra®、Ampere® Altra® Max處理器的ARM伺服器產品,將ARM的獨特優勢導入機房和資料中心。提供多元化的伺服器解決方案,讓客人能依照實際需求來做挑選,符合技嘉科技「創新科技,美化人生」的企業宗旨。我們希望本篇《科技指南》有助於說明ARM的由來、ARM產品的特色,以及您能如何受惠於搭載ARM的伺服器解決方案。如果希望進一步了解ARM,歡迎透過server.grp@GIGABYTE.com電子信箱聯絡技嘉科技業務窗口,我們將協助您挑選適合您的ARM解決方案。ARM架構處理器的由來與優勢:從智慧型手機到超級電腦 - GIGABYTE 技嘉科技 https://bit.ly/3Umi6LT


最快2021年底、2022年初採用Armv9架構的處理器就會進入市場-違10年,ARM於本週發表新一代處理器架構「Armv9」在稱霸行動晶片領域後,這間IC設計公司如今正劍指Intel,進軍過往這間晶片巨頭雄踞的伺服器市場。
ARM十年最大技術革新!新一代處理器架構Armv9劍指英特爾,看上哪兩塊大餅? https://bit.ly/3ENZUVL
這次新推出的晶片架構,被外界稱為是ARM近10年最重大的技術革新。這個新架構著重在強化資安防護,以及AI運算能力上,並聲稱能夠提升下兩代行動晶片及伺服器處理器約30%的效能。
被譽為近10年最大技術革新,ARM新架構看上伺服器市場
目前ARM在行動晶片領域,擁有超過90%的市占率,但電腦處理器領域卻仍是x86架構的天下包括Intel及AMD兩大廠商的處理器都是使用x86架構,尤其伺服器市場超過9成都採用Intel的產品。
然而x86架構在處理器的穩固地位,似乎正漸漸鬆動。去年蘋果便捨棄Intel處理器,宣佈Mac系列產品將全面改用自研的ARM架構晶片,並推出Apple M1晶片,M1便是採用ARM的Armv8指令集架構。
ARM已經稱霸行動晶片領域,而藉由新推出的晶片架構,也將進一步踏入過往Intel雄踞的伺服器市場。
去年還有消息指出,AMD重啟擱置6年的「K12處理器」計畫,這是他們第一款自研的ARM架構處理器。
去年底,微軟也傳出祕密研發ARM架構晶片的風聲,預計將用於Azure雲端服務資料中心的處理器上。事實上在更早以前,身為雲端龍頭的亞馬遜就已開始投入自研ARM架構晶片。
新架構著重資安、AI運算,物聯網未來將跟手機一樣普及
不過ARM強調,他們推出Armv9架構放眼的是更寬廣的物聯網市場,期望這項技術能夠加速物聯網運算技術的普及,成為像當今智慧型手機一樣普遍的存在。
來源:MyCreative via shutterstock
ARM相信IoT技術將在未來變得更為普及,Armv9架構也將成為智慧家庭、物聯網產品的解決方案。
過去5年裡,全球出貨的ARM架構晶片總數超過5億,不過ARM相信,在合作夥伴的同心協力下,未來10年內出貨的ARM架構晶片總數將突破10億以上。
ARM執行長西蒙.西格斯(Simon Segars)指出,未來將被AI所定義,在這之前他們必須先在運算能力上打好基礎,好面對即將到來的挑戰。
當運算無所不在時,如何妥善保存數據、防範網路攻擊變得舉足輕重,Armv9因此加入了全新的機密運算架構(Confidential Compute Architecture),並讓開發者能夠建立「領域(realms)」,將敏感數據與操作系統等其餘部份隔開,只有在領域管理器(realm manager)才能查看內部資料,以防系統受到入侵導致資料外洩。
ARM還著重強化新架構的AI運算能力,相信將可以成為物聯網、智慧家庭等需求的解決方案。雖然市面上早已存在不少專門的AI晶片,但在實際應用上將較小規模的運算交給CPU處理往往是更好的選擇。
ARM首席架構師理查.葛瑞森斯威特(Richard Grisenthwaite)指出,「我們認為機器學習未來將無所不在,會在專用處理器、神經處理以及我們的處理器中執行。」
鴻海技術長魏國章表示,Armv9架構對他們正在推行的MIH電動車開放平台也將帶來更優秀的表現與安全性,使電動化交通能有著更進一步的改變。聯發科技術長周漁君也指出,Armv9架構對他們開發下一代天璣晶片也能帶來相當助益。
外界預測最快2021年底、2022年初採用Armv9架構的處理器就會進入市場,屆時是否能動撼動Intel在處理器市場的地位,就讓我們拭目以待。ARM十年最大技術革新!新一代處理器架構Armv9劍指英特爾,看上哪兩塊大餅? https://bit.ly/3ENZUVL


《The Information》網站引述市調機構首席分析師迪恩·麥卡倫(Dean McCarron)數據指出,採用Arm架構處理器的電腦,在整體PC市佔在不到一年時間從原本2%增加至8%,主要受惠於蘋果將Mac機種從Intel處理器更換為Arm架構設計。
蘋果和AMD靠Arm架構搶市佔、昔日盟友微軟也變心!Intel處理器面臨更多挑戰 https://bit.ly/3iq8frc
麥卡倫表示,採Arm架構設計M1處理器的Mac機種上市前,以Arm架構打造的PC市佔比例僅為2%,卻在今年第二季增加至7%,更在第三季增加至8%,顯示蘋果將Mac處理器更換為Arm架構設計,進而影響原本以x86架構處理器為主的PC市場佔比。
市場普遍認為,換成Arm架構設計的Mac,不僅維持原本使用體驗,同時整體運算效能也並未降低,甚至能與Intel高階規格處理器看齊,而整體電力使用時間更比原本使用Intel處理器時足足提昇兩倍以上,加上原本就採簡約、容易使用特性,因此短時間也吸引不少人加入使用。
除了推出鎖定一般大眾使用需求的13.3吋MacBook Air與MacBook Pro,蘋果更接著推出全新設計的iMac,並且針對專業用戶需求推出全新14吋與16吋設計,更重新加入MagSafe磁吸充電介面、SD記憶卡讀卡機與HDMI輸出的新款MacBook Pro,使得轉換為Arm架構處理器後的產品布局可以滿足市場各類需求。
事實上不僅蘋果轉向Arm架構,微軟也從Windows 10開始更積極擁抱Arm架構,並且與高通合作推出多款Arm架構筆電,甚至在Windows 11更原生支援Arm架構運作,使得Arm架構PC產品市佔比例因此增加,相對也讓Intel處理器在市場應用佔比也受到影響。
此外,AMD近年推出的Ryzen系列處理器也開始佔據Intel的市佔,包含過去以採用Intel處理器為主的遊戲PC,目前也有越來越多比例改採AMD處理器,讓Intel不僅面臨Arm架構處理器搶奪市佔,在x86架構處理器也必須提防AMD蟬食鯨吞。
蘋果和AMD靠Arm架構搶市佔、昔日盟友微軟也變心!Intel處理器面臨更多挑戰 https://bit.ly/3iq8frc
------------------------------------
Arm CPU 架構 – Arm® https://bit.ly/3UgL0wJ
違10年,ARM於本週發表新一代處理器架構「Armv9」,在稱霸行動晶片領域後,這間IC設計公司如今正劍指Intel,進軍過往這間晶片巨頭雄踞的伺服器市場。
ARM十年最大技術革新!新一代處理器架構Armv9劍指英特爾,看上哪兩塊大餅? https://bit.ly/3ENZUVL
這次新推出的晶片架構,被外界稱為是ARM近10年最重大的技術革新。這個新架構著重在強化資安防護,以及AI運算能力上,並聲稱能夠提升下兩代行動晶片及伺服器處理器約30%的效能。
被譽為近10年最大技術革新,ARM新架構看上伺服器市場
前ARM在行動晶片領域,擁有超過90%的市占率,但電腦處理器領域卻仍是x86架構的天下,包括Intel及AMD兩大廠商的處理器都是使用x86架構,尤其伺服器市場超過9成都採用Intel的產品。
然而x86架構在處理器的穩固地位,似乎正漸漸鬆動。去年蘋果便捨棄Intel處理器,宣佈Mac系列產品將全面改用自研的ARM架構晶片,並推出Apple M1晶片,M1便是採用ARM的Armv8指令集架構。
來源:Shutterstock
ARM已經稱霸行動晶片領域,而藉由新推出的晶片架構,也將進一步踏入過往Intel雄踞的伺服器市場。
去年還有消息指出,AMD重啟擱置6年的「K12處理器」計畫,這是他們第一款自研的ARM架構處理器。
去年底,微軟也傳出祕密研發ARM架構晶片的風聲,預計將用於Azure雲端服務資料中心的處理器上。事實上在更早以前,身為雲端龍頭的亞馬遜就已開始投入自研ARM架構晶片。
新架構著重資安、AI運算,物聯網未來將跟手機一樣普及
不過ARM強調,他們推出Armv9架構放眼的是更寬廣的物聯網市場,期望這項技術能夠加速物聯網運算技術的普及,成為像當今智慧型手機一樣普遍的存在。
來源:MyCreative via shutterstock
ARM相信IoT技術將在未來變得更為普及,Armv9架構也將成為智慧家庭、物聯網產品的解決方案。
過去5年裡,全球出貨的ARM架構晶片總數超過5億,不過ARM相信,在合作夥伴的同心協力下,未來10年內出貨的ARM架構晶片總數將突破10億以上。
ARM執行長西蒙.西格斯(Simon Segars)指出,未來將被AI所定義,在這之前他們必須先在運算能力上打好基礎,好面對即將到來的挑戰。
當運算無所不在時,如何妥善保存數據、防範網路攻擊變得舉足輕重,Armv9因此加入了全新的機密運算架構(Confidential Compute Architecture),並讓開發者能夠建立「領域(realms)」,將敏感數據與操作系統等其餘部份隔開,只有在領域管理器(realm manager)才能查看內部資料,以防系統受到入侵導致資料外洩。
ARM還著重強化新架構的AI運算能力,相信將可以成為物聯網、智慧家庭等需求的解決方案。雖然市面上早已存在不少專門的AI晶片,但在實際應用上將較小規模的運算交給CPU處理往往是更好的選擇。
ARM首席架構師理查.葛瑞森斯威特(Richard Grisenthwaite)指出,「我們認為機器學習未來將無所不在,會在專用處理器、神經處理以及我們的處理器中執行。」
鴻海技術長魏國章表示,Armv9架構對他們正在推行的MIH電動車開放平台也將帶來更優秀的表現與安全性,使電動化交通能有著更進一步的改變。聯發科技術長周漁君也指出,Armv9架構對他們開發下一代天璣晶片也能帶來相當助益。
外界預測最快2021年底、2022年初採用Armv9架構的處理器就會進入市場,屆時是否能動撼動Intel在處理器市場的地位,就讓我們拭目以待。ARM十年最大技術革新!新一代處理器架構Armv9劍指英特爾,看上哪兩塊大餅? https://bit.ly/3ENZUVL


iT 邦幫忙::一起幫忙解決難題,拯救 IT 人的一天


cpu 的架構是指什麼?
cpu 是電腦作爲邏輯處理的重要核心,而我們會需要特殊的語言與 cpu 對話,當我們對 cpu 下命令時,這些命令會先儲存到記憶體裡面,然後讓 cpu 執行各種我們想要的各種運算,而如果每次都需要完整的指示 cpu, 會消耗非常多的記憶體,因此誕生出了一個概念「指令集」,指令集的概念就是把各種常用的指令先納入 cpu 的設計當中,當程式要使用指令時只要給代號不需要給完整的程式碼就可以達到想要的效果
而指令集內含越多的的指令,他就能夠更省 cpu 的記憶體,也更能透過優化本身的指令集達到效能提升的效果,但這確會增加 cpu 的複雜度與耗電量,因為 cpu 的會需要更多的額外設計符合指令集的需求,因此這就延伸了兩大派設計,複雜指令集(Complex Instruction Set Computer;縮寫:CISC) 與 精簡指令集(reduced instruction set computer,縮寫:RISC),這兩者最大的差異就是指令集的複雜度與每個指令的長度複雜指令集意味著含有豐富的的指令,可以享有 cpu 內指令的高度優化,因此一般來說會比精簡指令集的效能更強與更加耗能,也是目前主流桌上型電腦與筆記型電腦的架構,而精簡指令集著重在基本的操作與盡可能用最少的執行時間執行每一條命令,而也因為精簡指令集的 cpu 設計上精簡,因此具有比複雜指令集省電的特性,而由於指令集較少,因此效能通常較複雜指令集來的低下
那 arm 與 x86 各是哪種指令集?
arm
他屬於精簡指令集,具有省電特性也在時代不斷進步下,內建了各種常用功能的晶片來作硬體解碼增加效能,由於性能不斷提升,與各大 os 與應用程式不斷地針對 arm 進行優化,因此逐漸威脅到複雜指令集的市場
x86
他屬於複雜指令集,具有高效能但也具備較高功耗比,發熱量較高與較低的續航力,近幾年沒有特別的發展,逐漸被 arm 這類型的精簡指令集取代
總結
複雜指令集與精簡指令集各有優缺點,但在精簡指令集不斷進步與硬體整合並且深度在軟體的整合下逐漸在效能與能耗下追趕上複雜指令集,蔚為趨勢iT 邦幫忙::一起幫忙解決難題,拯救 IT 人的一天 https://bit.ly/3H0wIh0


ARM 即將吞噬一切? | TechNews 科技新報 https://bit.ly/3AY0wXQ
「行動網路的流量紅利枯竭」,是近幾年經常被討論的話題。大意是指如今很難有一款產品能輕鬆利用行動網路的特性,低成本達到用戶指數級增長。這個觀點可能已經被業務陷入困境的網路公司們證明是對的,但它卻也在局限著人們對行動化的想像──流量可不是「行動網路」的全部。
相反的,其實在整個網路世界更為底層的硬體和基礎設施層面,行動網路的威力才剛剛彰顯。而這比流量的去向重要多了。
只要看看ARM如今的得勢就知道。這是一個最有代表性的從行動領域誕生的技術「流派」,今天已經正式開始「反噬」PC領域。
蠢蠢欲動
在PC領域,除了獨樹一幟的蘋果Mac,很少有競爭者能夠衝擊到已穩固數十年的x86+Windows系統。蘋果從去年開始逐漸將Mac的處理器晶片轉為ARM架構,這使得ARM在PC端的晶片占比突飛猛進,到今年第三季ARM已占據8%的PC端晶片占比,而在蘋果M1上市之前,這個數字僅為2%。
雖然這歸功於蘋果的號召力,但ARM正在侵蝕傳統PC領域(x86+Windows系統)的市場卻是不爭的事實。要知道ARM起勢於以智慧手機為代表的行動網路時代,蘋果、三星、高通、華為的行動設備晶片大多採用ARM架構,ARM可謂一統行動半導體IP市場。
ARM在行動端初獲成功後,也一直想開拓其他市場,而PC時代的霸主英特爾對行動市場同樣有想法。但不管是英特爾早年的StrongARM、XScale、Atom,還是ARM與微軟、Google在輕薄本上的嘗試,雙方雖在彼此地盤各有試探,卻都不算成功。因此,人們通常認為以英特爾為代表的x86和ARM僅在各自領域更有優勢。
但如今,事情發生了變化。
蘋果只是最容易被關注的那個。其他行動設備晶片廠商也開始對ARM+PC這塊蛋糕蠢蠢欲動,背後一個重要原因在於,高通與微軟之間用於Windows的特殊協議或許即將到期,這意味著在手機晶片領域頗具實力的三星、聯發科、華為等廠商具備了挑戰x86+Windows的可能。
高通與微軟的特殊協議何時到期將成為變局關鍵。今年9月,微軟曾表示蘋果M1晶片的電腦不能搭載Windows 11系統,只有高通旗下的ARM架構晶片才能對Windows系統提供原生支持。這雖然不是一個十分普遍的需求,但無疑也給不少用戶澆了一盆冷水。蘋果基於ARM架構的M1晶片電腦雖然性能強勁,但在相容性上仍需優化,不少x86+Windows用戶不使用Mac的原因或是不習慣Mac的系統,或是Windows環境下一些必不可少的商業軟體無法在Mac上使用。
這對於Mac似乎問題不大,但這種排他性展露無遺,而它對其他想開拓傳統PC處理器晶片市場的廠商來說,則是決定性的。即便「AMD Yes」也只能是在過去x86的遺產上來搶奪PC處理器晶片市場,既不依靠x86架構,也不使用Windows系統,來打造又一個如蘋果一樣受市場歡迎的品牌無疑是太難太難。
它們需要等待一個裂縫。因此,當國外媒體XDA-Developers在近日透露,高通與微軟在Windows on ARM上的合作排他協議或即將到期時,聯發科在發表4nm的天璣9000系列處理器之前,就已迫不及待的表示,將進軍Windows on ARM市場,甚至三星及其Exynos處理器的PC也將在市面上出現。
當Windows生態和晶片架構的底層優化沒有了使用差異後,PC晶片市場上面臨的就是真槍實劍的效能、功耗、發熱等綜合性能的硬戰。x86架構和ARM架構孰優孰劣、誰將一統市場行業內也是爭議不斷,這其中既涉及底層RISC指令集和CISC指令集方面的技術差異,也涉及伺服器、PC和智慧行動設備的不同使用場景,需要設計者在晶片性能、功效、能耗和應用場景上做出選擇。
技術在晶片市場重要,但已不是唯一衡量標準。隨著技術的進一步發展,不管是ARM還是x86,都在逐漸補齊各自的短板,不再僅採取RISC和CISC中某一種指令集,而是變成RISC和CISC你中有我、我中有你,可以說標著RISC、CISC的CPU們,很難僅透過架構來決定其優劣。
算力也青睞「流量」
最直接的爭奪即將展開,而競爭的天秤似乎早已開始傾斜。
在這場競爭中,舊體係依賴著過往的強勢以及合縱連橫形成的技術優勢,在範式轉移中顯得似乎沒那麼牢靠,反而,ARM背後聚集的一票行動市場玩家,在行動網路普及之中卻積攢了關鍵的資源。
比如在晶片產能分配上的話語權。
未來真正決定處理器們算力的關鍵變成了是否採用最新製程和各晶片設計中的微架構。晶片的先進製程很好理解,雖然晶片性能並不是簡單的晶片製程越小性能越強,但在功耗、發熱、面積、價格等多因素綜合考慮來看,可以簡單理解為10nm製程的晶片就是很難超過5nm。
晶片設計中的微架構同樣重要,例如即便是同樣是採用7nm製程、ARM架構,台積電代工的蘋果A13晶片和高通驍龍865晶片,它們的處理器單核、多核跑分性能均有差異,其原因就在於不同公司設計的晶片微架構也有高下之分。
因此,簡單來看,決定各廠商晶片算力強弱的關鍵在於是否搶占到了三星、台積電有限的先進產能和自身晶片設計實力,因為三星和台積電是唯一有能力生產5nm先進製程的晶片廠商。
現實是,行動市場中更有優勢的公司在晶片代工產業鏈中聲量更大,蘋果和高通分別包攬了台積電和三星的優先產能(當然包括三星自家產品),英特爾也意識到了這個問題,提出了IDM 2.0計畫,將不再與自家工廠作對,委託台積電製造先進製程,有媒體爆料英特爾的14代酷睿或將採用台積電的3nm製程。
三星、台積電先進製程的晶片優先供給誰非常重要,這甚至可以直接決定委託客戶的產品銷量。例如,近期小米宣布其新款機型將將首發驍龍8 Gen 1,OPPO、vivo、聯想、摩托摩拉都在搶高通晶片的首發權,原因在數位產品買新不買舊,在客戶預算充足的情況下自然不會去買上一代的驍龍888機型,那麼誰搶占了新款處理器的首發權,誰就率先搶占市場先機。
這個道理同樣適用於高通、蘋果、聯發科等晶片設計廠商,缺晶片的大環境下,搶占三星、台積電的優先供貨權變得異常重要過去,這種對先進製程優先產能的搶奪僅發生在行動晶片市場,自有工廠的英特爾和強大的x86加Windows生態使得領域內玩家較少,PC硬體市場的爭奪並沒有那麼嚴重,但未來隨著行動端晶片廠商的加入,PC端的大亂鬥或許也將到來。
高通和蘋果能率先拿到三星、台積電的優先產能是有原因的,一是需求量大,二是出得起價。需求量大決定了晶片代工廠研發先進製程和開模建產線產生的數百億成本能被分攤;不同規格和設計的晶片決定著代工廠生產中採用的製程和流程,據傳聞高通選擇三星做為其驍龍8 Gen 1的原因與台積電的產能正專注於為蘋果定制晶片有關,但不管是高通還是蘋果,其所需代工廠提供的最新製程都需要不斷調試升級,不像車用晶片一般有一套成熟的方案,因此這也需要著大量資金。
在行動設配有足夠實力讓最強晶片代工廠嘗試新進製程的公司屈指可數──蘋果、高通、三星、聯發科和以往的華為,PC端則是AMD、輝達和終於讓台積電代工的英特爾。若排除GPU領域的輝達,從市值來看行動端陣營的整體實力確實遠超PC端,而在行動化浪潮之前這是不可想像的,過去即使是蘋果也僅僅是強盛時期英特爾的一個零頭,代工之王台積電更只是俯仰在英特爾的鼻息之下。
行動化浪潮創造了巨大的市場,也造就了行動端這些為人所熟知的公司,這些公司所賺得的錢僅需一部分繼續投入到行動端硬體和生態的成長上便能形成驚人的複利,蘋果的M1系列晶片是最好的證明之一,在以往,ARM架構的晶片用在PC領域是一件難以想像的事情。
這樣的話語權更迭,也對整個產業鏈帶來深刻影響。變化正在蔓延開來。
比如伺服器市場。x86處理器過往一直占據著主導地位,在前幾年,一直都是英特爾和AMD兩家公司瓜分著伺服器市場,其中英特爾市場占比超過90%,AMD則吃掉剩下的部分,ARM雖然眼饞於伺服器市場但一直難有進展。
但對於沒有密切關注這個領域變化的人來說,令人詫異的是,近年來各網路科技巨頭已紛紛開始自研ARM架構的伺服器晶片,包括國外的亞馬遜、Google甚至英特爾的老朋友微軟,中國的騰訊、阿里巴巴、華為等都積極參與其中。
如此重視一個市場占比看似依然很低的技術,背後原因仍歸功於行動網路浪潮。ARM伺服器和行動App雲端同構,在行動端的應用具有天然的優勢,兼容性好,指令執行效率高(不需要翻譯轉化),隨著短影音時代的到來,數據中心所需吞吐的行動端流量變大,ARM伺服器的優勢或許會進一步彰顯。
ARM 即將吞噬一切? | TechNews 科技新報 https://bit.ly/3AY0wXQ
--------------------------------------------
NVIDIA與蘋果都選擇了ARM架構,但讓Intel頭痛的不只這兩家
NVIDIA與蘋果都選擇了ARM架構,但讓Intel頭痛的不只這兩家 | T客邦 https://bit.ly/3UkvOij
NVIDIA與蘋果都選擇了ARM架構,但讓Intel頭痛的不只這兩家
去年冬天,蘋果的 Apple Silicon 讓我們見識到了 ARM 晶片的無限潛力,相比起 x86 平台,ARM 顯然已成為先進生產力的代表,最起碼是未來的趨勢了。
蘋果有著強大的軟硬體整合能力,在轉向 ARM 這條快車道上走得很順利,但相比之下,已經紮根太深的 PC 實在是難以脫離x86平台,前有英特爾後有高通,多次與微軟聯手都沒見成效。但 PC 邁向 ARM 並非就完全沒有希望,只是可能需要一些新的玩家來推動。
NV帶來了全新的殺手級武器
前兩週,NV在一年一度技術大會(GTC)上,黃仁勳像以往一樣身著黑色皮衣出現在自家廚房,不過,這次他並沒有帶來全新顯卡,而是發佈了一款基於 ARM 架構的處理器,官方依舊採用歷史人物來命名,這顆處理器被稱為 Grace CPU(美國電腦程式先驅 Grace Hopper 的名字),它是專為大規模 AI 和 HPC 設計的產品,通俗點說就是伺服器級的處理器。
儘管聽起來這是針對伺服器設計的處理器,好像與你我沒有什麼關係?但事實上它的意義卻非同一般。
NVIDIA與蘋果都選擇了ARM架構,但讓Intel頭痛的不只這兩家
在伺服器領域,Intel 長期處於壟斷地位,旗下的 Xeon 處理器佔了 90% 以上的市場,AMD 雖然也有涉獵,但目前的成績遠遠不能達到「翻身」標準。
而NV敢於在這個時候,宣佈讓 Grace 加入戰局,是擁有了比 Intel 更強的能力、比AMD更有信心能夠扳倒Intel這個霸主地位嗎?
事實上,NV其實是找到了一個新的立足點。
近年來,NV在雲端運算、深度學習、人工智慧、甚至是車載平台上持續做出了一些成績,奠定了紮實的基礎,Grace 的出現正是為這些情境所準備的。前面我們說過,Grace CPU 基於 ARM 架構所打造,這也是它的資本。黃仁勳在發布會上說:「Grace 充分彰顯出了 ARM 的強大」。在官方描述中,NVIDIA ARM 的 Grace CPU 擁有極大的靈活性,在與自家 GPU 緊密結合時,性能要比基於 NVIDA DGX 的平台(x86 平台)快上 10 倍。
NVIDIA與蘋果都選擇了ARM架構,但讓Intel頭痛的不只這兩家
這並不是NV第一次推出 ARM 處理器,早在七八年前,它的 Tegra 晶片就出現在了平板和手機上,但是當時沒有激起太大的浪花,如今也就只剩活躍在 Switch 上罷了。
但NV這兩次推出 ARM 晶片的目的完全不同。
先前,它面臨的競爭對手來自行動領域,推出ARM處理器的目的是為了搶佔行動市場,而如今,行動市場的需求已經大幅減弱,大廠普遍轉向了生態建設,所以這一次的 Grace 選擇了和 Apple Silicon 一樣的道路——革 x86 平台的命!
所以,如果說蘋果的M1處理器是在消費市場對x86平台發起革命,則Grace是在伺服器市場革命。NV雖然沒有跟蘋果結盟,但兩家大廠則是不同從兩個領域,分別給予x86平台致命的打擊。
聯手聯發科,Chromebook 是個好市場
事實上,對Intel來說,恐怕他要頭痛的不只是ARM來襲這一件事。長期以來它所賴以維生的Wintel生態,也漸漸被瓜分。
去年,蘋果發佈 M1 晶片的 MacBook Air/Pro 後,很多廠商對 ARM PC 都表現出了濃厚興趣,但無論是消費者還是終端廠商,似乎已經對 Wintel 聯盟所打造的 PC 生態失去了信心,所以除了 Grace CPU 之外,NV這次在 GTC 上還宣佈了一項關於 ARM PC 的消息——NV在 PC 領域要與聯發科合作,共同打造一個支援 Chromium、Linux 和 NVIDIA SDK 的參考平台。 
簡單說來,NV計畫聯手聯發科和Google,另起爐灶打造一個基於 Chrome OS 系統的 PC 生態。可能有很多消費者對 Chrome OS 並不熟悉,但在美國等市場,特別是教育領域,Chrome OS 及其相關的 Chromebook 裝置已經取得了成功的市場地位。這種定位入門、耗電極低的產品已有近十年的歷史。不僅能滿足辦公學習使用,並且價格只有傳統筆電的一半不到,而且最重要的是,在應用程式生態上還相容 Android app,有著很好的前景。
很顯然,ARM 架構所帶來的低功耗高效能特性,正是 Chromebook 以後的發展方向。過去幾年,聯想、惠普、宏碁都推出了搭載聯發科 ARM 處理器的 Chromebook 筆電,雖然數量眾多,也提高了 Chromebook 的普及率,但比較遺憾的是,至今為止都沒有一款定位更高的旗艦級產品出現。好在值得期待的是,ARM 公司近兩年也在高性能產品上有所動作。
聯發科官網 Chromebook 專頁
▲ 聯發科官網 Chromebook 專頁
去年 ARM 發佈了基於 ARMv8.2 指令集 Cortex-X1 架構,性能達到了全新高度,似乎已經有點向 ARM PC 等高性能裝置邁進的意味了,到了今年 3 月底時,全新 ARMv9 指令集的發布則更具意義,它的算力更強,還有著不俗的機器學習能力和安全性,並且以後的 ARM 晶片,將不再只侷限於行動市場,還將發力 PC、HPC 高性能運算、深度學習等新市場。也就是說,我們在未來很有可能見到性能更出色,定位更高的 Chromebook 或者其他 PC 設備。
而NV能在這其中起到什麼作用?其實選擇與聯發科合作已經很明顯了,二者將共同研發應用於消費 PC 領域的高性能 ARM 晶片,NV負責提供強大的圖形演算法支援。NV在 GTC 上也表示,希望將自家的 RTX GPU 技術帶入到 ARM PC 平台,從而擴展 ARM PC 在遊戲、內容創作方面的使用情境,推動整個 ARM 生態的發展。
在向 ARM 轉型的進程中,蘋果是腳步最堅定的,也是走得最順利的,因為它背靠著強大且統一的軟硬體體系,這就是一條最安全的「捷徑」。但是在蘋果之外,英特爾、高通、Google、微軟面臨的困境都要更加複雜。此時,NV在 GTC 上的兩個動作:Grace CPU 和 ARM PC,頗有種風向標意味,為整個行業邁向 ARM 陣營再次明確了方向。
蘋果之外的陣營,或許要開放合作,才能共建未來的 ARM 生態。
NVIDIA與蘋果都選擇了ARM架構,但讓Intel頭痛的不只這兩家 | T客邦 https://bit.ly/3UkvOij


17433332462264

AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間
量子位量子位 發表於 2023年1月07日
AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間 | T客邦 https://bit.ly/3Zcs4my
 一顆晶片塞進1460億個電晶體,還號稱能將ChatGPT、DALL‧E等大模型的訓練時間,從幾個月縮短到幾周,節省百萬美元電費。 就在CES 2023上,蘇媽帶著AMD「迄今為止最大晶片」來嗨翻全場了。
 這顆代號為Instinct MI300的晶片,也是AMD首款資料中心/HPC級的APU。 
 參數性能 
1460億個電晶體是個什麼概念? 
 之前,Intel的伺服器GPU Ponte Vecchio擁有的電晶體數量是1000億+,而Nvidia新核彈H100,則整合了800億個電晶體。 
 不過,熟悉AMD的人都知道,APU簡單來說就是CPU和GPU封裝在了一起。從這個角度上來說,遠超競爭對手的電晶體數量似乎也是情理之中。 
 具體來說,這顆擁有1460億個電晶體的晶片,採用的是小晶片(Chiplet)設計方案。 基於3D堆疊技術,在4塊6nm工藝小晶片之上,堆疊了9塊5nm的運算晶片(CPU+GPU)。 
 根據AMD公開的資訊,CPU方面採用的是Zen 4架構,包含24核心。GPU則採用了AMD的CDNA 3架構。由於Zen 4架構通常是8核設計,外界普遍猜測,9塊運算晶片中有3塊是CPU,6塊是GPU。另外,MI300擁有8顆共128GB HBM3 VRAM。 
 AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間
 性能方面,AMD並未公布太多資訊,僅與Instinct MI250X進行了比較。 
 蘇媽表示,相比於MI250X,MI300每瓦AI性能提升了5倍,AI訓練性能整體提高了8倍。 
 AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間
 而據Tom‘s Hardwre消息,AMD還透露,MI300能將ChatGPT、DALL‧E等大模型的訓練時間,從幾個月縮短到幾周。 
 Instinct MI300預計將在2023年下半年交付。屆時,這顆晶片還將被部署到兩台新的百億億次等級(ExaFLOP)超級電腦上。 
 One More Thing
同樣是在今年的CES上,AMD還直接以蘋果M系列晶片為比較基準,推出了「世界最快的超薄處理器」——Ryzen 7040系列。
 具體型號包括:Ryzen 5 7640HS、Ryzen 7 7840HS、Ryzen 9 7940HS。
   AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間
 對於其中最高階的R9 7940HS,蘇媽大讚道: 
 R9 7940HS在多執行緒性能方面,比蘋果M1 Pro快34%;在AI任務處理上,比蘋果M2快20%。
 AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間
 還給出了更直觀的體驗數據:搭載Ryzen 7040系列晶片的超薄筆記型電腦,能連續播放30+小時影片。 
 首批搭載Ryzen 7040處理器的筆記型電腦,將在今年3月份出貨。AMD史上最大晶片嗨翻全場!1460億個電晶體能大幅縮短ChatGPT訓練時間 | T客邦 https://bit.ly/3Zcs4my

arrow
arrow
    全站熱搜

    nicecasio 發表在 痞客邦 留言(0) 人氣()