Intel Arc銳炫獨(dú)立顯卡深入解讀

2022-03-31 16:21:13 來(lái)源：快科技

3月30日晚，Intel終于發(fā)布了預(yù)熱良久的Arc銳炫系列獨(dú)立顯卡，代號(hào)Alchemist(煉金術(shù)師)。

Intel的上一款高性能游戲獨(dú)立顯卡，還要追溯到1998年的i740，但是曇花一現(xiàn)之后就沒(méi)了，后來(lái)的Larrabee獨(dú)顯計(jì)劃也沒(méi)能開(kāi)花結(jié)構(gòu)(除了衍生出短命的Xe Phi加速卡)。

現(xiàn)在，24年過(guò)去了，Intel終于回歸游戲顯卡!

Intel Arc顯卡包括3、5、7三大系列，分別定位主流游戲、性能游戲、發(fā)燒游戲。

首批登陸筆記本移動(dòng)端(后續(xù)陸續(xù)進(jìn)入桌面臺(tái)式機(jī)和工作站)，而首發(fā)的是主流的3系列，5、7系列將在今年初夏面世。

平臺(tái)搭檔主力是12代酷睿H45、P28系列高性能處理器，也入圍了Intel Evo嚴(yán)苛認(rèn)證。

【型號(hào)/規(guī)格/性能：最高飆到150W】

Arc A系列有大小兩種不同的GPU芯片，其中大的編號(hào)“ACM-G10”，擁有32個(gè)Xe核心(可以粗略地理解為512執(zhí)行單元)、32個(gè)光追單元、16MB二級(jí)緩存，搭配256-bit GDDR6顯存，支持PCIe 4.0 x16。

小的編號(hào)“ACM-G11”，8個(gè)Xe核心，8個(gè)光追單元，4MB二級(jí)緩存，96-bit GDDR6顯存，支持PCIe 4.0 x8。

它們都具備2個(gè)Xe媒體編解碼引擎、4個(gè)顯示通道。

產(chǎn)品方面，Arc 3系列首發(fā)兩款型號(hào)，高端的Arc A370M核心頻率1550MHz，64-bit 4GB顯存，功耗范圍35-50W。

Arc A350M精簡(jiǎn)到6個(gè)Xe核心、6個(gè)光追單元，核心頻率降至1150MHz，顯存不變，功耗范圍則是25-35W。

Arc 5系列目前僅一款型號(hào)Arc A550M，16個(gè)Xe核心、16個(gè)光追單元，核心頻率僅900MHz，搭配128-bit 8GB顯存，功耗60-80W。

Arc 7系列將有兩款型號(hào)，滿(mǎn)血的是Arc A770M，32個(gè)Xe核心(512執(zhí)行單元)、32個(gè)光追單元，核心頻率高達(dá)1650MHz，配備256-bit 16GB顯存，功耗范圍高達(dá)120-150W。

Arc A730M精簡(jiǎn)到24個(gè)Xe核心、24個(gè)光追單元，核心頻率1100MHz，顯存降至192-bit 12GB，功耗80-120W。

值得一提的是，Arc顯卡的核心頻率并不是固定的，而是有一個(gè)動(dòng)態(tài)范圍，可以根據(jù)不同負(fù)載自動(dòng)調(diào)節(jié)，規(guī)格表中的頻率只是一個(gè)平均值。

性能方面，Arc A370M顯卡搭配i7-12700H處理器，1080p中等畫(huà)質(zhì)下，大部分主流游戲都可以穩(wěn)定超過(guò)60FPS，《GTA5》、《火箭聯(lián)盟》等則可以超過(guò)90FPS。

對(duì)比12代酷睿i7-1280P中集成的96個(gè)執(zhí)行單元、1450MHz頻率的銳炬Xe核顯，綜合游戲性能高出一倍左右。

而在內(nèi)容軟件中，得益于優(yōu)化適配，性能提升幅度最多可以達(dá)到1.4倍。

目前，基于Arc A300M系列的筆記本正在陸續(xù)問(wèn)世，品牌包括宏碁、華碩、戴爾、海爾、惠普、聯(lián)想、微星、三星、藍(lán)天、聞泰等等，Intel NUC迷你機(jī)也會(huì)加入。

在國(guó)內(nèi)市場(chǎng)，Arc筆記本將從下個(gè)月開(kāi)始上市。

【內(nèi)核架構(gòu)：這次完全變了】

Intel Arc銳炫顯卡基于高性能的Xe HPG架構(gòu)，基本組成單元包括Xe內(nèi)核、Xe媒體引擎、Xe顯示引擎、Xe圖形流水線等，我們逐一來(lái)看。

大家知道，Intel GPU多年來(lái)的基本模塊一直都是“執(zhí)行單元”(EU)，Xe HPG架構(gòu)上變成了全新的“Xe核心”(Xe Core)。

Xe核心中又包含16個(gè)256位矢量引擎(XVE)、16個(gè)1024位矩陣引擎(XMX)、192KB共享緩存、載入存儲(chǔ)單元等等，其中緩存可以根據(jù)工作負(fù)載，在一級(jí)緩存、共享本地內(nèi)存(SLM)之間動(dòng)態(tài)分配。

Xe核心的上一層級(jí)是渲染切片(Render Slice)，每個(gè)包含4個(gè)Xe核心、4個(gè)光追單元、4個(gè)紋理采樣器、幾何前端、光柵前端、HiZ單元、2個(gè)像素后端。

渲染切片可以多組結(jié)合擴(kuò)展，Arc顯卡最多有8個(gè)。

Arc顯卡完整支持DX12 Ultimate、Vulkan，并且同時(shí)支持DXR光追、Vulkan光追。

這就是Arc顯卡完整的內(nèi)部架構(gòu)圖。

矢量引擎改進(jìn)了ALU單元，提供專(zhuān)用的FP浮點(diǎn)執(zhí)行接口，共享的INT/EM整數(shù)執(zhí)行接口，每個(gè)時(shí)鐘周期可以執(zhí)行16個(gè)FP32操作、32個(gè)FP16操作、64個(gè)INT8操作。

由于AI算法核心幾乎完全圍繞矩陣乘法、累加算法，所以Xe核心里加入了單獨(dú)的矩陣引擎，專(zhuān)門(mén)用于執(zhí)行XMX指令。

它具備獨(dú)立的執(zhí)行端口，每個(gè)時(shí)鐘周期可以執(zhí)行128個(gè)FP16/BF16操作、256個(gè)INT8操作，512個(gè)INT4/INT2操作。

【XeSS：化腐朽為神奇的超分辨率縮放】

針對(duì)矩陣引擎不同指令的處理操作，Intel也做了詳細(xì)的解釋?zhuān)覀儊?lái)簡(jiǎn)單了解下。

MAC作為圖形渲染中的基本SIMD矢量指令，也是Xe矢量引擎的核心，可以執(zhí)行8次并行乘法，然后執(zhí)行8次并行加法，每個(gè)時(shí)鐘周期就是16個(gè)操作。

上圖最左側(cè)水平方向的前排、后排藍(lán)色方塊，就代表操作數(shù)，上下的方框則代表累積的源和結(jié)果。

DP4a指令是針對(duì)不需要32位精度的AI計(jì)算所做的優(yōu)化，工作原理是將所有32位輸入分成8位塊，然后獨(dú)立執(zhí)行，總共32次并行乘法(紫色方塊)，每個(gè)時(shí)鐘周期就是64個(gè)操作，相比標(biāo)準(zhǔn)SIMD MAC提高了4倍。

XMX指令也是每個(gè)操作分成4個(gè)塊，然后獨(dú)立相乘、累加，共有64個(gè)操作，每個(gè)時(shí)鐘周期4個(gè)階段就是256個(gè)操作，由此帶來(lái)16倍的算力提升。

XMX矩陣引擎最直接的作用就是支撐XeSS超采樣抗鋸齒技術(shù)，類(lèi)似NVIDIA DLSS、AMD FSR，可以通過(guò)低分辨率渲染、高分辨率縮放輸出，提升游戲性能，并得到類(lèi)似或超越原生的畫(huà)質(zhì)。

XeSS已經(jīng)得到了十多款游戲的支持，不過(guò)目前還不可用，會(huì)在今年初夏正式面世。

下邊感受一下XeSS在實(shí)際游戲中的效果，左側(cè)是1080p原生渲染，右側(cè)是4K XeSS縮放渲染，可以明顯看到后者的畫(huà)面質(zhì)量高得多，細(xì)節(jié)也更加豐富、銳利。

至于性能提升幅度，Intel暫時(shí)沒(méi)有給出具體數(shù)據(jù)。

【多媒體：首發(fā)全新視頻格式AV1】

Xe媒體引擎可以為主流視頻軟件帶來(lái)硬件加速，解碼支持高達(dá)8K60 12-bit HDR，編碼支持高達(dá)8K 10-bit HDR。

視頻編解碼格式不但支持MPEG-4、VP9、AVC、H.264、HEVC(H.265)，更是首發(fā)支持AV1硬件編碼、解碼。

AV1的編碼效率相比H.264、H.265分別高出50%、20%，能夠以更小的文件、更少的帶寬帶來(lái)更高的畫(huà)面質(zhì)量，關(guān)鍵是開(kāi)放的，無(wú)需版權(quán)費(fèi)，是開(kāi)放媒體聯(lián)盟力推的技術(shù)。

這個(gè)聯(lián)盟的成員都是大名鼎鼎的巨頭，包括亞馬遜、蘋(píng)果、ARM、思科、Facebook、Google、華為、Intel、微軟、Mozilla、Netflix、NVIDIA、三星、騰訊等等。

AV1還在起步階段，但普及速度很快，尤其是解碼方面，NVIDIA RTX 30系列、AMD RX 6000系列，聯(lián)發(fā)科天璣1000開(kāi)始，Windows 10系統(tǒng)和不少視頻軟件、視頻網(wǎng)站、視頻設(shè)備，都已經(jīng)支持。

來(lái)對(duì)比一下AV1、H.264在游戲直播中的畫(huà)質(zhì)差異，分辨率都是1080p，碼率都是5Mbps。

【顯示：支持平滑同步】

Xe顯示引擎支持HDMI 2.0b、DisplayPort 1.4a輸出標(biāo)準(zhǔn)，并且為下一代DisplayPort 2.0 10G做好了準(zhǔn)備。

視頻輸出也支持極高的分辨率、刷新率，最高可以雙路8K60 HDR、四路4K120 HDR，以及1080p360、1440p360。

同步技術(shù)更是帶來(lái)了三種，最常見(jiàn)的是VESA標(biāo)準(zhǔn)的Adaptive Sync(適應(yīng)性同步)，與顯示器刷新率同步，消除畫(huà)面撕裂，當(dāng)今多數(shù)游戲本的屏幕都支持該技術(shù)。

其次是Speed Sync(加速同步)，可以在關(guān)閉V-Sync垂直同步后，為當(dāng)前幀提供加速，不僅可以消除撕裂，還具備低延時(shí)、無(wú)上限的優(yōu)點(diǎn)。

最后是新的“Smooth Sync”(平滑同步)，通過(guò)抖動(dòng)過(guò)濾功能，對(duì)畫(huà)面撕裂進(jìn)行模糊化處理，保證同步無(wú)撕裂、無(wú)失真。

【Deep Link：CPU+GPU協(xié)同發(fā)力】

處理器、顯卡都是自己家的，自然要聯(lián)合作戰(zhàn)，這就是Deep Link技術(shù)，可以讓酷睿處理器、核顯、獨(dú)顯協(xié)同釋放各自的潛力，主要應(yīng)用包括三個(gè)方面。

一是動(dòng)態(tài)功率共享，支持12代酷睿平臺(tái)，原理很簡(jiǎn)單，就是根據(jù)不同的負(fù)載，動(dòng)態(tài)調(diào)節(jié)CPU、GPU的功耗配比，玩游戲就多給GPU。

AMD平臺(tái)有相同的技術(shù)SmartShift，NVIDIA也有類(lèi)似的，但自己沒(méi)有CPU處理器，效果自然大打折扣。

二是超級(jí)編碼，通過(guò)oneVPL API，可以讓獨(dú)立顯卡、核芯顯卡共同進(jìn)行視頻編碼，處理不同的幀畫(huà)面，再合成。

三是超級(jí)算力，聯(lián)合基于機(jī)器學(xué)習(xí)的MLS框架，結(jié)合XMX引擎加速，可以智能地將計(jì)算負(fù)載分配給獨(dú)立顯卡、核芯顯卡各自的計(jì)算引擎，比如處理視頻的時(shí)候，將畫(huà)面分成不同區(qū)塊，交給兩種顯卡，處理完畢后再合成輸出。

Intel宣稱(chēng)，在內(nèi)容創(chuàng)作上，動(dòng)態(tài)功率共享、超級(jí)編碼、超級(jí)算力可以分別帶來(lái)最多30%、60%、24%的性能提升。

Intel也展示了超級(jí)算力的應(yīng)用實(shí)例，將低畫(huà)質(zhì)的視頻AI處理縮放到高分辨率畫(huà)質(zhì)。

【驅(qū)動(dòng)面板：煥然一新監(jiān)控優(yōu)化都在行】

硬件有了，驅(qū)動(dòng)自然也要跟上，Arc顯卡將搭配全新的“Arc Control”驅(qū)動(dòng)控制面板，功能更加豐富，包括游戲驅(qū)動(dòng)、性能調(diào)優(yōu)、全局設(shè)置、游戲庫(kù)、創(chuàng)作者工作站等模塊。

性能調(diào)優(yōu)部分，可以實(shí)時(shí)監(jiān)測(cè)查看各種硬件指標(biāo)，頻率、電壓、占用率、溫度、風(fēng)扇轉(zhuǎn)速等等，還可以設(shè)置監(jiān)測(cè)涂層，隨時(shí)覆蓋查看。

未來(lái)的桌面產(chǎn)品，還會(huì)支持調(diào)節(jié)功耗、風(fēng)扇轉(zhuǎn)速等，不知道是否會(huì)加入超頻……

創(chuàng)作者工作站部分，可以方便地進(jìn)行直播、AI攝像頭強(qiáng)化(背景模糊/背景替換/刪除和自動(dòng)補(bǔ)幀等)、自動(dòng)生成游戲高光時(shí)刻。

等了這么久，Intel高性能獨(dú)立顯卡終于來(lái)了，你準(zhǔn)備好了嗎?

關(guān)鍵詞： Arc銳炫獨(dú)立顯卡深入解讀 Arc銳炫系列

相關(guān)新聞

久久99这里只有精品_黄色黄页网站_美女免费视频观看高清不卡_国产区在线免费观看_婷婷蜜桃国产精品一区

Intel Arc銳炫獨(dú)立顯卡深入解讀