Mi a gomb a Radeon 7900 kártyán AMD Radeon videokártya családok Referencia információk. Kiállítások és szemináriumok adatai

Néhány napja ismertté vált az új Next Generation Core (NGC) architektúrával rendelkező Tahiti GPU-kra épülő grafikus adapterek hozzávetőleges ára. Az amerikai boltokban a zászlóshajó Radeon HD 7970 550 dolláros áron, a Radeon HD 7950 megoldás pedig 450 dolláros áron kerül értékesítésre. Ezenkívül meg nem erősített forrásokból olyan információ érkezik, hogy ezek a videokártyák 384 bites memóriabusszal rendelkeznek.

A Beyond3D.com fórum mélyén Radeon HD 7900-as videokártyákról osztott meg fotókat a hasonló gondolkodású emberekkel egy bizonyos tiszteletreméltó felhasználó, fellix, aki igyekezett a képek minőségét úgy elkészíteni, hogy ne lépje túl az NDA-t. Ennek ellenére megerősítést nyert, hogy 384 bites busz található rajtuk.

Két AMD Tahiti grafikus kártya úgy működik együtt, hogy a hasuk az objektív felé néz. A megváltozott dizájn mellett két darab 8 tűs tápcsatlakozó jelenlétét figyelhetjük meg, ami magának a PCIe x16-os bővítőhelynek a teljesítménye mellett további 300 wattot ad. A hírek szerint a PCB hossza 30 cm, a memóriamodulok pedig 12 darabból állnak, ami könnyen megerősíti a 384 bites busz jelenlétét.

Ezen a képen megkülönböztetheti, hogy a videokártyák egyértelműen nem kiskereskedelmi minták.

Érdekes grafikonok jelentek meg ugyanazon a fórumon, amelyek az NGC architektúra és a Radeon HD 7970 videokártya egyértelmű dominanciáját mutatják a teszt többi résztvevőjével szemben. Nyilvánvaló, hogy egy ilyen ütemezés 5 perc kérdése, és ennek megfelelően kell kezelni.

  • Chip kódneve: "Tahiti"
  • 4,3 milliárd tranzisztor (több mint 60%-kal több, mint a Cayman, és pontosan a duplája a Cypress-nek)
  • 384 bites memóriabusz: hat 64 bites vezérlő GDDR5 memória támogatásával
  • Magfrekvencia: akár 925 MHz (Radeon HD 7970 esetén)
  • 32 GCN számítási egység, köztük 128 SIMD mag, összesen 2048 ALU-ból áll a lebegőpontos számításokhoz (egész és lebegőpontos formátumok, FP32 és FP64 precíziós támogatás az IEEE 754 szabványon belül)
  • 128 textúraegység, amely támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 32 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezési lehetőségével, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 32 minta ciklusonként, és csak Z módban - 128 minta ciklusonként
  • Hat monitor integrált támogatása, beleértve a HDMI 1.4a-t és a DisplayPort 1.2-t

A Radeon HD 7970 grafikus kártya műszaki adatai

  • Magfrekvencia: 925 MHz
  • Univerzális processzorok száma: 2048
  • Textúra egységek száma: 128, keverési egységek: 32
  • Effektív memóriafrekvencia: 5500 MHz (4 × 1375 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 3 gigabájt
  • Memória sávszélessége: 264 gigabájt másodpercenként
  • Maximális elméleti kitöltési sebesség: 29,6 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 118,4 gigatexel másodpercenként.
  • Két CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Áramfelvétel: 3-250 W
  • Egy 8 tűs és egy 6 tűs tápcsatlakozó
  • Kétnyílásos kialakítás
  • MSRP: 549 USD

A Radeon HD 7950 grafikus kártya műszaki adatai

  • Magfrekvencia: 800 MHz
  • Univerzális processzorok száma: 1792
  • Textúra egységek száma: 112, keverési egységek: 32
  • Effektív memóriafrekvencia: 5000 MHz (4 × 1250 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 3 gigabájt
  • Memória sávszélessége: 240 gigabájt másodpercenként.
  • Maximális elméleti kitöltési sebesség: 25,6 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 89,6 gigatexel másodpercenként.
  • Két CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Teljesítményfelvétel: 3-200 W
  • Kétnyílásos kialakítás
  • MSRP: 449 USD

Figyelemre méltó az új chip nagy bonyolultsága – 4,3 milliárd tranzisztor, ami több mint fele az előző csúcskategóriás GPU tranzisztorainak számának. Egy ilyen összetett kristály elkészítésének lehetőségét egy modern, 28 nanométeres folyamattechnológia alkalmazása biztosította, és az új chip területét tekintve még a kajmán méretnél is kicsivel kisebbnek bizonyult. És érezhetően javultak a teljesítményt befolyásoló gyakorlati jellemzői: az ALU-k, TMU-k száma, a memóriabusz. Csak a ROP-ok száma nem nőtt, a GDDR5 videómemória frekvenciája pedig változatlan maradt.

A cég videokártyáinak elnevezésének elve változatlan maradt. A Radeon HD 7970 a cég legproduktívabb egylapkás megoldása, egy idő után megjelent a fiatalabb HD 7950 modell, amelyet kicsivel később jelentették be. Kezdetben a HD 7970-nek nem volt versenytársa a piacon, és nem cserélt le egyetlen konkrét videókártyát sem az AMD vonalról, hanem inkább lenyomta. Ami a versenytárssal való összehasonlítást illeti, az NVIDIA jóval később adta ki 28 nanométeres megoldását.

Ugyanez a GDDR5 memória került az új AMD videokártyára is, de a térfogata az előző generáció 2 gigabájtja helyett 3 gigabájtra nőtt. Ez a memóriabusz 256 bitesről 384 bitesre való bővítése miatt történt. Most pedig akár 1,5 GB-ot, akár 3 GB-ot helyezhet az új kártyára. Természetesen marketing szempontból a kisebb kötet telepítése egyértelműen hátrányt jelentene, így a 3 GB telepítése mellett döntöttek, bár ez ma már kicsit túlzás. Csak ultra-nagy felbontásban és MSAA-val a 16x 1,5-2 GB nem elég. Az AMD azonban rendelkezik Eyefinity-vel is, és a három vagy több monitoron lévő játékoknál a képernyőpuffer csak nagyon nagy mennyiséget foglal el.

Nézzük tehát a Radeon HD 7970-et. A felső árkategóriába tartozó új videókártya kétnyílásos hűtőrendszerrel rendelkezik, amit az összes modern AMD alaplapra jellemző műanyag ház borít, teljes hosszában. a kártya. Csak ennek a burkolatnak a kialakítása változott némileg, bár a hátsó rész még mindig túlnyúlik a nyomtatott áramkörön. A vezetékekkel ellátott szalag kialakítása azonban megváltozott - a videokártya hűtésének javítása érdekében a két nyílás egyikét (a szalag felét) kizárólag a hőelvezetést szolgáló szellőzőnyílás foglalta el.

De a felhasználóknak nem kell bántania a közvetlenül az alaplapra vezetékezett DVI-csatlakozók számának csökkenése. Kényelmük érdekében egy speciális HDMI-DVI adapter kerül a csomagba, amely lehetővé teszi két DVI csatlakozós monitor csatlakoztatását. Az új kártya fogyasztása egyébként nem alacsonyabb, mint a Radeon HD 6970-é, így egy 8 tűs és egy 6 tűs tápcsatlakozó készletet kellett rá szerelni.

De az új Radeon HD 7970-ben a hűtőrendszer jobbra változott. Az elpárologtató kamra új generációja és egy új, nagyobb méretű hűtő, a lapátok megváltozott formájával és megnövelt teljesítménnyel (nagyobb légáramlás biztosított). Ennek eredményeként a hűtő hatásfoka nő, miközben a zaj csökken.

Nem tűnt el az alaplapról a Dual BIOS firmware kapcsoló sem, amiről a Radeon HD 6900 leírásában írtunk, röviden: a videokártyának két BIOS verziója van, az egyik egyedi villogással, a másik pedig vezetékes firmware a gyárban. A felhasználóknak és magának az AMD-nek is annyira megtetszett ez a kényelmes megoldás, hogy úgy döntött, továbbra is a csúcskategóriás megoldásokat köti össze velük.

Csak üdvözölni tudjuk ezt a megoldást, amely valóban segít a villogás közbeni váratlan problémákkal (például a folyamat közbeni kikapcsolással) kapcsolatos különféle esetekben, és lehetővé teszi a különféle BIOS-képekkel végzett kísérletezést. Nem meglepő, hogy az AMD újra és újra utalt az új grafikus kártya kiváló túlhajtási képességeire:

Amint látható, az 1 GHz-es és magasabb frekvenciára való túlhajtás gyakorlatilag meg van ígérve, ha nem vesszük figyelembe azt a kis feliratot (ami nem szerepelt a képernyőképen), hogy a garancia akkor is megszűnik, ha a videókártya lejárt. sorrendben egy kísérlet eredményeként a frekvencia növelése a beállítások videó-illesztőprogramból.

A Radeon HD 7970 építészeti jellemzői

A déli szigeteken végrehajtott építészeti módosítások relevanciájának felméréséhez először nézzük meg a GPU-k fejlődését az elmúlt néhány évben, ahogy azt az AMD is látta. 2002-ig a grafikus chipek olyan speciális hardverek voltak, amelyek tisztán grafikus számítástechnikára voltak képesek. Az akkori videochipek funkcionalitása korlátozott volt, csak a textúrák alkalmazását és szűrését, a geometria feldolgozását, a primitív raszterezést tudták, ezért egyáltalán nem voltak alkalmasak univerzális számítási feladatokra.

Az elkövetkező néhány évben az alapvető programozási lehetőséggel bővült a GPU, de ez is kizárólag a grafikus feladatokra koncentrált. Ez volt az ideje a DirectX 8 és 9 támogatásának, a shader programok korlátozott funkcionalitásának, lebegőpontos számítási lehetőséggel. Az akkori videochipek speciális ALU-kkal rendelkeztek csúcs- és pixelfeldolgozásra, valamint dedikált gyorsítótárak a pixelek, textúrák és egyéb adatok számára. A sokoldalúság még mindig közel sem volt.

Az AMD csak 2007-ben szerzett egy egységes DirectX 10 shader architektúrát, valamint GPU programozási képességeket speciális eszközök segítségével: CAL, Brook, ATI Stream. Az akkori GPU-k már fejlett gyorsítótárral és támogatással rendelkeztek a helyi és globális megosztott adatokhoz. Építészetileg a chipek a VLIW5 és VLIW4 blokkon alapultak, elég rugalmasak néhány alapvető, nem grafikus számításhoz, de továbbra is a grafikus algoritmusokra összpontosítottak.

Itt az ideje egy új architektúrának, amely még jobban megfelel az általános célú számítástechnikai célokra - Graphics Core Next (GCN)... Az AMD számára ez egy új építészeti korszak, ezért választották így a nevet. Az új GPU-k kiváló grafikus feldolgozási képességeket és teljesítményt kínálnak, de a végrehajtott architektúra változtatások célja elsősorban a nem grafikus számítástechnikában elfoglalt pozíció javítása - a teljesítmény és a hatékonyság növelése összetett általános célú feladatoknál. Az új GPU-kialakítást az úgynevezett heterogén számítástechnikára tervezték – a grafika és az általános célú számítástechnika keverékére, többfeladatos környezetben. A GCN architektúra rugalmasabbá vált, és még jobban alkalmasnak kell lennie különféle feladatok energiahatékony végrehajtására.

Az új architektúra alapblokkja a GCN blokk. Ezek az összes új Southern Islands GPU építőkövei. Az AMD grafikus chipek architektúrája most először használ nem VLIW tervezést, vektor- és skaláris blokkokat használ, és az egyik legfontosabb változás, hogy a GCN számítási blokkok mindegyike saját ütemezővel rendelkezik, és különféle programokból képes utasításokat végrehajtani. (kernel).

Az új számítási architektúrát úgy tervezték, hogy nagy hatékonyságot biztosítson a számítási egységek betöltésében többfeladatos környezetben. A GCN számítási blokk négy alszakaszra oszlik, amelyek mindegyike a saját utasításfolyamán működik minden órajelcikluson. Az adatfolyamok a GCN-ben elérhető skalárblokkot is használhatják áramlásvezérlésre vagy mutatóműveletekre. A vektor- és skalárblokkok kombinációja nagyon egyszerű programozási modellt kínál. Például a függvényekre és a veremre mutató mutatókat (függvénymutatókat és veremmutatókat) sokkal könnyebb programozni, és a fordító feladata is sokkal egyszerűsödött, mivel a végrehajtási egységek skalárisak.

Minden GCN blokk külön 64 KB-os helyi tárhellyel rendelkezik az adatcseréhez vagy a regiszterek helyi verembővítéséhez. A blokk tartalmaz egy első szintű gyorsítótárat is, amely olvasási és írási képességgel rendelkezik, valamint egy teljes értékű textúra csővezetéket (mintavevő és szűrőegységek). Ezért az új számítási egység képes önállóan dolgozni, központi ütemező nélkül, amely a korábbi architektúrákban a munka blokkokra osztásáért volt felelős. Mostantól a GCN blokkok mindegyike képes önállóan ütemezni és elosztani a parancsokat, egy számítási egység akár 32 különböző parancsfolyamot is végrehajthat, amelyek különböző virtuális címterekből származhatnak a memóriában, és teljesen védettek és függetlenek egymástól.

Az AMD korábbi GPU-architektúrái a VLIW4 és VLIW5 architektúra modelleket használták, és bár elég jók a grafikus feladatokhoz, nem elég hatékonyak az általános célú számítástechnikához, mivel nagyon nehéz az összes végrehajtó egységet betölteni, hogy ilyen körülmények között működjön. Az új GCN architektúra ugyanilyen nagy számú végrehajtási egységet kínál, de skaláris végrehajtással, amely megszünteti a regiszterek és utasítások korlátait és függőségeit. A VLIW architektúráról a skaláris végrehajtásra való áttérés észrevehetően leegyszerűsíti a kódoptimalizálási feladatokat.

Amikor a korábbi VLIW4 architektúrán végrehajtja az utasításokat, a fordítónak foglalkoznia kell a regiszterkonfliktusokkal, a fordítási szakaszban végrehajtani az utasítások bonyolult kiosztását a végrehajtási egységekhez stb. Ugyanakkor a nagy teljesítmény eléréséhez gyakran nemtriviális optimalizálás szükséges, ami alkalmas a legtöbb grafikai feladatra, és sokkal kevésbé rugalmas más számításokhoz. Az új architektúra jelentősen leegyszerűsíti a fejlesztést és a támogatást, egyszerűsíti a létrehozást, a hibák elemzését és elkapását az alacsony szintű kódokban, valamint stabil és kiszámítható teljesítményt.

Memória-gyorsítótár alrendszer

A sávszélesség, a memória és a gyorsítótár mennyisége soha nem elég, és mindig van szükség és módszerek ezek növelésére. Az AMD új GPU-i teljes olvasási/írási kétszintű gyorsítótárat használnak. Minden számítási egység 16 kilobájt első szintű gyorsítótárral rendelkezik, a második szintű gyorsítótár teljes mérete 768 kilobájt (összesen a chip 512 KB L1 és 768 KB L2), ami 50%-kal több, mint az előző chipben. , amely egyáltalán nem tud írni az L2 gyorsítótárba.

Ami a teljesítményt illeti, minden egyes GCN számítási egység egy órajel ciklusban 64 bájtnyi adatot tud fogadni vagy írni az L1 gyorsítótárból vagy a globális memóriából, amelyet az utasításfolyamok közötti adatcserére használnak. Ugyanaz az adatmennyiség képes az L2 cache memória minden egyes szakaszának továbbítására és fogadására. Ennek eredményeként a cég legjobb GPU-ja 2 terabyte/s-ot kap az L1-hez és 700 GB/s-ot az L2-hez, ami 50%-kal több, mint a korábbi csúcs AMD-megoldás.

"Tahiti" grafikus processzor

Most, hogy az új Southern Islands sorozat alacsony szintű építészeti változásaival foglalkoztunk, itt az ideje, hogy rátérjünk a sorozat legerősebb megoldásának részleteire – a két modellt tartalmazó Radeon HD 7900-ra. Először is jegyezzük meg az új GPU óriási bonyolultságát, mert több mint 4,3 milliárd tranzisztort tartalmaz, ami kétszer annyi, mint a Radeon HD 5870 alapját képező chipben! Természetesen egy ilyen erős chip csak az új, 28 nm-es technikai eljárásnak köszönhetően vált lehetségessé. Szóval mi van benne?

A geometriai blokkok száma nem változott, a Cayman-hez képest továbbra is kettő van belőlük, de a hatásfokuk jelentősen megnőtt - erről kicsit később még kitérünk. A grafikus processzor diagramon a Radeon HD 7970-en 32 GCN architektúra számítási egységet látunk, a junior megoldás esetében pedig ezek egy része le lesz tiltva. Ha figyelembe vesszük a megoldás számítási csúcsteljesítményét, akkor ez közel 3,8 teraflop (a lebegőpontos műveletek száma másodpercenként), ami ma abszolút rekord egy GPU-nál.

Minden GCN egység 16 textúra egységet tartalmaz, ami összesen 128 TMU-t ad chipenként, vagyis több mint 118 gigatexelt/mp – ez pedig egy újabb rekord a kiadás idején, és messze nem az utolsó. De a ROP blokkok száma nem változott, még mindig 32 van belőlük 8 kinagyított RBE blokkban. Egy másik érdekes építészeti változás - most a ROP blokkokat nem a memóriacsatornákhoz "kapcsolják", mint korábban, hanem a GCN blokkokhoz.

Bár elméletileg a framebuffer írási sebessége alig változott, és a maximálisan lehetséges ugyanaz a 32 színérték és a 128 mélységérték óránként, a gyakorlati kitöltési arány (kitöltési ráta) a valós alkalmazásokban jelentősen megnőtt a megnövelt memória sávszélesség. Az AMD mérése szerint a Cayman csak 23 pixelt vett fel órajelenként, míg az új Tahiti megközelítette az elméleti 32 pixelt órajelenként.

Ez érthető, mert az AMD új videochipje 384 bites memóriabusszal rendelkezik - hat 64 bites csatorna, akárcsak egy versenytárs jelenlegi csúcsmegoldása. A memória sávszélességének ez a 1,5-szeres növekedése teszi lehetővé a textúra mintavételezésének és a framebufferbe való írásának valós sebességének növelését. A 264 GB / s sávszélességnek hozzá kell járulnia a 118 gigatexel / s és 30 gigapixel / s elméleti értékekhez, és a gyakorlati részben ezt ellenőrizzük.

A "lecsupaszított" Radeon HD 7950 grafikus processzor esetében Tahiti 28 aktív GCN architektúra számítási egységet tartalmaz a chipen fizikailag elérhető 32-ből. A Radeon HD 7970 sorozat junior megoldása esetében négy letiltása mellett döntöttek. Mivel minden GCN egység 16 textúra egységet tartalmaz, az új modell TMU-inak teljes száma 112 TMU, ami közel 90 gigatexel/mp teljesítményt ad.

De a HD 7950-ben a ROP-ok és a memóriavezérlők száma nem változott, úgy döntöttek, hogy nem vágják le őket, és ugyanazt a 32-t, illetve 6-ot hagyják. Ezért a Tahiti Pro videochip ugyanazzal a 384 bites memóriabusszal rendelkezik, hat 64 bites csatornából összerakva, mint az AMD csúcsmegoldása. Nyilvánvalóan a számítástechnikai funkcionális eszközök szenvednek leginkább a gyártási hibáktól, és úgy döntöttek, hogy nem vágnak le minden mást.

Tesellációs és geometriai feldolgozás

Építészeti szempontból a Tahiti geometrikus tömbökben semmi különös nem változott a Kajmán korszak óta. A geometriai adatok feldolgozására (csúcsok beállítására és tesszellációra) és a raszterezésre továbbra is két blokkot használnak, és a séma nagyon hasonló a korábban látotthoz, kivéve, hogy a tessellátorokat már 9. generációnak hívják:

A sematikus hasonlóságok ellenére ezen blokkok legújabb generációja lényegesen jobb tesszellációs és geometriai feldolgozási teljesítményre képes, mivel a blokkok jelentős módosításokon estek át. Bár a csúcsteljesítmény csak közel kétmilliárd csúcsra és primitívre nőtt másodpercenként (925 MHz és órajelenként két csúcs), a valós teljesítmény tovább nőtt. Ezt a gyorsítótárak méretének növelésével, a geometriai adatok pufferelésének javításával és a csúcsadatok újrafelhasználásával sikerült elérni.

Ennek eredményeként a tesszelációs teljesítmény minden háromszög burkolólap-arány mellett akár négyszeresére is javult az előző generációs Radeon HD 6970-hez képest. De a négyszer nem minden esetben érhető el, még az AMD diagramján sem:

A diagram a Radeon HD 7970 és a HD 6970 tesszellációs teljesítményének összehasonlítását mutatja 1 és 32 közötti felosztási arány mellett. És amint látható, a teljesítmény különbsége 1,7-4-szeres. De ez csupasz szintetikus anyag. És hogy közelebb kerüljünk a valósághoz, adjunk több adatot a játékalkalmazások tessellációs sebességéről:

Amint látható, az AMD szintetikus számait jól támogatják a játékhoz tartozók – a teljesítmény a valódi alkalmazásokban, „nehéz” tesszellációval jelentősen megnőtt. Ez egy nagyon jó eredmény, amit a gyakorlati részben mindenképpen ellenőrizni fogunk, példaként használva a szintetikus és játékalkalmazásokat.

Nem grafikus számítástechnika

A heterogén és nem grafikus számítási feladatok szempontjából nagyon fontos a kialakulóban lévő két aszinkron számítási motor (ACE). Úgy tervezték őket, hogy ütemezzék és megosszák a munkát a végrehajtási egységek között a hatékony többfeladatos munkavégzés érdekében, és a grafikus parancsprocesszorral (Command Processor) együtt működjenek.

A Radeon HD 7900 két független számítási motorral és egy grafikus motorral rendelkezik. Ez három programozható blokkot és három utasításfolyamot ad össze, egymástól teljesen elkülönülve. A gyors kontextusváltást biztosító aszinkron parancsküldés mellett az új GPU két kétirányú közvetlen memóriaelérési (DMA) vezérlőt is tartalmaz, amelyeket a Cayman-nél mutattak be. Ez a két vezérlő szükséges az új PCI Express 3.0 busz előnyeinek teljes kihasználásához.

Mint tudjuk, a komoly számítások szempontjából nem csak az egyszeres pontosságú lebegőpontos műveletek végrehajtásának sebessége a fontos, hanem a dupla pontosságú lebegőpontos műveletek is. Az AMD új architektúrája pedig elég jól megbirkózik ezzel a feladattal. Jelenleg azt feltételezzük, hogy a GCN számítási egységeknek két változata létezik, amelyekben az FP64 utasítások végrehajtási sebessége eltérő. A régebbi GPU-nál a végrehajtási arány az FP32 sebességének 1/4-e, az alacsonyabb kategóriás GPU-knál pedig 1/16, ami bőven elég a kompatibilitás fenntartásához, de nem bonyolítja túlságosan az olcsó megoldásokat. Ennek eredményeként a Radeon HD 7970 másodpercenként 947 milliárd dupla precíziós műveletre képes (eh, alig érték el a teraflopot!) – ez az új AMD lapka újabb legmagasabb eredménye.

Ráadásul ezek nem ugyanazok a gigaflopok, mint a korábbi architektúráknál, hanem inkább "kövérebbek". Hiszen az új GPU hatékonysága az összetett számítási feladatokban jelentősen javuljon. Először is a memória és a gyorsítótárazási alrendszer fejlesztése történt meg. Másodszor, minden GCN számítási egységnek saját ütemezője van, ami javítja az elágazó kód végrehajtását és az általános hatékonyságot. Harmadszor pedig megjegyezzük a skaláris végrehajtást, amely nem igényel bonyolult optimalizálást a fordítótól, aminek következtében a számítási egységek sokkal ritkábban lesznek üresjáratban. Ennek eredményeként az új chip könnyebben demonstrálja a nagy teljesítményt és az ALU-terhelést bármilyen feladatban.

További számítási újítások közé tartozik a DRAM és SRAM teljes ECC támogatása. Szoftveres oldalról fontos, hogy a Tahiti az első GPU, amely teljes mértékben támogatja az új API-verziókat: OpenCL 1.2, DirectCompute 11.1 és C ++ AMP, valamint ezek képességeit. Például az OpenCL 1.2 lehetővé teszi több számítástechnikai eszköz képességeinek egyesítését, az AMD pedig már kiadta a támogatást az AMD APP SDK 2.6 és a Catalyst 11.12 illesztőprogram formájában.

Építészeti teljesítmény és hatékonyság

Miután áttekintettük az összes építészeti újítást a Southern Island sorozat csúcslapkájának példájával, itt az ideje, hogy beszéljünk mindezen változtatások hatékonyságáról. Nyilvánvaló, hogy az új chipek teljesítménye jóval magasabb, mint a korábbiaké, ennek ellenkezője meglepő lenne. A kérdés az, hogy mennyivel gyorsabban. Különböző feladatokban 40-50%-tól (minimum!) ötszörös különbségig kapunk számokat. Az architektúra fejlesztései lehetővé teszik az elméleti 1,4-szeres hülye gigaflop különbség túllépését. Nézzük meg ezt példákkal:

A diagram összehasonlítja az új csúcskategóriás megoldást és a korábbi egylapkás megoldást: Radeon HD 7970 és HD 6970, ami meglehetősen korrekt. Különféle teljesítményteszteket választottak ki: a SmallptGPU és a LuxMark az OpenCL sugárkövetését, az SHA256 egy biztonságos kivonatolási algoritmus, az AES256 pedig egy szimmetrikus titkosítási algoritmus. Nos, Mandelbrot egy jól ismert kettős pontosságú probléma.

A függőleges szaggatott vonal a grafikonon az elméleti teljesítménykülönbséget jelöli, de a sebességadatok azt mutatják, hogy az új GPU ötből háromban lényegesen gyorsabb volt. Ez a hatékonyság növelését célzó összes változtatásnak köszönhető: a VLIW-től való eltávolodás, az ütemező jelenléte minden számítási egységben, a gyorsítótárazás javítása stb.

A renderelés minősége megváltozik

Igazából ezt a részt ki is lehetett volna hagyni, hiszen a képminőségre mostanában nem lehet különösebb panasz, és nem is lehet - különböző okok miatt. Például a különböző gyártók videokártyáinak teljes képernyős élsimításának minősége nagyon hasonló, különösen, ha figyelembe vesszük a szoftveres élsimítási módszerek széleskörű elterjedését, amelyek minden GPU-n végrehajtott utófeldolgozó szűrőket használnak.

Ugyanez vonatkozik a textúra szűrésre is - most már olyan a minősége, hogy nagyon nehéz különbséget tenni az AMD és az NVIDIA megoldások között, még ha pixelenként összehasonlítjuk is. A Radeon HD 6900 -ban - a cég előző generációjában - az anizotróp szűrés még egy kicsit javult, és most már a "mikroszkóp" sem segít abban, hogy jelentős hibákat találjanak. Az egyetlen megjegyzés az, hogy a Radeon videokártyák némileg gyengébbek voltak, mint a mozgásban lévő GeForce, az észrevehetőbb specifikus műtermékek, például a "zaj" vagy a "homok" miatt.

Az új generációs videochipek megjelenésével a textúraszűrő texelsúlyait ismét felülvizsgálták, úgy módosították őket, hogy csökkentsék a Radeon HD 6900-on néha előforduló műtermékeket bizonyos típusú textúrák (nagyfrekvenciás) jelenlétében. , például éles átmenetekkel a sötétből a világosba). A minőségi változásokat olyan nehéz példákkal kimutatni, hogy az AMD nem ad összehasonlító képeket a HD 7900-ról a HD 6900-hoz, hanem egyszerűen összehasonlítja a "hardveres" algoritmus minőségét egy tisztán szoftveres algoritmussal, amelyet GPU stream processzorokon hajtanak végre, és ezért ideál:

Egy ilyen kis képernyőképen nem látszik a minőségbeli különbség, de az AMD biztosítja, hogy az elvégzett változtatások nem okoztak teljesítménycsökkenést, és egyik szempontból sem rontották a képminőséget - ez továbbra sem függ a szögtől, ill. a szűrési minőség közel ideális. Az egyik jövőbeni gyakorlati anyagban ezt mindenképpen ellenőrizni fogjuk.

Részben rezidens textúrák

A Partially Resident Textures (PRT) mögött meghúzódó ötlet a bemutatott GPU – virtuális memória – hardveres képességeinek felhasználása. Bizonyára sok felhasználó látta már az id Software RAGE játékát, amely a "MegaTexture" nevű virtuális textúra technológiát alkalmazza, amely hatalmas mennyiségű textúra adat felhasználását és videomemóriába való streamelését teszi lehetővé.

A virtuális videomemória használatával nagyon könnyű hatékony hardveres támogatást szerezni az ilyen algoritmusokhoz, amely lehetővé teszi akár 32 terabájt textúrák használatát egy alkalmazásban, amely lehetővé teszi egyedi helyek létrehozását a játékokban, textúrák ismétlődése nélkül, a textúraadatok betöltésével kapcsolatos problémák nélkül. Igaz, az AMD túl furcsa szemléltető példát ad, amiből semmi sem derül ki különösebben:

A PRT lehetővé teszi a kiváló képminőség elérését, és segít a videomemória hatékonyságának javításában. Az ehhez hasonló algoritmusok már használatban vannak az id Software motorjában, és várhatóan számos következő generációs motorban is megjelennek majd. A jövő játékainak hatalmas adatmennyiséggel kell dolgozniuk, és az új GPU előnye, hogy a helyi grafikus memória az algoritmusokban a la PRT úgy működik, mint egy hardveres cache memória, és szükség esetén textúrák kerülnek bele. A Southern Islands család GPU-i 32 terabájtig (akár 16384 × 16384 felbontásig) támogatják a "mega-textúrákat", és ami a legfontosabb, a hardveres textúra szűrést, ami a korábbi videochipeken nem érhető el.

A virtuális textúrák 64 kilobájtos darabokra vannak osztva (kilobyte, nem texel), és ez a darabméret rögzített. És ezek közül csak azok kerülnek be a videokártya helyi memóriájába, amelyekre az aktuális képkocka renderelésekor szükség van. A technológia a textúra formátumtól függetlenül működik, csak a darabok mérete texelben különbözik. Például egy normál tömörítetlen textúra esetén, színenként 32 bittel, a darab mérete 128 × 128 texel, DXT3 formátumban tömörített esetén pedig 256 × 256 texel.

A technológia feltételezi a texture mip-levelek (a textúra szűrésére használt kicsinyített másolatok) használatát is. Rendereléskor és szűréskor többszörös hozzáférést igényelnek. Tekintsük az algoritmus működését egy példa segítségével.

Ezen az ábrán négy különböző darabot emeltünk ki a különböző mip szintekből a megjelenítéshez. Amikor egy shader program adatokat kér tőlük, a darabok egy része már a helyi memóriában van, és ezek az adatok azonnal elküldésre kerülnek a shadernek további számításokhoz. De néhány darab hiányzik a táblázatból, és az alkalmazásnak döntenie kell, hogy követi-e ezt a hiányosságot. Például kérhetsz adatokat egy kisebb felbontású mip-szintről, akkor a kép homályos lesz, de legalább az igazságnak tűnik, és késedelem nélkül renderelődik. És mire a következő képkocka renderelésre kerül, már betölthető a gyorsítótárba - a helyi videomemóriába. A RAGE játékosok megértenek minket.

Ez egy hatékony algoritmus, amely lehetővé teszi hatalmas textúrák használatát, amelyek mindegyik objektumhoz egyediek. Hasonló algoritmusokat régóta használnak az offline renderelésben, kivéve a valós idejű számítások szükségességét. Az AMD még egy bemutató programot is készített a Walt Disney Animation Studios által az animációs filmekhez kifejlesztett Per-Face Texture Mapping technikával. Sajnos a demó még nem készült el, és csak alacsony felbontású képernyőképeket láttunk.

Ennek a textúra-leképezési technikának az a lényege, hogy minden sokszöghez hozzárendelünk egy bizonyos textúradarabot anélkül, hogy UV-transzformációt kellene alkalmazni (a háromdimenziós objektum felületének koordinátái és a kétdimenziós koordináták közötti megfelelés megtalálása). struktúra). Ez a megközelítés megold néhány problémát a mozaikszerű tartalom létrehozásával azáltal, hogy nagyon egyszerűvé teszi az eltolásleképezési algoritmust. Ebben a módszerben a PRT-t a hatékony tárolásra és a textúraadatokhoz való hozzáférésre használják.

Médiakezelési utasítások

Érdekes újításnak tűnik a Déli-szigeteken a statikus és dinamikus képfeldolgozásban használt speciális utasítások támogatása. Például az abszolút különbségek összege, ismertebb nevén SAD (abszolút különbségek összege) széles körben használt utasítást továbbfejlesztették. A végrehajtás sebessége nagyon kritikus szűk keresztmetszet számos kép- és videóadat-feldolgozási algoritmus teljesítményében, mint például a mozgásérzékelés, a gesztusfelismerés, a képkeresés, a számítógépes látás és sok más.

De az ősi Radeon HD 5870 videokártya áttekintésében már írtunk az SAD támogatásáról. Most a szokásos SAD (4 × 1) mellett a Southern Islands rendelkezik egy új utasítással - QSAD (Quad SAD), amely a SAD-t a műszakkezelőkkel kombinálja a teljesítmény és az energiahatékonyság növelése érdekében, valamint egy "maszkoló" utasítást az MQSAD, amely figyelmen kívül hagyja a háttér képpontjait, és a keretben lévő mozgó objektumok háttértől való elkülönítésére szolgál.

Az új GPU-k GCN számítási egységenként akár 256 pixelt is képesek feldolgozni órajelenként, ami az AMD Radeon HD 7970 modell esetén 8 bites egész színértékek esetén akár 7,6 billió pixelt is képes kezelni másodpercenként. Bár ez elméleti adat, az új GPU-k vizuális feldolgozási képességei lenyűgözőek – számos videófeldolgozási feladat valós időben is végrehajtható.

PCI Express 3.0

A PCI Express harmadik verziójának támogatása mellett nem tudtuk elmenni a dél-szigeteki új grafikai megoldások teljes sorát. Ez a támogatás eléggé várt volt, hiszen a PCI Express harmadik verziójának specifikációit végül 2010 őszén hagyták jóvá, de hardveres megoldások továbbra sem voltak a támogatásával, bár már jelennek meg az alaplapok, a videókártyák a végén megjelentek. 2011, és ott vannak a megfelelő központi processzorok.

A frissített interfész átviteli sebessége 8 gigatranzakció másodpercenként a 2.0-s verziónál 5 GT/s helyett, a sávszélessége pedig ismét megduplázódott (akár 32 Gb/s), a PCI Express 2.0 szabványhoz képest. Az új busz más kódolási sémát használ a buszon keresztül küldött adatokhoz, de a korábbi PCI Express verziókkal való kompatibilitás megmaradt.

Az első, PCI Express 3.0 támogatással rendelkező alaplapokat 2011 nyarán mutatták be, elsősorban Intel Z68 lapkakészletre épülve, és csak ugyanazon év őszén jelentek meg a piacon. A videokártyák tehát időben megérkeztek, és az AMD a legfejlettebb technológiákat támogató új grafikus processzorok megjelenési sebességét tekintve ismét megelőzte a többieket. De még túl korai megítélni, hogy a PCI-E 3.0-nak lesz-e gyakorlati haszna.

AMD PowerTune technológia

A Cayman egyik legizgalmasabb újítása a PowerTune fejlett energiagazdálkodási technológiája volt. A rugalmas GPU energiagazdálkodást régóta használják, de a Radeon HD 6900 előtt mindezek a technológiák meglehetősen primitívek voltak, és többnyire szoftveres módszerek voltak, és fokozatosan változtatták a frekvenciát és a feszültséget, nem tudták kikapcsolni a videochipek nagy részét.

Még a Radeon HD 5000 családban is megjelent egy teljesítménykorlátozó egy bizonyos fogyasztási szint túllépése esetén, a Radeon HD 6900-ban pedig minőségileg új szintre lépett a rendszer. Ehhez a chip minden blokkban speciális érzékelőket tartalmazott, amelyek nyomon követik a terhelés paramétereit. A grafikus processzor folyamatosan méri a terhelést és az energiafogyasztást, és nem engedi, hogy ez utóbbi túllépjen egy bizonyos küszöböt, automatikusan beállítja a frekvenciát és a feszültséget, hogy a paraméterek a megadott hőcsomagon belül maradjanak.

A korai energiagazdálkodási technológiákkal ellentétben a PowerTune közvetlen szabályozást biztosít a GPU energiafogyasztása felett, szemben a frekvenciák és feszültségek változtatásával történő közvetett szabályozással. Ez a technológia segít magas GPU-frekvenciák beállításában, nagy teljesítmény elérésében a játékokban, és nem fél attól, hogy a fogyasztás túllépi a biztonságos határokat. Végül is a legtöbb GPU-számítást használó játéknak és általános alkalmazásnak lényegesen alacsonyabb az energiaigénye, és nem felel meg a veszélyes energiafogyasztási határértékeknek, ellentétben az olyan stabilitási tesztekkel, mint a Furmark és az OCCT.

A legnehezebb játékok sem igényelnek maximális fogyasztást, és ha a videokártyák extrém tesztekkel történő tesztelésével korlátozzuk a frekvenciafogyasztást, akkor a 3D-s játékok esetében elég sok kihasználatlan teljesítmény- és teljesítménylehetőség lesz. Abban az esetben, ha a videokártya nem érte el a biztonságos fogyasztási szintet, a GPU a gyárilag beállított frekvencián fog működni, a FurMark és OCCT teszteknél pedig a GPU frekvenciája csökken, hogy a fogyasztás határain belül maradjon.

Ily módon a PowerTune segít magasabb gyári frekvenciák beállításában és a rendszer hangolásában, hogy a lehető legtöbbet hozza ki a GPU erőforrásaiból a maximális energiafogyasztás mellett. A fent bemutatott példában a HD 5870 nem használja a PowerTune-t, és a GPU-frekvencia-korlátozás miatt a nagy fogyasztás miatt a tartóssági tesztekben nem használja ki minden képességét. Míg a maximális TDP a Radeon HD 7970-hez van beállítva, és a videochip csak akkor csökkenti a frekvenciát, ha ezt túllépi, így minden alkalmazásban a lehető legnagyobb teljesítményt éri el.

Ez jól látható a következő ábrán. A játékalkalmazások esetében a TDP a GPU frekvenciájának növelésével érhető el, csúcsterheléseknél pedig tartóssági tesztekkel a frekvencia biztonságos energiafogyasztási szintre csökkenthető. A PowerTune nélkül választania kell – vagy a videokártya meghibásodásának valószínűségét szeretné elérni hosszan tartó FurMark és OCCT működés esetén, vagy csökkentenie kell a lehetséges teljesítményt a játékokban. Az új technológia a lehető leghatékonyabban oldja meg ezeket a problémákat.

Az AMD PowerTune gyorsan reagál a változó körülményekre (mikroszekundum), mivel ez egy hardver technológia. Rugalmas frekvenciabeállítással is megkülönböztethető, és nem lépcsőzetesen, mint az előző chipeknél. Minden mérés független a meghajtótól, de a felhasználó módosíthatja a videokártya beállításai segítségével.

A PowerTune és a korábban elfogadott megközelítés között az a különbség, hogy más esetekben termikus fojtásvédelmet alkalmaznak, ami jelentősen csökkentett fogyasztású üzemmódba állítja a GPU-t, a PowerTune pedig egyszerűen fokozatosan csökkenti a frekvenciáját, ezzel a beállított határértékre hozza a GPU-fogyasztást. Ez magasabb órajelet és nagyobb teljesítményt ér el.

AMD ZeroCore technológia

Az AMD nem korlátozódott a korábbi megoldásokból már ismert energiagazdálkodási technológia alkalmazására. A Southern Islands család első lapkáiban bevezeti az AMD ZeroCore technológiát, amely „mély üresjárati” (vagy „alvó”) üzemmódban segít még nagyobb energiahatékonyság elérésében, kikapcsolt megjelenítőeszköz mellett, amit minden operációs rendszer támogat. .

Végül is szinte minden rendszer, még egy játékrendszer is, ideje nagy részét a grafikus processzor alacsony terhelésű üzemmódjában tölti. És a videokártya nem fogyaszthat sok energiát ebben az üzemmódban. És még inkább, nem beszélve a kikapcsolt monitor melletti üzemmódról – ebben az esetben célszerű a GPU-t teljesen letiltani. Ezt tette az AMD. A ZeroCore-nak köszönhetően az új GPU az energia kevesebb mint 5%-át fogyasztja teljes üzemmódban mély üresjárati állapotban, ami a legtöbb funkcionális blokkot letiltja ebben az üzemmódban.

Az AMD sematikus összehasonlítást ad saját Radeon HD 5870-ével, amely nem támogatja ezt a technológiát. A ZeroCore egy exkluzív déli szigeteki innováció, amely a notebook számítógépekhez tervezett mobil GPU-k asztali megoldásaihoz érkezik. Egyébként ennek a technológiának az előnyei nem csak a csökkentett fogyasztáshoz kapcsolódnak. Ráadásul a hosszú üresjárati üzemmódban a kijelző kikapcsolásakor a videokártya a ventilátort is teljesen kikapcsolja a videokártya hűtőjén!

Sok felhasználó pontosan erre várt. A legérdekesebb, hogy adataink szerint a hasonló PowerTune és ZeroCore megoldások laboratóriumi vizsgálatai több generációval ezelőtt zajlottak a videokártyáknál. A forgalomból régóta kikerült AMD sorozatú videokártyák mérnöki mintái pontosan így működtek, üresjáratban teljesen kikapcsolták a hűtőt.

De nem csak az egy GPU-t használók profitálnak az AMD új, ZeroCore-kompatibilis grafikus kártyáinak csökkentett zajából és energiafogyasztásából. Hasonló fejlesztésekre számítanak a két, három vagy akár négy GPU-ra épülő CrossFire rendszerek boldog tulajdonosai. Végül is logikus, hogy az operációs rendszer kétdimenziós interfészének renderelési módjában a fő kivételével az összes videokártya egyáltalán nem működhet? De most így működnek!

A 2D módban ZeroCore-támogatással rendelkező videokártyákon lévő CrossFire rendszerek esetében az összes másodlagos videokártya mély alvásba merül, minimális energiafogyasztással és letiltott hűtővel. Ez a mód több egylapkás videokártya és kétchipes megoldás esetén is működik. Ezenkívül az elsődleges CrossFire grafikus kártya is ebbe a módba kerül a Windows rendszerben konfigurált meghosszabbított üresjárati idők esetén. Nyilvánvaló, hogy a munka különbsége így néz ki:

Egyébként a technológia nem olyan egyszerű, mint amilyennek látszik. Az AMD mérnökeinek rengeteg problémát kellett megoldaniuk az operációs rendszer készenléti üzemmódban való működésével kapcsolatban. Például rájöttek, hogy a Windows akkor is megpróbálja frissíteni a képernyőn megjelenő információkat, ha a monitor ki van kapcsolva. Ami persze egyáltalán nem teszi lehetővé a GPU letiltását. Ezért a cég programozóinak körpályát kellett megtenniük, figyelmen kívül hagyva a képernyő megrajzolásához szükséges összes parancsot, amikor a monitor kikapcsolt állapotban volt.

AMD Eyefinity 2.0 technológia

Az új architektúra természetesen a képek több monitoron való megjelenítésére szolgáló bevált technológián – az immár 2.0-s verziójú AMD Eyefinity – is helyet kapott a fejlesztések terén. Új képességekkel, nagyobb felbontással, több kijelző támogatásával és nagyobb rugalmassággal rendelkezik.

Ez a technológia meglehetősen érdekes, bár rendkívül kis számú felhasználó talál majd helyet a szobában, és van bátorsága egy család előtt kettőnél több monitor felszereléséhez. De jobb, ha mindig tudja használni, mint ha egyáltalán nem rendelkezik vele. Ráadásul a nagy átlós monitorok árai szinte nem csökkennek, a középkategóriás megoldások viszont folyamatosan olcsóbbak.

Valójában most jövedelmezőbb három 24-es "monitort" venni, mint egy 30-ast. Az AMD erre ad példát, amikor egy 30 hüvelykes, 2560 × 1600-as felbontású monitor több mint 1000 dollárba kerül, és három darab 24 hüvelykes FullHD feleannyiért vásárolható meg:

De az, hogy hogyan költse el a pénzt és a helyet a szobában, minden felhasználó személyes dolga. A lényeg, hogy van ilyen lehetőség. Ráadásul az Eyefinity 2.0 már támogatja a HD3D sztereó módban történő videokimenetet – ez hiányzott a korábbi megoldásokból, amelyek ebben a paraméterben rosszabbak voltak, mint a versenytársak. Az AMD Eyefinity és a HD3D technológiákat ötvöző Radeon HD 7970 grafikus kártya az első olyan egychipes megoldás, amely három sztereóban működő monitort támogat.

A nagy felbontású sztereó renderelés nagyon gyors adatfelületet igényel. A HDMI-kimenetek korábbi verzióinál pedig a lehetőségek 24 Hz-re korlátozódtak szemenként, ami Blu-ray 3D filmek nézéséhez elég jó, de a játékosoknak túl kevés.

Az ilyen feladatokhoz elkezdték használni a keretcsomagolási formátumot, amikor a bal és a jobb szemhez tartozó kereteket egyesítik, és az AMD Radeon HD 7970 támogatja a HDMI 1.4a keretcsomagolási formátumot a sztereó képek kimenetére. Ez az első grafikus kártya, amely támogatja a 3 GHz-es HDMI-t keretcsomagolással, amikor minden szemnek 60 Hz-es (összesen 120 Hz) frekvenciájú FullHD képe van:

További érdekes újdonságnak tűnik számunkra a Discrete Digital Multi-Point Audio (DDMA) technológia, amely az Eyefinity-vel együtt működik. Az összes korábbi GPU csak egy audio adatfolyamot képes kiadni HDMI-n és DisplayPorton keresztül. Vagyis még akkor is, ha három, különböző helyiségekben található monitor csatlakozik a számítógéphez HDMI-n keresztül, csak egy hangcsatorna kerül átvitelre. Az AMD Radeon HD 7900 azonban több független audiocsatorna egyidejű kimenetének támogatását is megkapta, ami bizonyos többmonitoros konfigurációknál jól jöhet.

Ugyanez a funkció nagyon hasznos lesz a videokonferenciák területén, ahol több beszélgetőpartner kimenete külön képernyőn történik, valamint többfeladatos alkalmazásokhoz, például játékhoz három monitoron játék audio kíséretében és hírek megtekintése külön képernyőn, független képernyőn. hangfolyam. Korábban mindehhez több különálló audiorendszert kellett használni, de most már minden a lehető legkényelmesebben működik.

Nem feledkeztek meg az Eyefinity szoftvertámogatásról sem, szinte havonta frissül a technológia - új lehetőségek jelennek meg. Tehát még októberben megjelent az 16384 × 16384 felbontásig terjedő felbontás támogatása, és új többmonitoros konfigurációk: vízszintes és függőleges 5 × 1, valamint hat monitor 3 × 2 módban.

Az AMD Catalyst videó-illesztőprogram decemberi frissítése az Eyefinity és a HD3D együttműködését hozza létre, februárban pedig az egyéni felbontások, a tálcaelhelyezési beállítások és a továbbfejlesztett előre beállított kezelés támogatását ígéri.

Két DisplayPort 1.2 port és két MST hub segítségével hat monitor jeleníthető meg (amiről korábban írtunk), három vagy akár négy monitorhoz pedig csak egy portra és a hozzá tartozó hubra lesz szükség. Ezek a hubok lehetővé teszik a kijelzőrendszer rugalmas konfigurálását, DisplayPort 1.2-es csatlakozónként akár négy FullHD-eszközt is támogatnak, és 2012 nyarára várhatóak.

Apropó felbontás. Nagy felbontás vagy akár ultra nagy - Ultra High Resolution. A jelenlegi, 4000 pixeles felbontású készülékek többnyire több kábelt igényelnek egyszerre: két DP 1.1 vagy négy DVI. A következő generációs ilyen felbontású monitorok egyetlen kábellel csatlakoztathatók: DP 1.2 HBR2 vagy HDMI 1.4a 3 GHz. Az AMD új videokártyája pedig már készen áll az ilyen monitorokhoz, ismét ez lett az első a világon.

Videó kódolás és dekódolás

Teljesen természetes, hogy az AMD Radeon HD 7970 ugyanazt az UVD egységet tartalmazza a videó adatok dekódolására, mint ami a cég videochipeinek előző generációjában is megjelent. Egyszerűen nem igényel fejlesztést, támogatja a többfolyamos MVC kodeket, MPEG-2 / MPEG-4 (DivX), VC-1 és H.264 formátumok dekódolását, valamint két FullHD adatfolyam dekódolását az összes támogatottban formátumok.

Az AMD-megoldások biztosítják a videofolyam-dekódolás maximális minőségét, több tucat speciális algoritmust használnak a minőség javítására, és maximális eredményt biztosítanak az olyan minőségi teszteknél, mint a HQV. A támogatott funkciók közül megjegyezzük: szín- és tónusszabályozás, zajcsökkentés, élesítés, kiváló minőségű skálázás, dinamikus kontraszt, fejlett deinterlacing és inverz telecine. Íme egy példa a kontraszt menet közbeni javítására:

De a dekódolással az összes videochip többé-kevésbé rendben van már régóta. Minden új GPU megfelelő minőséget és teljesítményt biztosít a videoadatok megtekintésekor. De a videokódolás a GPU-n még gyerekcipőben jár, és a felhasználók fő panaszai a tömörített kép gyenge minőségére vonatkoznak.

Talán az új Radeon HD 7000-es széria tud majd ezen segíteni, mert a sorozat összes grafikus processzorában van Video Codec Engine (VCE). A Radeon HD 7970 modell lett az első olyan videokártya, amely támogatja a hardveresen gyorsított videókódolást és -tömörítést speciális egységgel (korábban a stream processzorok vettek részt a kódolásban).

A minőségnek és a teljesítménynek egyértelműen jobbnak kell lennie, mint korábban, az 1080p kódolás támogatott 60 képkocka/másodperc sebességgel, és még gyorsabb is, mint a valós időben. Tesztek nélkül nehéz bármit is mondani a minőségről, de ígéretet kapunk a videó adatokhoz és a játékokhoz különböző szintű kódolóoptimalizálást, valamint változó tömörítési minőséget (a minőség vagy a teljesítmény közötti választás lehetősége).

Egyelőre nincs hol kipróbálni a VCE-t – egyszerűen nincsenek olyan alkalmazások, amelyek támogatnák, de az AMD olyan partnerekkel dolgozik együtt, mint az ArcSoft, hogy támogatást nyújtson a VCE-hez a megfelelő szoftvertermékeikben. A tervek szerint egy jövőbeli videókódolási gyorsítószoftver-könyvtárat készítenek, amely megkönnyíti a fejlesztők számára a következő generációs AMD-termékek támogatását.

A kódolás két módban hajtható végre: teljes és hibrid (a GPU stream processzorok képességeit kihasználva). A Full Mode olyan alkalmazásokhoz készült, amelyek maximális energiahatékonyságot és egyenletes teljesítményszintet igényelnek. A VCE teljes módú kódolása gyorsabb, mint a valós idejű, és alacsony késleltetést biztosít. De van hibrid üzemmód is:

Ebben a módban a GPU matematikai egységek együttműködnek a VCE-vel. A diagramon sárgával kiemelve minden jól párhuzamosítható fokozat használhatja a GCN számítási egységek teljesítményét, és a dedikált VCE egység hatékony hardveres entrópia kódolást végez. Ez a mód kiválóan alkalmas a nagy matematikai teljesítményű videokártyákhoz, mint például a Radeon HD 7970. A kérdés továbbra is a két mód minőségével kapcsolatos, de ez egy külön cikkben alapos elemzést igényel.

AMD állandó videó

A videó adatok kódolása és dekódolása mellett van egy másik alkalmazási terület az AMD új grafikáinak erejének - a rossz minőségű kézi videók javítása állvány vagy más hasonló képstabilizáló eszközök használata nélkül. A videóstabilizáló technológia az AMD Steady Video nevet viseli, és már megjelent a második verziója.

A szoftveres stabilizátor algoritmusa meglehetősen egyszerű: a videó adatfolyam alapján statisztikákat gyűjtenek a kamera mozgásáról (eltolás, forgatás, zoom), és ezt a mozgást az aktuális képkockában kompenzálja a korábbiakhoz képest - a kép eltolva, elforgatva és méretezve, hogy a kép ne ugorjon sokat és stabil maradjon.

Amilyen egyszerű szavakban, olyan nehéz megvalósítani. Csak azért, mert kétmillió pixel van a képernyőn, és másodpercenként akár 30 vagy akár 60 képkocka is. Képzelje el, hány számítást kell elvégeznie az összes lehetséges képkocka-eltolódás nyomon követéséhez. Fentebb már írtunk a videófeldolgozásban használt QSAD funkcióról, illetve a Steady Video 2.0-ban is használják a mozgásérzékelő algoritmus gyorsítására. Tehát a GPU-nak bármilyen irányban akár 32 pixel amplitúdójú véletlenszerű eltolásokat is kezelnie kell, ehhez pedig másodpercenként több mint 500 milliárd SAD műveletnek megfelelő teljesítményre van szükség (1920 × 1080 esetén 60 FPS-en).

A Radeon HD 7970 új QSAD utasításainak támogatása révén előnye a nagy teljesítményű CPU-kkal szemben a mozgásérzékelő algoritmusban meghaladja a 10-szeresét! Vagyis most jó minőségű videót kapunk, és nem csak az otthoni videók videószerkesztőben való feldolgozásakor, hanem valaki más online videóinak megtekintésekor is, amelyeket senki sem tudja, mit és ki hogyan filmezett.

Részletek: Radeon HD 7800 sorozat

  • Chip kódneve: "Pitcairn"
  • Gyártási technológia: 28 nm
  • 2,8 milliárd tranzisztor (valamivel több, mint a Radeon HD 6900 sorozatot hajtó Cayman)
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek stb.
  • Hardver támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0-t is
  • 256 bites memóriabusz: négy 64 bites vezérlő GDDR5 memória támogatásával
  • Magfrekvencia: akár 1000 MHz (Radeon HD 7870 esetén)
  • 20 GCN számítási egység, köztük 80 SIMD mag, összesen 1280 ALU-ból áll a lebegőpontos számításokhoz (egész és lebegőpontos formátumok, FP32 és FP64 precíziós támogatás az IEEE 754 szabványon belül)
  • 80 textúraegység, amely támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 32 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezési lehetőségével, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 32 minta ciklusonként, és csak Z módban - 128 minta ciklusonként

A Radeon HD 7870 grafikus kártya műszaki adatai

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 1280
  • Textúra egységek száma: 80, keverési egységek: 32
  • Memória típusa: GDDR5
  • Memória kapacitása: 2 gigabájt
  • Maximális elméleti kitöltési sebesség: 32,0 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 80,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-175 W
  • Két 6 tűs tápcsatlakozó
  • Kétnyílásos kialakítás
  • MSRP: 349 USD

A Radeon HD 7850 grafikus kártya műszaki adatai

  • Magfrekvencia: 860 MHz
  • Univerzális processzorok száma: 1024
  • Textúra egységek száma: 64, keverési egységek: 32
  • Effektív memóriafrekvencia: 4800 MHz (4 × 1200 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 2 gigabájt
  • Memória sávszélessége: 153,6 gigabájt másodpercenként
  • Maximális elméleti kitöltési sebesség: 27,5 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 55,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-130 W
  • Kétnyílásos kialakítás
  • MSRP: 249 USD

És ezúttal sem változtattak a cég termékeinek elnevezésének elvén, és az előző sorozat trendjeit folytatták. A GCN architektúrára épülő, közepes költségvetésű videokártyák sorozata az index második számjegyével tér el a felső és költségvetési soroktól: a 7 és a 9 helyett a 8-as szám kerül, ami teljesen logikus. Mivel az AMD átvette az 1000 MHz-es lélektani határt a GPU-frekvenciánál, a Radeon HD 7870 "GHz Edition" kiegészítést kapott a nevéhez, jelezve, hogy ezt a frekvenciát vették.

A névből kitűnik, hogy a Radeon HD 7800 termelékenyebb, mint a HD 7700, de kisebb sebességgel rendelkezik, mint a régebbi modellek - HD 7900. Ami az NVIDIA megoldásokkal való összehasonlítást illeti, a régebbi HD 7870 modell a HD 7900-hoz képest. kiadás a GeForce GTX 570-es videokártyával vetekszik, a legfiatalabb pedig a GTX 560 Ti elleni harcot célozza, az NVIDIA pedig eddig nem adott ki új, középkategóriás, 28 nm-es chipeket.

Az AMD videokártya mindkét modellje azonos, 2 gigabájt kapacitású GDDR5 memóriával rendelkezik. Mindkettő 256 bites memóriabuszt használ, így 1 GB, 2 GB vagy 4 GB is belefér. 1 gigabájt kevés, 4 GB pedig túl drága ehhez az árszegmenshez. Ezért elmondhatjuk, hogy az ideális 2 GB-os videomemória mennyiségét választották, ami a játékok túlnyomó többségéhez még nagy felbontásban is elegendő, és költség szempontjából nem túl drága.

Egyébként fogyasztói szempontból a HD 7850 és a HD 7870 még mindig különbözik. A régebbi Radeon HD 7870 nagyobb fogyasztású, ezért két további 6 tűs tápcsatlakozót igényel, a HD 7850 pedig csak az egyikkel elégszik meg. Mindkét kártya kétnyílásos hűtőrendszerrel rendelkezik, de a legtöbb gyártó saját tervezésű kártyákat gyárt, legalább hűtővel, vagy akár nyomtatott áramköri lappal.

A Radeon HD 7800 család építészeti jellemzői

Fent a szövegben alaposan leírtuk az új architektúra Graphics Core Next (GCN) összes jellemzőjét, így csak a legfontosabbakat ismételjük meg. A cég minden új grafikus processzora kiváló képességeket és teljesítményt kínál nemcsak a grafikus feldolgozásban, hanem a nem grafikus számítástechnikában is, beleértve a különféle számítástechnikai típusok keverékét is. Az új GCN architektúra emellett jelentősen leegyszerűsíti a kódoptimalizálási feladatokat, leegyszerűsíti a fejlesztést és a karbantartást, valamint stabil és kiszámítható teljesítményt és általában véve meglehetősen magas hatékonyságot.

Az új architektúra alapvető építőeleme a GCN blokk, ebből rakják össze a Southern Islands sorozat összes GPU-ját. Tekintsünk egy Pitcairn chip blokkdiagramját:

Az ábrán a Radeon HD 7870 grafikus processzor látható (az "egyszerűsített" HD 7850 több letiltott blokkban különbözik tőle), a GCN architektúra 20 számítási blokkját látjuk. A Radeon HD 7800-as sorozat junior megoldása esetében ebből négyet letiltottak, és az aktív blokkok száma benne 16. Ez 1280, illetve 1024 stream processzornak felel meg (akárcsak a HD esetében). 7700 család, csak pontosan kétszer annyi blokk van) ... Mivel minden GCN-egység négy textúraegységet tartalmaz, a TMU-k teljes száma a régebbi modellben 80 TMU, a fiatalabb modellben pedig 64 TMU.

De a ROP-ok és a memóriavezérlők száma a HD 7870-ben és a HD 7850-ben sem különbözik, mint a legfiatalabb vonal megoldásaiban. A ROP egységek száma meglehetősen magas maradt - mindkét modellnél 32 darab. A Pitcairn alapú alaplapok memóriabuszát 256 bitesre csökkentették, négy 64 bites csatornából rakják össze. Ez nem rossz egy ilyen szintű megoldásnál, bár másfélszer kevesebb, mint a felső sorban, mert hagyományosan a memóriabuszt vágják le először. Jó, hogy a gyors GDDR5 memória használata viszonylag nagy, 153 GB/s sávszélességet adott.

A többi GCN architektúra chiphez hasonlóan a Pitcairn is tartalmaz egy 9. generációs tessellátor blokkot, amely számos pufferelési és gyorsítótárazási optimalizálást tartalmaz, amelyek jelentősen javítják a geometria feldolgozási teljesítményét. Íme az AMD új tábla összehasonlítása az előző generációs megoldással egy szintetikus problémában, amely szerint a tesszellációs sebesség akár négyszeresére is nőhet:

Hasonlóképpen számos AMD technológia támogatott, amelyeket a Radeon HD 7000 sorozat új videochipjeiben implementáltak és továbbfejlesztettek, ezek hiányos listája: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, javított textúra szűrési minőség stb. Mindezt fentebb részletesebben ismertetjük. Tegyük hozzá a listához, hogy a Radeon HD 7800 teljes mértékben támogatja mind a továbbfejlesztett MLAA 2.0 élsimító algoritmust, mind a szupersampling anti-aliasingot (SSAA).

Ami a játékokban nyújtott teljesítmény összehasonlítását illeti, a Radeon HD 7870 lényegesen gyorsabb közvetlen versenytársánál, a GeForce GTX 570-nél, főleg, hogy utóbbiból hiányzik 1,25 GB videomemória (szemben a kérdéses megoldások 2 GB-jával). megfigyelhető a modern játékokban nagy felbontású... A fiatalabb Radeon HD 7850 összevethető a GeForce GTX 560 Ti-vel, és itt már nem büszkélkedhet a memória mennyiségével. Ennek ellenére az AMD mérései szerint új megoldásuk a legtöbb játékban még mindig gyorsabb, mint a versenytárs.

Részletek: Radeon HD 7700 sorozat

  • Chip kódneve: "Zöld-foki Köztársaság"
  • Gyártási technológia: 28 nm
  • 1,5 milliárd tranzisztor (kevesebb, mint a Barts, amely a Radeon HD 6800 sorozat magja)
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek stb.
  • Hardver támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0-t is
  • Magfrekvencia: akár 1000 MHz (Radeon HD 7770 esetén)
  • 10 GCN számítási egység, köztük 40 SIMD-mag, összesen 640 ALU-ból áll a lebegőpontos számításokhoz (egész és lebegőpontos formátumok, FP32 és FP64 precíziós támogatás az IEEE 754 szabványon belül)
  • 40 textúraegység, amely támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • Integrált támogatás akár hat monitorhoz, beleértve a HDMI 1.4a-t és a DisplayPort 1.2-t

A Radeon HD 7770 grafikus kártya műszaki adatai

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 640
  • Textúra egységek száma: 40, keverési egységek: 16
  • Memória típusa: GDDR5
  • Memória kapacitása: 1 gigabájt
  • Elméleti textúra mintavételi sebesség: 40,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-80 W
  • Egy 6 tűs tápcsatlakozó
  • Kétnyílásos kialakítás
  • MSRP: 159 USD

A Radeon HD 7750 grafikus kártya műszaki adatai

  • Magfrekvencia: 800 MHz
  • Univerzális processzorok száma: 512
  • Textúra egységek száma: 32, keverési egységek: 16
  • Effektív memóriafrekvencia: 4500 MHz (4 × 1125 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 1 gigabájt
  • Memória sávszélessége: 72 gigabájt másodpercenként.
  • Maximális elméleti kitöltési sebesség: 12,8 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 25,6 gigatexel másodpercenként.
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, One DisplayPort 1.2
  • Áramfelvétel: 3-55 W
  • Nem igényel további tápegységet
  • Egyhelyes kialakítás
  • MSRP: 109 USD

Egy olcsó, GCN architektúrára épülő videokártya-sorozat az index második számjegyével különbözik a felső és a középső sortól: a 7-es a 9. helyet foglalta el, ahogy korábban is. A Radeon HD 7770 termelékenyebb megoldás, de van egy fiatalabb modell is - a HD 7750. Megjelenése idején a régebbi lapnak nem volt közvetlen versenytársa a piacon, valahol a GeForce GTX 560 és a GTX 550 Ti között helyezkedett el. , a fiatalabb pedig a GTX 550 Ti elleni harcot célozza. A HD 7770-hez később versenytársat jelentettek be a GeForce GTX 560 SE személyében (minden NVIDIA megoldás régi GPU-ra épül).

Mindkét vizsgált AMD videokártya modell azonos, 1 gigabájt kapacitású GDDR5 memóriával rendelkezik. A 128 bites memóriabusz használatának köszönhetően 2 GB-ot lehetett rájuk rakni, de egy ilyen mennyiségű GDDR5 memória túl drága lenne az árszegmensükhöz képest. Ezért eddig ilyen volumenű modellek jelentek meg, bár a jövőben megjelenhetnek 2 GB videomemóriás változatok is. Időközben úgy döntöttek, hogy ezt a hangerőt a HD 7800-nál hagyják.

Az egyéb fogyasztói jellemzőket tekintve a HD 7750 és a HD 7770 modellek meglehetősen különböznek egymástól. Ha a régebbi Radeon HD 7770 hűtőrendszere kétnyílásos kialakítású, és a hűtőjét a régebbi megoldásokhoz hasonlóan műanyag ház borítja, akkor a fiatalabb HD 7750 sokkal egyszerűbbnek tűnik, egy helyet foglal el, és egyszerű hűtővel rendelkezik. A legtöbb gyártó azonban továbbra is saját tervezésű alaplapokat gyárt. Az új modellek fogyasztása ebben az árkategóriában is eltérő, a régebbi egy 6 tűs kiegészítő tápcsatlakozóval rendelkezik, a fiatalabb pedig PCI Express-ből árazza az áramot.

A Radeon HD 7700 építészeti jellemzői

Az új architektúra alapblokkja a GCN blokk, és ebből rakják össze a sorozat összes GPU-ját. A rendelkezésre álló GCN-egységek mindegyike képes ütemezni és parancs-elosztást végezni, és egy számítási egység akár 32 független parancsfolyamot is végrehajthat. Vessünk egy pillantást a Zöld-foki-szigetek chip blokkvázlatára:

Az ábrán a Radeon HD 7770 grafikus processzor látható (a "lecsupaszított" HD 7750 több letiltott blokkban különbözik), a GCN architektúra 10 számítási blokkját látjuk. A Radeon HD 7700-as sorozat junior megoldása esetén kettő letiltása mellett döntöttek, a blokkok száma 8 lett. Ez 640 és 512 stream processzornak felel meg. És mivel minden GCN egység 4 textúra egységet tartalmaz, a régebbi modell TMU-inak teljes száma 40 TMU, a fiatalabb modell esetében pedig 32 TMU.

A HD 7770-ben és HD 7750-ben a ROP-ok és a memóriavezérlők száma nem tér el, a ROP-okat pedig úgy döntötték, hogy nem vágják túl sokat, így 16 darabban maradnak. De a Zöld-foki-szigeteki memóriabusz 128 bitesre csökkent, amely két 64 bites csatornából van összeállítva. Általánosságban elmondható, hogy ez háromszor kevesebb, mint a csúcsszériákban, és újabb megerősítést láttunk, hogy a memóriabusz hagyományosan elsősorban olcsó chipekben van lefaragva. Bár a gyors GDDR5 memória használata lehetővé tette egy viszonylag magas (ilyen olcsó megoldások esetén) 72 GB / s sávszélesség meghagyását.

Továbbra is meg kell jegyeznünk a meglehetősen nagy mennyiségű L2 gyorsítótárat - akár 512 KB (hasonlítsa össze a felső chip 768 KB-jával - úgy tűnik, az L2 gyorsítótár nem foglal túl sok helyet a chipen), valamint a fejlesztéseket. geometriai teljesítményben. A csúcskategóriás chiphez hasonlóan a Zöld-foki Köztársaság is rendelkezik egy 9. generációs tessellátorral, amely számos pufferelési és gyorsítótárazási optimalizálást tartalmaz, amelyek jelentősen javítják a geometriai teljesítményt a Radeon HD 6000 sorozathoz képest.

Általánosságban elmondható, hogy nem ismételjük meg az összes információt az AMD-technológiákról, amelyeket a Radeon HD 7000 sorozat új videó chipjeiben implementáltak és továbbfejlesztettek (itt egy hiányos lista: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, textúra szűrési minőségi fejlesztések stb.) .o.), minderről fentebb részletesebben írunk. A HD 7700 sorozat támogatja az ott felvázolt összes funkciót, beleértve az AMD Eyefinity 2.0-t hat monitorral és sztereó rendereléssel, valamint továbbfejlesztett videó dekódoló és kódoló egységgel.

De mi a helyzet a legfontosabb dologgal - a játékbeli teljesítménnyel? A renderelési sebesség első becslései mindig a gyártó prezentációi alapján tehetők. Az AMD úgy véli, hogy a Radeon HD 7770 valahol középen van a GeForce GTX 560 és a GeForce GTX 550 Ti között, és anyagában összehasonlítja a versenytárs második modelljével.

De nem hasonlítják össze semmivel a Radeon HD 7750-et, egyszerűen csak megjegyzik, hogy a legtöbb modern játék ezen a modellen maximálisan FullHD felbontásban játszható. Ez azonban nem meglepő, hiszen az utóbbi években gyakorlatilag nincs PC-exkluzív, és a többplatformos játékok sokkal kevésbé igényesek. A Radeon HD 7700 sorozatú kártyák tehát tökéletesek az igénytelen felhasználók számára.

Részletek: Radeon HD 7790 modell

  • Chip kódneve: "Bonaire"
  • Gyártási technológia: 28 nm
  • 2,08 milliárd tranzisztor (több, mint a Zöld-foki Köztársaság a Radeon HD 7700-ban, de kevesebb, mint a Pitcairn a Radeon HD 7800-ban)
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek stb.
  • Hardver támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0-t is
  • 128 bites memóriabusz: két 64 bites vezérlő GDDR5 memória támogatásával
  • Magfrekvencia: 1000 MHz
  • 14 GCN számítási egység, köztük 56 SIMD mag, összesen 896 ALU-ból áll a lebegőpontos számításokhoz (egész és lebegőpontos formátumok, FP32 és FP64 precíziós támogatás az IEEE 754 szabványon belül)
  • 56 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 16 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezési lehetőségével, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 16 minta ciklusonként, és csak Z módban - ciklusonként 64 minta

A Radeon HD 7790 grafikus kártya műszaki adatai

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 896
  • Textúra egységek száma: 56, keverési egységek: 16
  • Memória típusa: GDDR5
  • Memória kapacitása: 1 gigabájt
  • Memória sávszélessége: 96 gigabájt másodpercenként.
  • Maximális elméleti kitöltési sebesség: 16,0 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 56,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-85 W
  • Egy 6 tűs tápcsatlakozó
  • Kétnyílásos kialakítás
  • MSRP: 149 USD

Az új, közepes költségvetésű chipre épülő, olcsó videokártya-modell az index harmadik számjegyével tér el a HD 7700 alcsalád korábbi csúcsmodelljétől: 7 helyett 9-es számot tesznek, ami a teljesítmény növekedését jelzi. Ugyanakkor a Radeon HD 7790 index egyértelműen jelzi, hogy ez egy kevésbé termelékeny videokártya, összehasonlítva az egy lépéssel magasabb vonallal - HD 7800.

Azonban itt sem minden olyan egyszerű – a fiatalabb HD 7850-el biztosan tud majd vitatkozni. De a Radeon HD 7790 ajánlott ára 149 dollár, vagyis körülbelül félúton a HD 7770 és a HD 7850 ára között. Ami egy versenytárs megoldásait illeti, ugyanabból az árszegmensből, a HD megjelenését A 7790-nek egyértelműen az volt a célja, hogy legyen mivel küzdenie a GK106 chipre épülő NVIDIA GeForce GTX 650 Ti-vel, amely árban és sebességben a HD 7770 és a HD 7850 között helyezkedik el. Az NVIDIA azonban azonnal reagált az új alaplap AMD általi kiadására, és elindította a GeForce GTX 650 Ti Boost túlhajtható verzióját, amely hatékonyabb.

Az AMD videokártya ezen modellje mindössze 1 gigabájt kapacitású GDDR5 memóriával rendelkezik. A GPU 128 bites memóriabusszal rendelkezik, és elméletileg 2 GB-ot is lehetne szállítani, de ez a gyors GDDR5 memória még mindig túl drága ehhez az árszegmenshez, és az AMD kiadott egy kisebb volumenű modellt, bár néhányban modern játékoknál ez még a nem legmagasabb beállításokon és felbontásokon sem elég. A partnerek videokártyái azonban 2 GB videomemóriával is rendelkezésre állnak.

A kínálatban mellette álló modellekhez hasonlóan a Radeon HD 7790 is kétnyílásos hűtőrendszerrel rendelkezik, amelyet műanyag burkolat borít. Bár a legtöbb gyártó továbbra is ad ki saját hűvösebb kivitelű alaplapokat, így a hivatkozás nem olyan fontos. Érdekes módon az új modell fogyasztása nem nőtt túlságosan a HD 7770-hez képest, de az energiahatékonyság javulása várható volt. Nem mellesleg ezért az új termék is csak egy 6 tűs csatlakozóval rendelkezik a plusz teljesítmény érdekében.

Építészeti jellemzők

Az új Bonaire GPU, amelyre a kiadott Radeon HD 7790 modell épül, ugyanarra a Graphics Core Next (GCN) architektúrára utal, amelyet már másfél éve ismerünk, de az AMD apró változtatásokra utalva GCN 1.1-nek nevezi. Valójában a chip felépítésében gyakorlatilag megegyezik az előzőekkel, bár valóban vannak apró változtatások. Az új architektúra például bevezeti a Heterogeneous System Architecture (HSA) számára hasznos utasításokat, támogatja az egyidejűleg végrehajtott szálakat, valamint az AMD PowerTune technológia új verzióját, amelyről később még szó lesz. Mindezek a változások azonban nem nevezhetők jelentősnek, mert az alapblokkokban és azok hatékonyságának javításában nincs újdonság.

Ezért nyugodtan hivatkozhatunk arra, amely gondosan leírja az új architektúra Graphics Core Next (GCN) összes jellemzőjét, és itt csak az adott termék legfontosabb jellemzőit és jellemzőit ismételjük meg. Az AMD összes legújabb GPU-ja kiváló szolgáltatásokat és teljesítményt kínál mind grafikus, mind nem grafikus számítástechnika területén, beleértve a kettő keverékét is. Az új GCN architektúra nagymértékben leegyszerűsítette az optimalizálási és szoftverfejlesztési feladatokat, miközben megőrizte a magas hatékonyságot.

Mint ismeretes, az architektúra alapblokkja a GCN blokk, amelyből a Southern Islands sorozat összes GPU-ja van összerakva. A GCN számítási blokk alszakaszokra oszlik, amelyek mindegyike a saját parancsfolyamán működik. A GCN blokkok dedikált 64 KB-os helyi adattárral rendelkeznek az adatok cseréjéhez vagy a helyi regiszterverem bővítéséhez. A blokk emellett első szintű gyorsítótárral is rendelkezik olvasási/írási képességgel, valamint teljes értékű textúra csővezetékkel mintavételi és szűrőegységekkel. A rendelkezésre álló GCN egységek mindegyike képes a parancsok ütemezésére és elosztására, és egy számítási egység több független parancsfolyamot is végrehajthat. Vessünk egy pillantást az új chip blokkvázlatára:

A Bonaire áramkör megerősíti az új megoldás célját – a 10 GCN számítási egységgel rendelkező Zöld-foki-szigetek és a 20 GCN egységgel rendelkező Pitcairn között. Ez a két, 2012-ben megjelent GPU szinte pontosan a felével különbözik egymástól, így elég nagy teljesítménybeli rés van köztük középen, amit Bonaire most pótolt.

Az ábrán egy Radeon HD 7790 formájú grafikus processzor látható, amely egy teljes megoldás blokkvágás nélkül. A chip 14 GCN architektúrájú számítási egységet tartalmaz, ami 896 adatfolyam processzornak felel meg. Mivel minden GCN egység 4 textúra egységet tartalmaz, az új modell TMU-inak teljes száma 56 TMU. Vagyis a Bonaire pontosan 1,4-szer gyorsabb, mint a Zöld-foki-szigeteki chip a matematikai számítások és a textúra mintavételezési sebességét tekintve, feltéve, hogy a frekvencia egyenlő.

De a ROP-ok és a memóriavezérlők száma a Bonaire-ben és a Radeon HD 7790-ben hasonló ahhoz, amit a Zöld-foki Köztársaságban és a Radeon HD 7770-ben láttunk - úgy döntöttek, hogy 16 ROP-ot hagynak, az új lapka memóriabusza pedig 128 bites, összerakva két 64 bites csatorna. A kis számú ROP lehet a megoldás "Achilles-sarka", hiszen a gyors GDDR5 memória használata viszonylag nagy, 96 GB/s sávszélesség biztosítását tette lehetővé, de a ROP teljesítményével nem lehet mit tenni.

Az új GPU azonban javult a geometriai teljesítményben és a tesszellációs sebességben. Igen, a Zöld-foki-szigeteken is van egy 9. generációs tesszellátor, de Bonaire is megduplázta a geometriablokkok, raszterezők és parancsprocesszorok számát (az ábrán ACE-ként jelölve) – most már kettő van belőle. Ez a fejlesztés lehetővé teszi, hogy Bonaire akár két geometriai primitívet is feldolgozzon óránként, akárcsak az erősebb Pitcairn és Tahiti.

Ahogy emlékszel, az AMD először a Radeon HD 7770-ben vette át a GPU órajel-frekvenciájának fontos pszichológiai határát, ami 1 GHz. Tehát a HD 7790 is pontosan ugyanazzal az 1 GHz-es referenciafrekvenciával rendelkezik, így a HD 7770-hez képesti teljesítménynövekedést kizárólag az építészeti változtatások és a végrehajtási egységek számának növekedése indokolja.

De az új termék videomemóriájának frekvenciája sokkal magasabb. Míg a HD 7770-nek viszonylag alacsony, 4,5 GHz-es memóriafrekvenciája volt, a HD 7790-et gyors, 6 GHz-en működő GDDR5 memóriával szerelték fel, ami harmadával nagyobb sávszélességet biztosít. A videomemória sávszélességének 33%-os növekedése a Radeon HD 7700 alcsaládhoz képest a játékteljesítmény érthető növekedését eredményezte. Az AMD a következő táblázatot mutatja be, amely összehasonlítja a HD 7790 képsebességét a 4,5 és 6,0 GHz-es memóriával:

A maximális memóriasávszélesség-gyorsítást olyan játékokban érték el, mint a StarCraft II és a Crysis 2. Átlagosan 33%-kal nagyobb memóriasávszélesség valahol 10%-os növekedést jelent a modern játékok átlagos képkockasebességében. Nem rossz mutató, amely azt mutatja, hogy a memória sávszélessége manapság nagyon fontos, bár nem ez az egyetlen szempont a teljesítmény szempontjából. Bár nagyon valószínű, hogy több ROP-val a Bonaire sebessége még nagyobb lenne...

Jól látható, hogy az átlagos fogyasztás enyhén nőtt a HD 7770-hez képest. Ha a régi modellnél ez az érték 80 W, akkor a HD 7790 esetében ez 85 W - ez nagyon alacsony ár 33-40%-os elméleti teljesítménynövekedésért! Építészeti fejlesztések (PowerTune), új GPU tervezése a korábbiak tapasztalataival, valamint a TSMC technikai folyamatának folyamatos fejlesztése - mindez enyhe fogyasztásnövekedést eredményezett a sebességjellemzők jelentős javulásával.

Ami a chipek területét és a Bonaire-i tranzisztorok számát illeti, az új chip egyértelműen nagyobb, mint a Zöld-foki-szigetek, de a számítási, textúra és geometriai egységek hozzáadása nem múlt el nyom nélkül. Ezen paraméterek szerint Bonaire is megközelítőleg félúton található a Zöld-foki-szigetek és Pitcairn között. A Bonaire 2,08 milliárd tranzisztort tartalmaz egy 160 mm 2 -es chipben, a Zöld-foki-szigetek esetében ezek a számok 1,5 milliárd és 123 mm 2, Pitcairn esetében pedig 2,8 milliárd tranzisztor és 212 mm 2 chipfelület.

Az új chip természetesen támogatja az összes AMD technológiát, amelyet az új Radeon HD 7000 családban implementáltak és továbbfejlesztettek (a listájuk nem teljes: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, textúra szűrési fejlesztések stb.), mindez részletesen meg van írva az AMD Radeon HD 7970: The New Uniprocessor Leader cikkben. A HD 7790 támogatja az ott felvázolt összes funkciót, beleértve az AMD Eyefinity 2.0-t hat monitorral és sztereó rendereléssel, valamint továbbfejlesztett videó dekódoló és kódoló egységgel.

Továbbfejlesztett PowerTune technológia

Az AMD még 2010-ben bevezette a PowerTune technológiát a Cayman chipben (AMD Radeon HD 6900 sorozat). Ez a GPU volt az első, amely bevezette a PowerTune nevű dinamikus energiagazdálkodást. Ez lehetővé tette számunkra, hogy növeljük a maximális órajelet a tipikus alkalmazásokhoz, miközben elkerültük a túl sok energiafogyasztást a speciális stabilitási teszteknél, mint például a FurMark. Aztán a technológiát a kétchipes AMD Radeon HD 6990 modellben alkalmazták, aminek nyilvánvaló okokból még nagyobb szüksége volt rá.

A technológia jelentős frissítést kapott 2012 közepén, amikor az AMD PowerTune-t egy automatikus bővítéssel egészítették ki. Az AMD Radeon HD 7970 GHz Edition esetében ez az algoritmus még nagyobb teljesítménynövekedést tett lehetővé a videokártya normál verziójához képest. Az automatikus túlhajtás nélküli videokártyák PowerTune algoritmusa három állapotot használ: üresjárat, alacsony terhelésű mód (alacsony 3D) és teljes sebesség. A HD 7970 GHz a Boost túlhajtási módot is hozzáadja. A PowerTune a szükséges energiafogyasztáson belül marad, és szükség esetén alacsonyabb terhelésű módra vált. Ebben az esetben a technológia drasztikusan csökkenti az órajel frekvencia értékeit. A gyakorlatban az ilyen ugrások ritkák a két aktív mód közötti nagy különbség miatt.

A GPU órajelének csökkentése csökkenti az energiafogyasztást, de a hatékonyabb vezérléshez a feszültségeket is csökkenteni kell. Pontosan ez történik a Radeon HD 7790-ben. Az új Bonaire grafikus chip nyolc különböző frekvenciájú és feszültségű állapotot tartalmaz, amivel a korábbinál magasabb órajeleket lehet elérni, miközben a GPU mindig az optimális feszültségen és frekvencián működik. Az állapotok közötti váltás a GPU terhelésén, valamint a videochip aktuális energiafogyasztásán alapul.

Az új algoritmusban a fogyasztási szint túllépése esetén a PowerTune-nak nem kell élesen leengednie a frekvenciát, és a frekvenciával együtt a feszültség is csökken. Az állapotok közötti átmeneteknek a lehető leggyorsabbnak kell lenniük, hogy ne lépjük túl a fogyasztási határt még rövid időre sem, ezért Bonaire 10 ms-onként váltja a PowerTune állapotokat, vagyis a chip állapota másodpercenként 100-szor változik.

A frekvenciák ilyen állandó változásával a harmadik féltől származó alkalmazások, például az MSI Afterburner és a GPU-Z nem az órajel-frekvencia pillanatnyi értékeit jelenítik meg, hanem egy bizonyos időszak átlagát - az úgynevezett "hatékony"-t. frekvencia. Egy másik érdekes újítás, hogy az AMD új PowerTune beállításokat nyit meg harmadik féltől származó alkalmazások számára. A partnerek saját PowerTune-beállításaikat is beállíthatják, amelyek segítenek a gyárilag túlhúzott grafikus kártyák létrehozásában, és az AMD referenciaértékein túlmenően több lehetőséget biztosítanak. Igaz, az eltérő PowerTune-beállítások oda vezethetnek, hogy a különböző gyártók azonos modelljű videokártyáinak nem csak az órajel-frekvenciája lesz eltérő, hanem az ezek időbeli változásának algoritmusa is, ami megnehezíti az összehasonlítást azonos körülmények között.

A Radeon HD 7790 modell videokártyáinak értékesítése a piacon 2013 áprilisának legelején kezdődött. Az AMD partnereivel közösen megszervezte mindkét alaplap kiadását referenciafrekvenciás és gyári túlhajtásos megoldásokkal. Most pedig mindkét gyártó nagyjából azonos módon dob piacra új videokártyákat, gyorsan elérhetőek a különféle opciók partnereinél. A HD 7790-ből ugyanis a megszokottnál szinte több túlhúzott változatot adtak ki a partnerek, a bennük lévő grafikus chipek pedig 1075 MHz-es nagyságrendű frekvencián működnek.

Részletek: Radeon HD 7990 modell

  • Kódnév "Málta"
  • Gyártási technológia: 28 nm
  • 2 darab 4,3 milliárd tranzisztoros chip
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek stb.
  • Hardver támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0-t is
  • Kettős 384 bites memóriabusz: kétszer hat 64 bites vezérlő GDDR5 memória támogatásával
  • GPU frekvencia: 1000 MHz
  • Kétszer 32 GCN számítási egység, köztük 128 SIMD-mag, összesen 4096 ALU-ból áll a lebegőpontos számításokhoz (egész és lebegőpontos formátumok, FP32 és FP64 precíziós támogatás az IEEE 754 szabványon belül)
  • 2x128 textúraegység, trilineáris és anizotróp szűréssel minden textúraformátumhoz
  • 2x32 ROP élsimítási módok támogatásával, több mint 16 minta programozható mintavételezésének lehetőségével képpontonként, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 64 minta ciklusonként, és csak Z módban - 256 minta ciklusonként
  • Integrált támogatás akár hat monitorhoz HDMI 1.4a és DisplayPort 1.2 porton keresztül

A Radeon HD 7990 grafikus kártya műszaki adatai

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 4096
  • Textúra egységek száma: 2x128, keverési egységek: 2x32
  • Effektív memóriafrekvencia: 6000 MHz (4 × 1500 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 2x3 gigabájt
  • Memória sávszélessége: 2x288 gigabájt másodpercenként.
  • Maximális elméleti kitöltési sebesség: 64 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 256 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, négy Mini-DisplayPort 1.2
  • Teljesítményfelvétel akár 375 W
  • Két 8 tűs kiegészítő tápcsatlakozó
  • Kétnyílásos kialakítás
  • Oroszországban az ajánlott ár 32 999 rubel. (az USA-ban - 999 dollár).

Már az AMD videokártyák második generációjában is változatlan marad a kétchipes modellek elnevezési elve. A két legerősebb videochipre épülő csúcsmegoldás az index első számjegyével tér el az előző generáció megfelelő modelljétől: a 6 helyett az új tételek sorozatát jelző 7-es számot kapta. A bejelentett videokártya a harmadik számjegyben különbözik az egychipes megoldástól, ami egy generáción belüli maximális teljesítményt jelzi.

Ami pedig a versenytársakkal való összehasonlítást illeti, a ma bejelentett Radeon HD 7990 modell esetében a fő rivális a közel egy éve megjelent GeForce GTX 690 videokártya, és ezeknek a kétchipes megoldásoknak kell majd megküzdeniük egymással. Igaz, az NVIDIA-nak is van egy erősebb, de egyetlen GPU-ra épülő megoldása - a GeForce GTX Titan, amely a szóban forgó AMD alaplap vetélytársának is tekinthető.

Az új, kétlapkás Radeon videokártya GPU-nként 3 GB GDDR5 memóriával rendelkezik, ami a Tahiti chipek 384 bites memóriabuszának köszönhető. Ez a mennyiség igencsak indokolt egy ilyen magas szintű termékhez, mivel egyes modern játékalkalmazásokban, maximális beállítások mellett, élsimítás és nagy felbontás mellett kisebb memóriamennyiség (2 gigabájt chipenként vagy kevesebb) már nem biztos, hogy legyen elég. És még inkább, ez vonatkozik a sztereó módban történő megjelenítésre vagy több monitoron Eyefinity módban.

Nyilvánvaló, hogy egy ilyen erős, két GPU-s videokártya hatalmas, kétnyílású hűtőrendszerrel rendelkezik, amely különbözik az AMD kártyák hagyományos hűtőitől. Hatalmas hűtőbordával van elrejtve egy burkolat alatt, három nagy ventilátorral, amelyek viszonylag alacsony sebességgel működnek. A két GPU-val szerelt kártya fogyasztása érthető okokból meglehetősen magas, ráadásul két 8 tűs tápcsatlakozója van, de ez legalább nem három, mint a két Tahiti chipre épülő, nem referencia mintákban.

Építészet

Mivel a "Málta" kódnevű videokártya a Southern Islands család két "Tahiti" GPU-ján alapul, egyszerűen hivatkozhat arra, ami alaposan leírja a jelenlegi Graphics Core Next (GCN) architektúra összes jellemzőjét. Az alapanyagoknál csak az egyes termékek legfontosabb jellemzőit, jellemzőit ismételjük meg.

Az architektúra alapvető építőeleme a GCN blokk, amelyből a sorozat összes GPU-ját összeállítják. A számítási egység alszekciókra van felosztva, amelyek mindegyike saját utasításfolyamon működik, dedikált helyi adattárolóval, első szintű gyorsítótárral, olvasási / írási képességekkel, valamint teljes értékű textúra csővezetékkel rendelkezik mintavétellel és szűrőegységek. A GCN blokkok mindegyike képes önállóan ütemezni és elosztani a parancsokat, és egy számítási egység több független parancsfolyamot is végrehajthat. A Radeon HD 7990 két, általunk már ismert Tahiti chipet használ:

A grafikus processzor diagramján (a Radeon HD 7990-ben kettő van) a GCN architektúra 32 számítási egysége látható és mindegyik aktív. Korábban azt feltételezték, hogy egy kétchipes megoldásnál ki kell kapcsolni néhányat, sőt a frekvenciát is csökkenteni kell ahhoz, hogy a 375 W-os fogyasztási határokba kerüljön, de az AMD mérnökei sikeresen megoldották ezt a nehéz feladatot. Lehet, hogy a Tahiti egy speciális, új változata jelent meg alacsonyabb fogyasztás mellett, vagy egyszerűen nagyon kemény kiválasztáson mennek keresztül a chipek.

Mivel minden GCN blokk 16 textúra egységet tartalmaz, a TMU-k száma chipenként 128 blokk, ami 256 gigatexel/másodperc végső teljesítményt ad, ami egy versenytárs GeForce GTX 690 esetében nagyon jó. A ROP-ok és a memóriavezérlők száma HD-ben A 7990 sem változott az egychipes analóghoz képest, GPU-nként 32, illetve 6 darab maradt. A Radeon HD 7990 kettős, 384 bites memóriabusszal rendelkezik, amely tizenkét 64 bites csatornából épül fel, és 576 GB/s teljes memóriasávszélességet biztosít – ez újabb rekord adat.

Egyébként az új kártya támogatja az összes modern AMD technológiát, amelyet az új Radeon HD 7000 videochipekben implementáltak és továbbfejlesztettek: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, javított textúra szűrési minőség stb. Mindezt fent a Radeon HD 7970 leírásában részletesen leírjuk, és egyszerűen nincs értelme megismételni.

Hűtőrendszer és energiafogyasztás

Az ilyen komoly kétchipes alaplapok esetében különösen fontossá válik a rendkívül hatékony hűtőrendszer. Ha a két Tahiti alapú partnerek megoldásainál háromnyílásos megoldást alkalmaztak, az ASUS ARES II esetében pedig akár vízhűtést, akkor ebben az esetben kisebb erőkkel kellett megtenni, ezért hűtőt használtak. egy nagyon masszív radiátorral és három ventilátorral, javított akusztikai jellemzőkkel.

A hűtőrendszer zaja és a GPU-k számára biztosított hőmérséklet az egyik legfontosabb fogyasztói jellemző minden videokártya esetében, beleértve a rajongóknak tervezett csúcskategóriás megoldást is. A túl hangos vagy nem hatékony hűtőrendszert a vásárlók kevésbé jövedelmező vásárlásnak tekintik, az összes többi (körülbelül) azonos mutatót. Az AMD tehát a Radeon HD 7990 esetében nagyon komolyan közelítette ezt a kérdést, összehasonlítva a piac többi csúcsmegoldásával. Tekintsük az új rendszer akusztikai jellemzőit:

A diagram három különböző videokártya zajszintjét mutatja: a Radeon HD 7990 és két versenytárs: a két GPU-s GeForce GTX 690 és az egy GPU-s GTX Titan az NVIDIA-tól. Ezenkívül a zajt különböző körülmények között mérték - üresjárati üzemmódban (System Idle) és maximális terhelés mellett a Furmark segítségével. Ha hihetünk az AMD által jelzett számoknak, akkor a hűtő zajszintjét tekintve még az egychipes Titan is elmarad újdonságuktól, nem beszélve a két GPU-s GTX 690-ről, ami ebben a leghangosabb. összehasonlítás.

De nem a GPU hőmérsékletének rovására sikerült ilyen lenyűgöző akusztikát elérni? A következő diagram az AMD Radeon HD 7990 és ugyanazon két versenytárs GPU-hőmérsékletét mutatja. Ezúttal az AMD csak a nagy terhelésű módot használta a Furmark tesztelésekor.

És ismét egy "trükkös" koordinátatengelyt használnak nem nulla origóval. A 80 és 82 fok közötti valódi különbség a Radeon HD 7990 és a GTX Titan esetében gyakorlatilag észrevehetetlen lesz, bár a 87 fok a GTX 690 esetében egyértelműen kiemelkedik a rosszabbikból. Ismételten vegye figyelembe, hogy ezeket a teszteket egy érdekelt fél végezte el, és független ellenőrzésnek vetik alá.

A fogyasztás szempontjából a dual-GPU megoldás nem újdonság, de a korábban bejelentett ZeroCore Power technológia támogatása is ott van. Ezzel a technológiával jelentősen alacsonyabb energiafogyasztás érhető el "mély üresjárati" (vagy "alvó") üzemmódban, kikapcsolt megjelenítőeszköz mellett. Ebben az üzemmódban a tétlen GPU szinte teljesen ki van kapcsolva, és a teljes értékű üzemmód teljesítményének kevesebb mint 5% -át fogyasztja, ami letiltja a funkcionális blokkok többségét. A kétlapkás kártya esetében pedig még fontosabb, hogy a CrossFire rendszerben az operációs rendszer kétdimenziós interfészének rajzolásakor a fő kivételével az összes GPU egyáltalán nem működik. Vagyis a Radeon HD 7990 esetében az egyik lapka 2D módban minimális fogyasztás mellett mély álomba merül, a második pedig a PC mély üresjárati üzemmódjában tud "elaludni".

Az AMD Radeon HD 7900 sorozatú GPU-k új műszaki specifikációi

Az AMD jövőre új GPU-sort mutat be Radeon HD 7000... Az egyik legérdekesebb megoldás benne az AMD Radeon HD 7900 sorozatú modellek lesznek az új GCN (Generation Core Next) mikroarchitektúrával. Részleteit még júniusban, az AMD Fusion Developer Summit alkalmával hozták nyilvánosságra, de csak a közelmúltban érkeztek adatok a műszaki specifikációról.

Tehát a sorozat két GPU-t fog tartalmazni: AMD Tahiti PRO és Tahiti XT. A fiatalabb modell 30 számítási egységet, 60 ROP egységet, 120 textúra egységet és 1920 stream processzort tartalmaz majd. A GPU órajele 900 MHz lesz, és GDDR5 memóriával lesz párosítva. Utóbbi pedig 384 vagy 256 bites busszal rendelkezik, 5000 MHz-es frekvenciával.

Az AMD Tahiti XT megoldása 32 számítási egységet támogat majd, ami lehetővé teszi a ROP egységek számának 64-ig, a textúra egységek - 128-ig, a stream processzorok - 2048-ig történő növelését. A grafikus mag órajele 1000 lesz. MHz. Ismeretes, hogy az AMD Tahiti XT modell 384 bites GDDR5 memóriával, 3 GB-tal és 5500 MHz-es effektív órajellel támogatja a munkát. Sajnos az első információkat ezekről az új Rambus XDR2 memóriatermékekről még nem erősítették meg.

Arra számíthat, hogy a bejelentés a videokártyák AMD Radeon HD 7950és Radeon HD 7970 Az AMD Tahiti PRO és Tahiti XT GPU-kon alapuló ára a 2012-es CES során kerül megrendezésre, és a 349 és 449 dollár közötti ársávot fedi le.

Az is ismertté vált, hogy jövő év márciusában új, kétprocesszoros "zászlóshajó" jelenik meg - AMD Radeon HD 7990... 6 GB GDDR5-ös videómemóriája lesz, órajele pedig a modellé lesz AMD Radeon HD 7970... Ez a megoldás 699 dolláros áron kerül értékesítésre.

Az új GPU-k összehasonlító táblázata AMD Radeon HD 7950és Radeon HD 7970:

AMD Radeon HD 7950

AMD Radeon HD 7970

Gyártási folyamat szabványok, nm

GPU

Órajel frekvencia, MHz

Számítási egységek száma

Adatfolyam-processzorok száma

A textúra egységek száma

ROP-ok száma

Videó memória

Kötet, MB

Órajel frekvencia, MHz

március 10 2016

Ezen az oldalon található linkek a legújabb ingyenes letöltéshez AMD grafikus illesztőprogramok a Radeon HD 7900 sorozatból, amely a Radeon HD sorozat része. A telepítőfájlok a hivatalos webhelyről származnak, és a következőkre alkalmasak: Windows 7, 10, 8, 8.1, XP, Vista 32/64 bites (x86 / x64).

A szükséges fájlok kiválasztásának kényelme érdekében alább látható a Windows verziója és annak bitessége ("bitness").

Számítógépe a következőkön fut:

  1. Letöltés (153,5 MB / 16.8.2-es verzió (Crimson Edition 16.8.2 Hotfix) / Kiadás dátuma: 2016.08.12.)

    32 bites Windows 7 rendszerhez

  2. Letöltés (239,8 MB / 16.8.2-es verzió (Crimson Edition 16.8.2 Hotfix) / Kiadás dátuma: 2016.08.12.)

    Windows 7 64 bites rendszerhez

  3. Letöltés (134,8 MB / 16.8.2-es verzió (Crimson Edition 16.8.2 gyorsjavítás) / kiadás dátuma: 2016.08.12.)

    32 bites Windows 10 rendszerhez

  4. Letöltés (208,24 MB / 16.8.2-es verzió (Crimson Edition 16.8.2 gyorsjavítás) / Megjelenés: 2016.08.12.)

    64 bites Windows 10 rendszerhez

  5. Letöltés (205 MB / 14.4-es verzió (Catalyst Software Suite) / Megjelenés: 2014.04.25)

    32 bites Windows 8 rendszerhez

  6. Letöltés (260 MB / 14.4-es verzió (Catalyst Software Suite) / Megjelenés: 2014.04.25.)

    Windows 8 64 bites rendszerhez

  7. Letöltés (154,21 MB / 16.8.2-es verzió (Crimson Edition 16.8.2 Hotfix) / Kiadás dátuma: 2016.08.12.)

    32 bites Windows 8.1 rendszerhez

  8. Letöltés (239,88 MB / 16.8.2-es verzió (Crimson Edition 16.8.2 gyorsjavítás) / Megjelenés: 2016.08.12.)

    Windows 8.1 64 bites rendszerhez

  9. Letöltés (179 MB / 14.4-es verzió (Catalyst Software Suite) / Megjelenés: 2014.04.25.)

    Windows XP 32 és 64 bites rendszerhez

  10. Letöltés (151 MB / 13.12-es verzió (Catalyst Software Suite) / Megjelenés: 2013.12.18.)

    32 bites Windows Vista esetén

  11. Letöltés (209 MB / 13.12-es verzió (Catalyst Software Suite) / Megjelenés: 2013.12.18.)

    64 bites Windows Vista esetén

Tartalék – Szerezzen be illesztőprogramokat az AMD Driver Autodetect segítségével

Ez a lehetőség kényelmes, mert a program Az AMD Driver Autodetect kiválasztja és letölti a legújabb működő illesztőprogramokat amelyek alkalmasak az Ön AMD grafikus kártyájához és az Ön Windows-verziójához. A programot nem kell telepíteni, az AMD készítette és a fájlok letöltése a hivatalos szervereiről történik.

Utasítás:

  1. Futtassa az AMD Driver Autodetect programot, és azonnal automatikusan kiválasztja a szükséges fájlokat az illesztőprogramok telepítéséhez.
  2. A fájlok letöltéséhez kattintson a Letöltés most gombra.
  3. Várja meg, amíg a fájlok letöltődnek, és indítsa el a telepítést.

Az internet különösen azon felhasználók érdeklődésére vált, akik e modellek lenyűgöző dizájnját tekintve komoly teljesítménypotenciálra számítanak. Az internetre kiszivárgott legújabb diák az újak funkcionalitását mutatják be. Kezdésként nézzük meg közelebbről a Graphics Core Next (GCN) architektúra, az AMD Eyefinity 2.0 technológia, valamint az AMD APP általános célú számítástechnikai technológiát használó alkalmazások hardveres gyorsításának lehetőségeit. Az AMD állítása szerint a GCN egy új, "forradalmi" technológia, amely újradefiniálja a GPU-k grafikus számításait.
Az elmúlt öt generáció során, kezdve a Radeon HD 2000 sorozattal, az AMD grafikus kártyák a VLIW (Very Long Instruction Word) architektúra platformot használták, és még a legújabb verziója, a VLIW4 is, amelyet a vonal képvisel, inkább evolúciós fejlesztés, mint forradalmi áttörés a VLIW történetében. A Graphics Core Next platform az általános célú VLIW processzorokat a szuperskaláris Graphics Compute grafikus magokra cseréli. Ez a lépés jobb teljesítményt jelent a GPU magterületének négyzetmilliméterére vetítve, ami viszont egy kisebb grafikus chipet tesz lehetővé, így több mozgásteret biztosít az AMD számára az NVIDIA-val szembeni árak tekintetében. Maga a chip a TSMC 28 nanométeres feldolgozási technológiája alapján készül. Ezenkívül az AMD megerősíti, hogy támogatja a busz előző verziójához képest – a PCI-Express 2.0 – kétszeres sávszélességű interfészt.

Az energiagazdálkodást az AMD PowerTune technológia kezeli, amely lehetővé teszi a frekvenciakarakterisztikák felfelé és lefelé történő beállítását a névlegeshez képest, miközben a deklarált energiafogyasztási szinten belül marad. Emellett említésre kerül a ZeroCore technológia, amely lehetővé teszi a grafika teljes letiltását abban az esetben, ha az üresjárati állapot miatt a monitor kikapcsolásának szükségességéről tájékoztat. A ZeroCore technológia megvalósítása segít a videoadapter energiafogyasztásának 3 W-ra történő csökkentésében, ami 10-szeres javulást mutat ebben a mutatóban az előző generációk modelljeihez képest. Arról is beszámoltak, hogy ez a funkció lehetővé teszi a kötegben lévő másodlagos GPU-k (azaz a második, harmadik és negyedik kártya) ZeroCore módba kapcsolását, így a főkártya (amelyhez a monitor csatlakozik) "ébrenléti állapotban" marad. " - mindezt feltéve, hogy a számítógép grafikus alrendszerét nem terhelik intenzív számítások a 3D-s feladatok végrehajtása során.


Jelentős újításokat jelentettek be az Eyefinity 2.0 technológiával kapcsolatban. Mindenekelőtt a DDM (Direct Drive Monitor) rendszerről beszélünk, amely lehetővé teszi független audio streamek kiadását, ha HDMI vagy DisplayPort csatlakozókon keresztül 7.1 formátumban továbbít surround hangot. Amikor az egyik monitorról a másik ablakra lép át annak a programnak, amelyben ezt vagy azt az alkalmazást lejátssza, az audio stream dinamikusan átkerül az egyik portról a másikra. Egy ilyen séma gyakorlati értéke például abban rejlik, hogy hosszabb HDMI-kábelt lehet használni, amikor az egyik szobában lévő számítógépet egy másik szobában lévő HDMI interfésszel csatlakoztatja. A felhasználó önállóan gondolkodhat a funkció más lehetséges alkalmazási területein. Az Eyefinity 2.0 továbbra is lehetővé teszi a felvételek készítését 5 monitoron fekvő tájolásban. Támogatja az AMD HD3D-t, az AMD grafikus részlegének szabadalmaztatott technológiáját, amely lehetővé teszi a sztereoszkópikus 3D-s képalkotást minden egyes képernyőn egy felvétel részeként, kompenzálva a monitor szögét a felhasználó perspektívájához és a többi kijelző keretéhez képest.

Az AMD APP (Accelerated Parallel Processing) néven ismert általános célú számítási technológiát támogató alkalmazások végrehajtása hatékonyabbá válik a funkcionalitás némi kibővítésének köszönhetően, egy új, termelékenyebb számítástechnikai architektúra erőforrásainak felhasználásával számítási terhelést szem előtt tartva. Támogatja a Steady Video 2.0-t, amely javítja az eredeti felvétel minőségét a kézi remegés kompenzálásával. A fejlett Unified Video Decoder (UVD) egység lehetővé teszi a GPU számára, hogy bővítse képességeit ezen a területen. Egy másik fontos előny a 3D otthoni videó támogatása, így a frissített UVD motor ezen a téren is lehetővé tesz bizonyos teljesítménnyel kapcsolatos problémák megoldását. Végül az AMD kiterjeszti az APP elérhetőségét új alkalmazások fejlesztésével, amelyek támogatják ezt a technológiát.