iPon Hírek

Nvidia csúcskártya 4992 CUDA maggal, 24 GB VRAM-mal

Dátum | 2014. 11. 18.
Szerző | J.o.k.e.r
Csoport | FŐ EGYSÉG

Az Nvidia az éppen zajló SC'14 alkalmával új professzionális szintű gyorsítókártyát mutatott be, ami a HPC szegmenst veszi célba – méghozzá nem is akárhogy. A Tesla K80 egy rettentően különleges gyorsítókártya, olyan, amihez hasonlót eddig még nem láthattunk. Tavaly, az SC'13 alkalmával mutatkozott be a Tesla K40, ami az első olyan gyorsítókártya volt, ami kiaknázta a GK110-e GPU összes erőforrását.
A Tesla K40 után azt gondolhattuk volna, hogy a Kepler alapú Tesla sorozat a csúcsra ért, de mint kiderült, nem így volt: a vállalat idén egy új Kepleres gyorsítókártya-szörnyetegről rántotta le a leplet. Az újdonság egy vadonatúj, GK210-es kódnévre keresztelt GPU köré épül, amelyből rögtön kettőt is elhelyeztek nyomtatott áramköri lapján.
Egy-egy ilyen Tesla K80-as gyorsítókártya optimális esetben – a GPU Boost-ban rejlő lehetőségek maximális kiaknázásával – 2,9 TFLOP/s-os maximális dupla pontosságú számítási teljesítményt nyújt, szimpla pontosságú számítási teljesítménye pedig a 8,7 TFLOP/s-os értéket is eléri. A papírforma alapján a Tesla K80 maximális órajel mellett 74%-kal gyorsabb a korábbi csúcsmodellnél.
Két nagyteljesítményű GPU-t nem egyszerű egy nyomtatott áramköri lapra integrálni – a siker érdekében itt-ott faragni kell az erőforrásokon. Emiatt nem is túl meglepő, hogy a GK210-es GPU 15 helyett csak 13 aktív SMX tömbbel rendelkezik, ami 2496 CUDA magot jelent. Az összesen 4992 CUDA maggal ellátott Tesla K80 esetében a GPU órajele 562 MHz és 870 MHz között helyezkedik el, egy-egy GPU pedig 384-bites adatsínen keresztül kapcsolódik a saját 12 GB-nyi GDDR5-ös fedélzeti memóriájához. A VRAM esetében 5 GHz-es effektív órajellel gazdálkodhatunk, így a 24 GB-nyi fedélzeti memória sávszélessége magonként 240GB/s.
A Tesla K80 a fentiek miatt már nem 235 wattos TDP-vel rendelkezik, mint elődei, hanem 300 wattossal. Utóbbi érték elérésében kiemelten fontos szerepet játszik a GPU Boost. A Tesla K80 energiahatékonysága legrosszabb esetben 2%-kal, legjobb esetben pedig 59%-kal jobb, mint a Tesla K40-é – az esetek többségében a tényleges energiahatékonyság valahol e két érték között helyezkedik el.
Az mindenképpen impozáns teljesítmény, hogy a két GPU-val ellátott, 300 wattos TDP-vel rendelkező Tesla K80 kétslotos bővítőkártya formájában érkezik. Emiatt a Tesla K80 segítségével azonos mennyiségű helyre sokkal nagyobb teljesítmény zsúfolható be, mint ha Tesla K40-es gyorsítókártyákat használnának, igaz, a hűtés is több fejtörést okozhat, hiszen az újdonságok passzív kivitelben érkeznek, így az adott szerverházat komoly szellőzéssel kell felvértezni. A GK210-es GPU tulajdonképpen a GK110-es egység harmadik revíziójának tekinthető, amely az alapmodell által kitaposott ösvényt követi, ám jelentős változtatásokat is tartalmaz. A GK110-hez és a GK110B-hez képest az SMX regiszter mérete 256 KB-ról 512 KB-ra nőtt, a megosztott memória – vagyis az L1 Cache – pedig 64 KB helyett immár 128 KB-os. Ez a változás apróságnak tűnhet, ám fontos, mivel segít növelni az SMX-en belül az adatfeldolgozás sebességét, így növekszik a hatásfok, azaz a CUDA magok kihasználtsága is jobb lesz. Az utolsó mozaik a GPU Boost támogatás, ami a Tesla sorozatban a K40 érkezésével debütált. A Tesla K40 idején a rendszerüzemeltetők három órajel közül választhatták ki az igényeknek és a körülményeknek legmegfelelőbbet, a Tesla K80 fedélzetén azonban már dinamikus GPU Boost működik, azaz a rendszer maga szabályozza a GPU órajelét – valahogy úgy, ahogy a GeForce videokártyáknál már megszokhattuk.
A Tesla K80 egy szokatlan terméknek tekinthető, olyannak, amilyen a Tesla sorozatban eddig nem volt. Az újdonság egy-egy GPU-ja persze alacsonyabb teljesítményt kínál, mint a Tesla K40-é, így azoknál a feladatoknál, amelyeket nem lehet hatékonyan több GPU-ra skálázni, a Tesla K40 még mindig jobb választás lehet. Más kérdés, hogy a HPC alkalmazások döntő többségét jól lehet több GPU-ra skálázni, így az esetek többségében – egy-két apró kiviteltől eltekintve – a Tesla K80 lesz a gyorsabb, olykor akár kiemelkedően is. További jó hír, hogy a Tesla K80 érkezésével végre lehetőség nyílik rá, hogy 8 darab GK210-es GPU-val rendelkező 1U rendszert készítsenek a partnerek, amelynek dupla pontosságú számítási teljesítménye bőven meghaladja a 10 TFLOP/s-os szintet.
A Tesla K80 már elérhető a partnerek számára, sőt, a vele felszerelt konfigurációk is elérhetőek, igaz, az nem derült ki, hogy egy-egy ilyen gyorsítókártya-szörnyeteg pontosan mennyibe kerül. Egy évvel ezelőtt az egy GPU-s Tesla K40 5500 dolláros listaáron debütált – ennél az összegnél minden bizonnyal többe kerül majd a Tesla K80.
Új hozzászólás írásához előbb jelentkezz be!

Eddigi hozzászólások

30. carrast
2014.11.18. 08:14
brutális
 
Válasz írásához előbb jelentkezz be!
29. coolecake
2014.11.18. 08:26
Ezen már elfut a shadow of mordor (tudom, hogy nem arra való)
 
Válasz írásához előbb jelentkezz be!
28. Cavalli87
2014.11.18. 08:30
Rendeltem hármat, remélem megy SLI-ben!
 
Válasz írásához előbb jelentkezz be!
27. Csongor22
2014.11.18. 08:34
Az AMD hol van már,eléggé lemaradtak mostanság.
 
Válasz írásához előbb jelentkezz be!
26. BReal
2014.11.18. 08:44
Majd kijön a 300-as széria, olyan teljesítménnyel, mint a 900-as nvidia sorozat. Az élet körforgása.
 
Válasz írásához előbb jelentkezz be!
25. ribizly
2014.11.18. 09:01
Engem csak az érdekel, hogy melyik Red Hat Enterprise Linux támogatja ezeket a hardvereket... Erről hol lehet korrekt információt szerezni? A gyártók oldalai nem annyira bőbeszédűek a témában (ráadásul azok is csak az előző generációra vonatkoznak, pl. HP)...
 
Válasz írásához előbb jelentkezz be!
24. Kajafun
2014.11.18. 09:39
TASLI
 
Válasz írásához előbb jelentkezz be!
23. ejcy
2014.11.18. 10:14
semmi extra, szokásos két magos megoldás annak minden előnyével és hátrányával. gyengébb magok, parasztvakítós 24gb memória (magonként nem nőtt), ráadásnak a passzívnak megjelölt hűtés is csak durván hűtött szerverházakra értendő
 
Válasz írásához előbb jelentkezz be!
22. wishformor...
2014.11.18. 11:02
@ocsabi
te neked halovany foggalmad nincs hogy, ezeket a kartyakat mire hasznaljak ugye? ezeket nem bikazzak ossze quadroval,

de a cikk is segit egy kicsit abban hogy eligazodj, nez mar ra azokra a blade szerverekre ember....
 
Válasz írásához előbb jelentkezz be!
21. m76
2014.11.18. 11:24
Passzív hűtés? Azt meg minek? A Quadro-k is úgy hullanak mint a legyek az elégtelen hűtés miatt, pedig az még csak nem is passzív, csak simán fos.
 
Válasz írásához előbb jelentkezz be!
20. tibaimp
2014.11.18. 11:42
Látom ezek is tudnak görbéket rajzolgatni, mint az amd, amikor az Intel megoldásait kell "legyűrni".....nem is értem, hogy egy gpu-t miért hasonlít egy cpu-hoz.
 
Válasz írásához előbb jelentkezz be!
19. Zephyrus
2014.11.18. 12:02
tibaimp: azért mert ezeket nem grafikai renderre használják, hanem erősen párhuzamosított számolásra. szóval nem sok értelme lenne egy ábrát odarakni, hogy vedd meg a gpu szerverbe a mi vga-nkat, mert stabilan bírja az AC-ben a 30 fps-t
 
Válasz írásához előbb jelentkezz be!
18. harvy666
2014.11.18. 12:02
Noh végre valami amin futni fog az AC:U
 
Válasz írásához előbb jelentkezz be!
17. RealDreamQ wishf...
2014.11.18. 12:04
Sőt , hogy továbbmenjünk a QUADRO -k pont hogy számolnak ! Nem véletlen van CAD alkalmazásokhoz a céltámogatás és egyéb specko célszoftverek használatához ... rendereléshez , szóval direkt Professzionális felhasználásra szánták ezeket 3D modellezés és stb .

[Végre kibővült a kepleres Quadro]
 
Válasz írásához előbb jelentkezz be!
16. RealDreamQ
2014.11.18. 12:17
Nem nv-t kell venni hanem AMD-t és kész !

AMD FirePro W9100 - [LINK]

Az eddigi csúcstartó egyébként az NVIDIA Quadro K6000 volt 1,7 TFLOPS-os tempójával, aminél az új FirePro bő 50%-kal többet tud.
[LINK]
NV mindig ia AMD alatt teljesített , ennyi
.

http://youtu.be/0RuqMytVmI0 [LINK]

 
Válasz írásához előbb jelentkezz be!
15. RealDreamQ
2014.11.18. 12:33
AMD FirePro W9100

A FirePro W9100-on található Hawaii cGPU a GCN architektúra modernizált változatára épül és 8 ACE egységet, 4 tesszellátort, 4 raszter motort, 2816 shader részelemet, 176 textúrázó csatornát, illetve 64 blending és 256 Z egységet tartalmaz. A 16 GB-nyi GDDR5 szabványú fedélzeti memória 512 bites buszon kapcsolódik a lapkához, ami az 5 GHz-es effektív órajelnek köszönhetően 320 GB/s-os memória-sávszélességet biztosít. A magórajel 950 MHz lesz, amit a PowerTune skáláz majd a terhelésnek megfelelő szintre. Az elméleti adatok szempontjából a FirePro W9100 5,35 TFLOPS-os egyszeres pontosságú, illetve 2,67 TFLOPS-os dupla pontosságú számítási teljesítményre képes. Utóbbi a munkaállomásokon végzett szimulációs számításoknál nagyon jól fog jönni.

Hogy mégis egy FirePro kátrtya teljesítményét lássuk is ... és ugye ez még nem is specifikus gyorsító kártya
 
Válasz írásához előbb jelentkezz be!
14. noPublicFG
2014.11.18. 13:42
Legutóbb 2006-ban kellett mechanical desktophoz gépet készítenem, azóta lemaradtam. Kicsit megváltoztak a számok: 4992 CUDA mag? WTF?
 
Válasz írásához előbb jelentkezz be!
13. Zotya21 RealD...
2014.11.18. 15:19
erre csak azt szoktam mondani hogy te ritka hülye vagy

nem érdekel ha letiltanak innét
 
Válasz írásához előbb jelentkezz be!
12. Tuttu
2014.11.18. 15:27
Gondoom ez is Tier 2-be tartozik és nem fogja 100%-ig támogatni a DX12-t!
Egy R9 290 még mindig mindennél jobban megéri! 4K-ra meg 295x2 oszt csókolom!
Az AMD majd előrukkol ezzel és kijön, hogy melyik cég, hol tart a technológiai fejlettségben!
http://prohardver.hu/hir/hynix_amd_kozosen_fejezi_be_hbm_memoria.html
 
Válasz írásához előbb jelentkezz be!
11. RealDreamQ Zotya...
2014.11.18. 16:51
Mert miért is ?

Azt ugye észrevetted hogy miről beszélünk ocsabi -val .
NV Quadro vs AMD FirePro

Amúgy mi is a gondod ?
 
Válasz írásához előbb jelentkezz be!
10. asdsa
2014.11.18. 17:42
Azért a professzionális piacon nem csak a GFLOPS/Ft számít, fontos a driver, hogy a használt programoknál milyen az adott kari támogatottsága, illetve ott van még a CUDA is. (És persze a "hagyományok" is fontosak, nagyon sok helyen érthető okokból a bejáratott dolgokat részesítik előnyben).
 
Válasz írásához előbb jelentkezz be!
9. fofoka asdsa
2014.11.18. 19:05
Ez így van. Sok szoftver nem támogatja az AMD kártyákat, mert csak CUDA-t használ. És az nvidia kártyák közül is csak a professzionálisat. Azaz hiába veszel meg egy Titan Z-t ami mellesleg dupla pontosságban ráver a FirePro-ra (és sokkal olcsóbb), sajna legtöbb esetben azzal is legfeljebb játszhatsz, vagy írsz magadnak rá programot.
 
Válasz írásához előbb jelentkezz be!
8. siriq Tuttu
2014.11.18. 19:33
Az remelem te is tudod , hogy az nvidia mar "nyomul" a 3DSTACKED memoriaval hamarosan. http://www.anandtech.com/show/8727/nvidia-ibm-supercomputers
A legkevesbes sem feltem az nv-t. Inkabb az amd-t. Kell nekik a hbm memoria mint a sivatagban eltevedt embernek a viz.
 
Válasz írásához előbb jelentkezz be!
7. csabi02
2014.11.18. 21:16
ocsabi és RealDreamQ +1

Quadro mindig is studio,visual... területet célozta és a tesla meg számolni van.
 
Válasz írásához előbb jelentkezz be!
6. morgyi
2014.11.18. 21:31
Te egy kis fogalomzavarban vagy. Az NV nem gyárt külön GPU-t Workstation Graphics-ra és HPC-re. Van a GK210-es GPU és bizonyos dolgok vannak letiltogatva illetve engedélyezve. A Quadrok drivere erősen OGL-re van optimalizálva meg specifikus optimalizálásokat tartalmaz CAD és 3D szoftverekre.
A Tesla meg HPC-re van optimalizálva de driverből. A GPU attól még ugyanaz, esetleg nem ugyanaz aktív.

Én inkább azon akadnék fent, hogy mivel a Maxwellből a fogyasztás oltárán kiszórtak minden apró pluszt adó fixfunkciós egységet és támogatást, a Keplerre épül új gyorsítókártya, nem pedig a Maxwellre.

Ellenben az AMD ugyan arra az achitektúrára épít ARM mellé, ultramobilba, mobilba, mobil APU-ba, asztali APU-ba, belépő VGA-ba és csúcs VGA-ba.
 
Válasz írásához előbb jelentkezz be!
5. pdx06
2014.11.18. 23:26
Igazából nem értem hova kellenek ezek. Most őszre terveztem videokártya cserét, de mivel minden szuperül fut a mostani 3 éves kártyámon is, ami érdekelt az idei címek közül és féltem a gépigénytől - így elhalasztom a dolgot.
 
Válasz írásához előbb jelentkezz be!
4. sensejke pdx06
2014.11.19. 00:04
Ez nem játékra van.
 
Válasz írásához előbb jelentkezz be!
3. RealDreamQ pdx06
2014.11.19. 12:09
Nyugi - ezek nem otthoni használatra készültek ! AZ árából 3 gépet összeraksz .
Mint láthatod nincs rajta Monitor csatlakozókból egyik típus sem , nem azért mrt elfelejtették ráforrasztani ... eme kártyáknak a kegyetlen nagy számítási teljesítménye miatt van szükség professszionélis területeken. NEM home usereknek szánták . Hacsak nincs véletlen egy szervered / szerverparkod a spájzban
 
Válasz írásához előbb jelentkezz be!
2. skateout pdx06
2014.11.20. 00:02
Csak rövid kérdés: Látsz te ezen videó kimeneti portot?
Nem fikázás, de komolyan nem értem miért szólnak olyanok akik nem értik a cikket sehogy sem.
 
Válasz írásához előbb jelentkezz be!
1. ny
2014.11.21. 18:55
siriq:

ezek a gepek '17 vegen jonnek majd. Az utemtervek alapjan vagy egy evig AMD monopolium lesz a stacked ram. (?)
En amd reszvenyt vennek inkabb (ha a proci piacon nem jatszananak.)
 
Válasz írásához előbb jelentkezz be!