iPon Hírek

Jövőre debütál az Intel első sokmagos gyorsítója

Dátum | 2011. 06. 21.
Szerző | J.o.k.e.r
Csoport | FŐ EGYSÉG

Az ISC (International SuperComputing Conference) alkalmával az Intel néhány friss információval szolgált a MIC (Many Integrated Core - sok integrált mag) architektúrájával kapcsolatban. A sokmagos chipekkel már régóta foglalkozik a cég, az első próbálkozásuk a Larrabee volt, ami viszont sosem került kereskedelmi forgalomba, nem találták elég gyorsnak. Fejlesztői példányok azért készültek belőle, hogy lehessen készülni a jövőre, az Intel pedig folytatta a fejlesztéseket, mert határozott célja, hogy belép a HPC (High-Performance Computing) szegmensbe, ahol most az nVidia Teslái és az ATI FireStreamjei vannak.

A Larrabee projekt kiváló alappal szolgált a MIC chipek fejlesztéséhez, melyekben x86-os processzormagok vannak és társprocesszorként képesek működni az adott rendszerben. Ahogy az a korábbi hírek alapján már tudható, az Intel egyes partnerei számára elérhetővé tette a Knights Ferry MIC prototípusait, amelynek segítségével előkészítheti a terepet az első kereskedelmi forgalomba kerülő MIC számára, amely Knights Corner néven debütál majd a nem is oly távoli jövőben. A Knights Corner esetében a vállalat ugyanazt a 22 nm-es gyártástechnológiát alkalmazza majd, amit a jövő tavasszal megjelenő Ivy Bridge processzoroknál is használni fog (a Knights Ferry prototípus esetében még 45 nm-es gyártástechnológiát alkalmazott a vállalat).


A mostani bemutató alkalmával a Knights Ferry teljesítményéről kaphattak némi képet a látogatók, hála az Intel partnereinek, akik között a CERN, a Forschungszentrum Juelich, a Liebniz SuperComputing Centre és a Korea Institute of Science and Technology Information is jelen van.

A hivatalos sajtóközlemény szerint az Intel MIC (Many Integrated Core) architektúrájának sajátosságai miatt a Xenon processzorokra írt alkalmazások rendkívül gyorsan és egyszerűen átültethetőek a Knights Ferry szoftverfejlesztő platformra, így azok kiaknázhatják a MIC termékben rejlő lehetőségeket. Az eredetileg Xeon processzorokhoz fejlesztett és optimalizált szoftverek a programozási modell hasonlóságai miatt órák alatt optimalizálhatóak az Intel MIC architektúrájára, amelynek eredményeként az adott feladat esetében sikerült 650 GFLOP/s feletti teljesítményt elérni. Az Intel illetékesei egyébként úgy fogalmaztak, hogy "aki Xeon processzorra tud alkalmazást fejleszteni, az MIC processzorra is tud". (Azért mi ehhez hozzátennénk, hogy igen, ha ki tudja használni SIMD lehetőségeket)

Knights Ferry gyorsítókártya.
A Knights Ferry névre keresztelt MIC prototípusa ugyan első ránézésre olyan, mint egy videokártya, de mégsem az (a Larrabee anno még az is lett volna). Az AMD és az Nvidia megoldásaival ellentétben az Intel a meglévő x86-os mikro-architektúrát használja a termék esetében (mint a processzorainál). A Knights Ferry egyébként 32 x86-os maggal rendelkezik, 2 GB-nyi GDDR5-ös fedélzeti memóriát tartalmaz és PCI Express csatolófelületen kapcsolódik az adott rendszerhez, amely egy vagy több Xeon processzorból áll.

Az Intel egyik munkatársa, Anthony Neal-Graves korábban néhány érdekességet is elárult a Knights Ferry-vel kapcsolatban. A prototípus az SGEMM benchmarkban teraFLOP/s-os nagyságrendű számítási teljesítmény elérésére is képes volt. A hírek szerint a Knights Corner, a Knights Ferry utódja, amely jövőre kerül forgalomba, már nem 32, hanem 50 vagy több x86-os magot tartalmaz majd, így a fentebb említett teljesítményszint könnyedén  a duplájára ugorhat. Hogy ezt a teljesítmény jobban el tudjuk helyezni, nézzük, hogy a riválisok HPC szegmensbe szánt megoldásai hasonló helyzetben mire képesek. A szakemberek szerint az Nvidia leggyorsabb, M2090-es Tesla gyorsítókártyája 800-900 GFLOP/s-os számítási teljesítményt tud felmutatni ugyanebben a tesztprogramban, míg az AMD leggyorsabb FireStream terméke nagyjából kétszer ekkora számítási teljesítmény elérésére képes. Nem szabad elfelejteni azt a tényt sem, hogy 2012-ben megjelenik az Nvidia Kepler kódnévre keresztelt GPU architektúrája, amely a jelenlegi, Fermi kódnévre keresztelt megoldásokhoz képest akár háromszor nagyobb teljesítményt is kínálhat. Furcsa tény, hogy az Intel csak a Knights Ferry egyszeres pontosságú teljesítményéről adott eddig képet, a dupla pontosságúról nem, pedig a HPC szegmens képviselőit igencsak érdekelné, hogy mire képes a MIC ebben a tekintetben (elviekben csak feleződnie kéne a teljesítménynek).

Számítási teljesítmény ide vagy oda, az már biztos, hogy a Intel együttműködik az SGI-vel, a Dell-lel, a HP-vel, az IBM-mel, a Colfax-szal és a Supermicro-val annak érdekében, hogy elkészülhessenek az első, Knights Corner köré épülő szerverkonfigurációk, amelyek 2012-ben kerülhetnek forgalomba.  Azt egyelőre még csak megbecsülni sem lehet, hogy az Intel Knights Corner-je mire megy majd a következő generációs AMD és Nvidia GPU architektúrák köré épülő termékekkel szemben, de az már jól látszik, hogy a gyártóval a jövőben számolniuk kell a HPC szegmens résztvevőinek. Izgalmas jövő elé nézünk, az már egyszer biztos.

Új hozzászólás írásához előbb jelentkezz be!

Eddigi hozzászólások

40. anzani
2011.06.21. 16:10
jól néz ki
 
Válasz írásához előbb jelentkezz be!
39. gezu1025
2011.06.21. 16:13
Nem akarok itt okoskodni, majd akik tényleg értenek hozzá megmondják a tutit, de ez nem egy halott ötlet?

Ha 1 db ilyen gyorsítókártyára van szükség akkor van gyorsabb, ha nagy szervert kell építeni akkor fogyasztás/teljesítmény szempontból ARM.
 
Válasz írásához előbb jelentkezz be!
38. Joachim21 gezu1...
2011.06.21. 16:18
Nem halott az ötlet (minek ölne bele milliárdokat, ha az lenne?), mert jelenleg az Nv itt kaszálja a legnagyobbat, az AMD is olyan GPU architektúrát jelentett be ami leginkább ide szól, és ahogy ez a felhő néven elhíresült borzalom egyre közeledik, úgy a nagy számítási kapacitásra is egyre inkább szükség lesz. Az Intel megoldása annyiban egyedi, hogy X86-os magokat használ, tehát a CPU-ra írt kód könnyen átültethető erre is, nincs szükség külön fordítóra.
(Azért remélem nagyot buknak [a kepler ellen], bár a hátszél és az összefonódások megvannak, hogy akármilyen szar is legyen, teret nyer, és lesz ideje tökéletesíteni az intelnek.)
 
Válasz írásához előbb jelentkezz be!
37. Juliska
2011.06.21. 16:22
Ritka hülyeség amit az Intel állít. Sehogy sem ültethetők át a Xeonra írt programok, mert úgy lettek programozva, hogy cache koherencia pár szállal jó legyen. Most idedobják ezt a szörnyet sok száz konkurens szál kezelésével, de nem gondolják át, hogy ember nincs aki ennyi szálat képes kontrollálni. Igazolhatnának pár rendszermérnököt az Nvidiától, hogy képben legyenek miért nem jó ez az irány. Ezt a processzort úgyis feladat párhuzamosan fogják programozni, nem érdekli a programozókat, hogy az Intel mit akar.
 
Válasz írásához előbb jelentkezz be!
36. Parano1d
2011.06.21. 16:22
Én is azt mondom, hogy a larrabee koncepciójával volt inkább a probléma, és nem a kivitelezéssel. Ezzel ugyanez a helyzet, nem nagyon van olyan célközönség, ahol versenyképes lesz a cucc.
Röviden: lesz egy sokmagos feldolgozóegység baromi drágán, ami bármilyen számolási munkára használható lesz, de igazából semmire sem lesz elég jó.
 
Válasz írásához előbb jelentkezz be!
35. gezu1025 Joach...
2011.06.21. 16:44
Én is úgy gondoltam, hogy a piaca megvan ennek a szegmensnek, méghozzá egy jó kövéren növekvő piaca. Én ennek a kártyának a létjogosultságát kérdőjeleztem meg, mert ez a darab nem tűnik versenyképesnek. De úgy gondolom, hogy tömegesen fogják eladni, mert INTEL.......
 
Válasz írásához előbb jelentkezz be!
34. jozsefm
2011.06.21. 17:12
Jól látod.A termék már már megvan, az igényeket meg majd hozzáigazítják,készítenek néhány olyan tesztprogramot ami ennek a gyorsaságát bizonyítja (sőt semmi máson nem fut),megfizetnek néhány "szakirót" aki ódákat zeng róla,néhány tanulmány írót aki külső szakértőként tanácsokat, hatástanulmányokat sokszorosít kormányhivataloknak....na szóval, fog ez menni.
 
Válasz írásához előbb jelentkezz be!
33. gabest
2011.06.21. 17:44
CUDA, OpenCL, mind egy hatalmas zsákutca, nagyon szűk alkalmazási területtel. Egyszer jönnie kell valaminek egy használhatóbb memóriakezeléssel.
 
Válasz írásához előbb jelentkezz be!
32. Juliska
2011.06.21. 18:04
gabest: Biztos nem az a megoldás, hogy GPU-ba is berakjuk az x86 memória-architektúráját. Inkább valami virtuális utasításrendszer-architektúrán kellene gondolkodni.
 
Válasz írásához előbb jelentkezz be!
31. Richard83
2011.06.21. 18:15
Hát nem tudom mennire lesz ez jó, de kinézetre ocsmány, úgy néz ki mint egy kínai üzletben vásárolható plasztik játék!
 
Válasz írásához előbb jelentkezz be!
30. gezu1025
2011.06.21. 18:19
"úgy néz ki mint egy kínai üzletben vásárolható plasztik játék!"

Mivel az is
 
Válasz írásához előbb jelentkezz be!
29. Joachim21
2011.06.21. 18:23
Érdekes.
Ez is, idehaza nem nagyon foglalkoztak vele.
 
Válasz írásához előbb jelentkezz be!
28. Ragnarr
2011.06.21. 18:58
Nagyon jo lesz ez meg a jovoben , ha mar multithread aplikaciokat fognak rajta futtatni , ray-tracingre is igen hatekony megoldas
 
Válasz írásához előbb jelentkezz be!
27. pergerj
2011.06.21. 19:08
sztem is.. a cloud alapú felhasználásnál látom értelmét, de egyébként az ilyen állatokat nem tartom túl gazdaságosnak.. mármint (sem a vételt sem) az üzemeltetést.. és nem feltétlen otthoni felhasználásra gondolok

De például az egyszerűség kedvéért adott egy játék.. minden a szerveren.. te meg csak a kész képet kapod és mjuk egy 64fős multit tolsz.. na oda kell erő
(meg mjuk az internetsebességeket is párszor sokszorozni kell addig )
 
Válasz írásához előbb jelentkezz be!
26. Juliska
2011.06.21. 19:54
Joachim21: Erről a ph-n olvastam, de nem találom a hírt. Szerintem ez akkor előnyös, ha nem számít annyit a teljesítmény vagy vannak kisebb igényű algoritmusok, amik nem követelnek erős GPU-t.
Komoly fejlesztést nem tudok elképzelni, mert CPU-nál a rendszer és az eszközmemória ugyanaz. GPU-nál sajnos még nem.
 
Válasz írásához előbb jelentkezz be!
25. ThePoweR jozse...
2011.06.21. 20:00
Így kell csinálni.
 
Válasz írásához előbb jelentkezz be!
24. jozsefm Joach...
2011.06.21. 20:12
Nem kapott túl nagy publicitást, és nem is tudni hova jutnak,szerintem késő, számukra az X86 vonat elment.Ezen akkor kellet volna gondolkodni mikor all-in mentek lap nélkül az AMD és Intel partiban,kiestek a végjátékból.
 
Válasz írásához előbb jelentkezz be!
23. Terror
2011.06.21. 20:20
Inkább kivárnám a végét, mert lehet, hogy pont az AMD/zIntel fürdik be ezzel az x86-os dologgal.
 
Válasz írásához előbb jelentkezz be!
22. jozsefm ThePo...
2011.06.21. 20:25
ThePoweR Ma, 20:00
Így kell csinálni.
Igen, ezt hívnák szervezett bűnözésnek,ha nem a más csinálná...
 
Válasz írásához előbb jelentkezz be!
21. Juliska
2011.06.21. 20:28
Terror: Az x86-tól elszakadni egy álom lenne. Az AMD legalább már rájött, hogy az x86 a bottleneck, és nem viszi tovább a GPU-ba.
 
Válasz írásához előbb jelentkezz be!
20. ThePoweR jozse...
2011.06.21. 20:46
Igazából itt nem az a hibás aki lefizet valakit hanem aki elfogadja és azt csinálja amit mondanak. És igen ezt kell csinálni. Bárki megtehetni csak jól kell csinálni hogy ne kapják el. Mint ahogy az országban a sikkasztás. Bárki megteheti. Aki csinálja jól csinálja mert még mindig nem kapták el. Mindenki előtt ott a lehetőség. Az más kérdés hogy arc is kell hozzá.
 
Válasz írásához előbb jelentkezz be!
19. nano
2011.06.21. 21:57
Juliska: "Sehogy sem ültethetők át a Xeonra írt programok, mert úgy lettek programozva, hogy cache koherencia pár szállal jó legyen. Most idedobják ezt a szörnyet sok száz konkurens szál kezelésével, de nem gondolják át, hogy ember nincs aki ennyi szálat képes kontrollálni."

Erre szokták azt mondani, hogy ülj le szépen, egyes.

Nem tudom, hogy hallottál-e már a szuperszámítógépekről, vagy a kistestvérükről, a klaszterekről??? Ezekben ugyanis több száz/ezer Xenon (AMD vonalon Opteron) proci van, és ezekre is tudnak hatékony programokat írni.

Az egyetemen egyszer egy elég nagy számolásigényű problémába futottam bele. A kódot megírtam Matlabban, és optimalizálás után a gépemen futott volna úgy két hónapig. A megoldás az az volt egy nap alatt összehangoltam 10 gépet egymással és a Matlabbal, majd pedig a kódot is egy nap alatt optimalizáltam 20 magra. Végül pedig egy hét alatt végzett a számolással.

Ennyit a kódok párhuzamosíthatóságáról. Ehhez persze hozzátartozik az, hogy a Matlab már fel van készítve a párhuzamos számolásokra, a feladatok szétosztására.


A GPU alapú megoldásokkal szemben ez pedig egy teljesen univerzális cucc, gyakorlatilag bármit lehet rajta futtatni, ami párhuzamosításra is optimalizálva van, nem kell a korlátozott utasításkészlettel szórakozni. Rengeteg olyan tudományos/mérnöki program van, ami már most is gyakorlatilag csak párhuzamosan futtatható a hatalmas számolási igény miatt. Ez a cucc pedig tipikusan munkára lett kitalálva, nem pedig e-pénisz méregetésre. Szóval én nagyon örülök, hogy van ilyen irányú fejlesztés is. (Az más kérdés, hogy jó eséllyel jó sokáig nem fogok ilyet használni.)

 
Válasz írásához előbb jelentkezz be!
18. tibaimp
2011.06.21. 22:02
Elolvastam a cikket. OK, gondoltam az Intel ide is befejleszt, erre a piacra is betör, erre olvasom a hsz-eket és rájöttem, hogy a hozzászólók mind processzorgyártó matematikus zsenik, mert egyébről nem szólnak a hsz-ek, mint az Intel ilyen hülye, meg olyan, ott biztos tök analfabéták/idióták dolgoznak, de Ti ZSENIK VAGYTOK.

Gratulálok....

Én csak egy dolgot fűznék hozzá, majd meglátjuk.
 
Válasz írásához előbb jelentkezz be!
17. Dragon3k
2011.06.21. 22:25
Nem tudtad? mivel intel fikázni kell
 
Válasz írásához előbb jelentkezz be!
16. Terror
2011.06.21. 22:51
Ha valaki kritikával illet egy terméket, attól még nem biztos, hogy a user a hülye, és nem a gyártó. Ott van pl. Sparkle GForce GT220 kereken 2 Gigabyte DDR2-es memóriával. Ugyan senki nem tudja megmagyarázni, hogy ez mire jó, de a gyártó biztosan jobban tudja.
 
Válasz írásához előbb jelentkezz be!
15. ThePoweR Terro...
2011.06.22. 00:02
Azt a gyártó megmagyarázza azzal hogy csak a hülye vevők miatt akik a nagyobb számokat nézik.
 
Válasz írásához előbb jelentkezz be!
14. BillGetz
2011.06.22. 00:46
Én ehhez a magasröptű vitához nem tudok hozzászólni, na meg nem is érint.
(Ha én a felhőbe megyek, akkor nekem már tökmindegy lesz.
Egyébként valószínűbb számomra az ellenkező irány, dél felé, ha eljön az időm. )

Ezt viszont nem tudtam figyelmen kívül hagyni:
"A hivatalos sajtóközlemény szerint[...] a Xenon processzorokra ..."
Xenon a kocsimban van, ez Xeon akart lenni, nem?
 
Válasz írásához előbb jelentkezz be!
13. carraroxt
2011.06.22. 09:40
Egy biztos, amit az Intel csinál az üzletileg sikeres termékké válik, még ha műszakilag szar is (lásd pl a p4-esek sokéves "dicső" menetelését). És bár a szerver piacra nem annyira egyszerű ráerőszakolni a hulladék termékeket, de azért én biztos vagyok benne, ha netán nem az elvárásoknak megfelelően teljesít, attól még nem fogják elmulasztani a piacra dobását.
Egyébként meg az NV-nek addig van jó világ amíg nem kell közvetlenül konkurálnia az Intellel. Szemtől szembe max két év alatt bedarálják őket, és ha nem a jobb műszaki tartalmú termékekkel, hát másképp. Már kaptak is a zöldek korábban ízelítőt mire számíthatnak...
 
Válasz írásához előbb jelentkezz be!
12. Ragnarr
2011.06.22. 14:50
@tibaimp: teljesen egyetertek veled , tul sok itt a TROLL

garantalom hogy a leghevesebben TROLLkodok meg egy szal sor programot se irtak CPU/GPU-ra

egy kis izelitto hogy mit is tud meg a jo oreg x86:
video

 
Válasz írásához előbb jelentkezz be!
11. asdsa
2011.06.22. 15:06
Szerintem meg csak azért b*ssza a csőrötöket, mert Intel, mivel egy rakat pénzből csak egy kék darab szart lehet csinálni?Ha ez egy bukott ötlet lenne akkor bele se kezdenének.
 
Válasz írásához előbb jelentkezz be!
10. Terror asdsa
2011.06.22. 15:19
Hja, bele se kezdenének, mint pl. az MMX alapú videógyorsításba, vagy a Larrabee-be.

Ragnarr - majd szólj, ha a ray-tracingből lett valami. Amúgy szép videó, csak az a kár, hogy 4 darab 10 magos Xeon alatt fut a cucc (összesen 40 mag), és ahhoz képest még lassú is. Mindezt azért, hogy lenyomják nekünk ezt a gyönyörűséges demót. A fickó ilyet mond a videó közben: "simple and fast". Búúúhhúúúú.
 
Válasz írásához előbb jelentkezz be!
9. pergerj
2011.06.22. 18:50
laikusként azt gondolom egy izmos gpun sokkal gyorsabb lenne (ha nem x86-os lenne a kód) és azt vettem ki a videóbol, hogy mindössze azért jobb cpu-n, mert jelentőssen több ram jut a műveletre, mint amennyit a gpuval lehetne elérni.
(Akkor az ilyen célú felhasználásra miért nem hoznak létre egy olyan rendszert, ahol lenne egy #2 ram, amihez a gpu hozzáfér? vagy építenek egy brutális gput mjuk 48gb vrammal stb?)
egyébként tényleg eléggé gyors.. 40db xeon magtól ennyi telik az rofl
(egyébként az megmondaná valaki, hha nem változtatja a programban a beállításokat, akkor miért 100% a procihasználat?? vagy akkor a 0,5fps helyett mjuk képes az egyszer már kiszámolt állóképet mjuk 60fpsben feldolgozni??)
 
Válasz írásához előbb jelentkezz be!
8. Joachim21 carra...
2011.06.22. 19:11
Itt van pár érdekes következtetés, ami a Larrabee-t, és a Fermit is más fénybe helyezi.
 
Válasz írásához előbb jelentkezz be!
7. carraroxt
2011.06.22. 20:05
Csak semmi elhamarkodott negatív következtetést ezzel kapcsolatban!
 
Válasz írásához előbb jelentkezz be!
6. berner
2011.06.23. 13:17
józsef m. - 2011-06-21 17:12:29 Dr. Prof. Doc. Akadémiai főelnököt nullagyú egyik kollegát hallhatták, vagy láthatták...
 
Válasz írásához előbb jelentkezz be!
5. berner
2011.06.23. 13:17
tibaimp - 101%-ban igazad van, túl sok itt az okoskodó nullagytojás...
 
Válasz írásához előbb jelentkezz be!
4. carraroxt
2011.06.23. 16:03
Loool kimenő van a mosolygóban?
 
Válasz írásához előbb jelentkezz be!
3. berner
2011.06.24. 12:26
érdekes nekem pont ez jutott az eszembe, amikor megláttalak itt.
 
Válasz írásához előbb jelentkezz be!
2. tibaimp
2011.06.24. 17:58
Az az érdekes, hogyha ezt a sokmagos kártyát 22nm-el az amd dobta volna piacra, a sok "szakértő" ódákat zengett volna róla, az égig magasztalták volna az tuti, mert mindig ez van, és erre mondjátok TI, hogy az Intelesek fanatikusak.

A jelek szerint ez pont fordítva van.

Amúgy meg nem kell szeretni az Intelt, a piaci részesedés és az éves sok milliárd dolláros árbevétel és adózás utáni nyereség magáért beszél.
 
Válasz írásához előbb jelentkezz be!
1. berner
2011.06.27. 12:45
ott a pont Tibaimp-nél. Lehet ugatni, de a tények magukért beszélnek. Lehet ugatni h jó a marketing de van tudás mögötte, nem úgy mint a 10%-os amfosdének....
 
Válasz írásához előbb jelentkezz be!