iPon Hírek

Új információk érkeztek az Intel Haswell APU egységeiről

Dátum | 2012. 09. 13.
Szerző | J.o.k.e.r
Csoport | FŐ EGYSÉG

A Haswell processzorok – pontosabban inkább APU egységek – a „Tock” fázis részeként érkeznek, azaz ugyanúgy 22 nm-es csíkszélességgel és 3D tranzisztor technológiával készülnek, mint Ivy Bridge alapú társaik, ám már frissebb architektúrára alapoznak, amely jótékony hatást gyakorol a rendszer összteljesítményére. A Haswell APU egységek esetében a nagyobb teljesítményre és a hatékonyabb energiafelhasználásra helyezték a hangsúlyt a vállalat mérnökei, ahogy az az alábbiakból is kiderül.


A Haswell APU egységeknél az Ivy Bridge processzorok esetében már megismert felépítés köszön vissza, itt nem történt semmi változás, már ami az alapkoncepciót illeti. Az egyes részegységek esetében már persze más a helyzet. Vegyük is sorra, milyen új információk érkeztek.

Változások processzormagok szintjén

A Haswell APU egységek kettő- és négymagos változatokban kerülnek forgalomba. Komoly változás, hogy az L1-es és L2-es gyorsítótárak adatátviteli sebessége a korábbi duplájára nőtt. Ez annyit jelent, hogy az L1 cache 48 bájt helyett 96 bájt feldolgozására képes, az L2 cache adatátviteli sávszélessége pedig 32-ről 64 bájtra nőtt – ezek az adatok természetesen órajelenként értendőek.


Az új processzorok esetében friss utasításkészletek is bemutatkoznak. Az egyik ilyen az AVX továbbfejlesztett változata, az AVX2. Az egyes processzormagokhoz tartozó 256-bites vektorfeldolgozók – amelyekből processzormagonként kettő áll rendelkezésre – ciklusonként 16 darab FP32-es FMA művelet elvégzésére képesek (és mivel kettő van belőlük így összesen 32-re, ahogy a táblázat is mutatja).


További változás, hogy a Haswell esetében fejlődik az out of order logika és elágazásbecslés, valamint növekszik az L2 TLB (Translation Lookaside Buffer) mérete is. A Haswellnél energiahatékonyabb kapcsolat áll majd rendelkezésre a CPU és a PCH között, valamint a gyártástechnológia esetében is eszközölnek némi optimalizációt, ami főleg az üresjárati fogyasztásra gyakorol jótékony hatást.

Új integrált videó vezérlő és fejlettebb multimédiás képességek

A Haswell APU egységek az Ivy Bridge modellekben alkalmazottnál fejlettebb integrált videó vezérlőt alkalmaznak, amely háromféle változatban lesz elérhető.


A GT1-es, GT2-es és GT3-as változatok egyformán a Gen 7.5-ös architektúrára alapoznak, shader tömbökből azonban már eltérő mennyiség lesz bennük aktív: a GT1-sek 1 tömböt, a GT2-esek 2 tömböt, a GT3-asok pedig a rendelkezésre álló összes, azaz 4 tömböt kapnak. Azzal kapcsolatban egyelőre nincsenek információk, hogy egy-egy ilyen shader tömb pontosan mennyi shadert foglal magában, de remélhetőleg már erre az információra sem kell sokat várni.


Az már viszont biztos, hogy a DirectX 11-es, OpenGL 4.0-s és OpenCL 1.2-es támogatással ellátott integrált videó vezérlők esetében számíthatunk a shaderszámon felül is változásokra. Az egyik fontos változás az, hogy egy render tömb a Haswell APU-k esetében már két shader tömböt szolgál ki, a textúrázó blokkok pedig ténylegesen Gather4 kompatibilisek lettek, ami optimális esetben gyorsulást hoz a különböző játékok alatt. A korábbi pletykák szerint a GT3-as, azaz a legfejlettebb IGP megmarad a mobil processzorok kiváltságának, az asztali Haswell APU-k pedig csak GT1-es, illetve GT2-es osztályú IGP-t tartalmazhatnak, modelltől függően. Az IDF alkalmával egy rövid bemutatót már láthattak a kilátogatók, amelynek keretén belül egy mobil Haswell APU integrált videó vezérlőjének teljesítményét, illetve képességeit lehetett megcsodálni Skyrim futtatása közben. Íme:
 


A Haswell APU integrált videó vezérlője az Intel szerint esetenként akár kétszer gyorsabb lesz, mint az Ivy Bridge IGP-je.


Az egyik bemutató alkalmával lefuttatott  Unigine demón a Haswell APU integrált videó vezérlője valóban kétszer magasabb képkocka/másodperces teljesítményt mutatott fel, mint az Ivy Bridge alapú rendszer IGP-je, ami szép teljesítmény.

Szintén az IGP-hez tartozik, hogy a Haswell APU egységek esetében DisplayPort 1.1-es helyett immár DisplayPort 1.2-es támogatás érkezik, így a 4K-s megjelenítők kezelése nem jelent majd problémát.



A Haswell APU egységek a felsoroltak mellett egy VQE névre keresztelt, fixfunkciós egységet is tartalmaznak, amely a videók jobb minőségéről gondoskodik. A minőségjavításért különböző effektek felelnek, de rajtuk kívül képstabilizáló funkció is helyet kapott a repertoárban, kíváncsian várjuk, hogy működik a gyakorlatban.

Szóba került az energiahatékonyság is


A demó alkalmával az Intel arról is ejtett néhány szót, hogy mennyire energiahatékony lesz az új platform. A vállalat egyik diája szerint a Haswell platform esetében az üresjárati fogyasztás akár húszszor alacsonyabb lesz, mint amit egy Sandy Bridge alapú platform esetében megszokhattunk.

Ide kapcsolódik az az értesülés is, amely szerint a következő generációs ULV processzorok a jelenlegi 17 wattos helyett már csak 10 wattos TDP-vel rendelkeznek majd. Ezek az alacsonyfogyasztású modellek eleinte csak kis mennyiségben lesznek elérhetőek és főként a konvertibilis ultrabookokban kapnak helyet.

Új hozzászólás írásához előbb jelentkezz be!

Eddigi hozzászólások

10. bodomehesz...
2012.09.13. 11:40
No ez nagyon odacsapott. Köthetik fel a gatyát az előző szériák bár megszokhattuk a kékektől, hogy brutális fejlődést tudnak csinálni, és brutális fejlesztéseket is.
Ez lesz a köv CPU-m
 
Válasz írásához előbb jelentkezz be!
9. atti2010 bodom...
2012.09.13. 12:01
Inkább azt szokhattuk meg a kékektől hogy nagyot ígérnek és a fele sem teljesül mikor ténylegesen megjelenik az adott termék, ott vannak az Ivys tesztek mikor volt képük a játékot videóról leforgatni hogy milyen szépen megy.
 
Válasz írásához előbb jelentkezz be!
8. gabest
2012.09.13. 14:13
Ivy helyett már idén kihozhatták volna.
 
Válasz írásához előbb jelentkezz be!
7. Radon
2012.09.13. 15:14
Érdekes, hogy atti2010, aki már nagyon sok AMD-s topicban megszólta az oda rondító intel fanokat, most saját hitvallásával homlokegyenest ellentétesen benéz egy inteles témához és fekával kenegeti az AMD riválist.

Egyébként a játékot nem videóról forgatták le, ahogy te azt nagyon magyartalnul állítod, hanem vetítették. Csakhogy azt fel is kellett venni. Talán legközelebb hozzá költhetnéd, hogy egy trinity renderelte azokat a jeleneteket.

"Inkább azt szokhattuk meg a kékektől hogy nagyot ígérnek és a fele sem teljesül " Ferdítesz és szélsőségesen fogalmazol, szokásod szerint. A Phenom és Bulldozer megjelenése előtti nagy AMD-s marketingben állított dolgok sem voltak igazán köszönő viszonyban a megjelent termékkel. Ezt csak azért jegyeztem meg, meg ez volt az a két időszak, amikor intel procit választottam AMD helyett.

E
 
Válasz írásához előbb jelentkezz be!
6. tibaimp
2012.09.13. 17:47
atti2010 - 2012-09-13 12:01:58: ez mondjuk inkább az amd-re igaz, mert ők nagyon szép grafikonokkal hasonlítják össze a szaros procijaikat, majd mikor az megjelenik nagy semmi lásd: phenom 1-es széria, bullfosder, stb. csak egy pár példa.
 
Válasz írásához előbb jelentkezz be!
5. Terror
2012.09.13. 17:58
Épp a minap lettetek megdicsérve, hogy trollkodás meg fröcsögés helyett tudtok értelmesen is kommunikálni, de látom ennek már vége.
 
Válasz írásához előbb jelentkezz be!
4. bodomehesz...
2012.09.14. 09:18
atti2010 - 2012-09-13 12:01:58 - nahh ez nagyon nem igaz. Te sem gondolod komolyan. Ahogy tibaimp mondja inkább a zöldekre igaz, és ezt ne cáfold meg mert gy van. Amit a kékek igértek mindig betartották, sőt többet. De nem vitatkozok.
 
Válasz írásához előbb jelentkezz be!
3. szilaard
2012.09.14. 09:24
Nem vagyok egy hardver guru alkat, teljesen SZUBJEKTÍV a véleményem!

Szóval a Moore-törvény eddig elég jól működött, azonban az Ivy Bridge tranzisztorainál már megjelentek kvantumos hatások, másrészt a CPU-k architektúrája olyan bonyolult lett, hogy ... nem fogjuk tudni tartani a tempót!
(Magyarul egy 1 GHz-en 64 maggal, és egyszerű architektúrával futó RISC proci uzsonnára megenne egy hagyományos Intel porcit - párhuzamosítható feladat esetén. A GPU computing is valami ilyesmiről szól.)

Ezzel szemben mi áll? A CPU gyártók egy olyan árbevétel és gyártási volumen párosra álltak rá, amikor is 3 évente minden szgépet kidobnak, és 3 évente a világon minden íróasztalra megvesznek egy új CPU-t. Azonban aki pénzt ad egy új technológiáért, azt meg is kell győzni, hogy miért adjon ki pénzt!

Harmadrészt a VALÓDI igények nem növekednek ekkora tempóban, mint amit a CPU gyártók diktálnak. (Példa: lányom kapott egy kb 7 éves laptopot fél giga RAM-mal, integrált grafikával - szédítő, hogy a régebbi játékokon milyen teljesítményre képes Win XP alatt - qrva jó kis vas. DE ma, 2012-ben netezni szinte lehetetlen vele, ugyanis minden weblap tele van tonnányi flash animációval, ami egyszerűen kiüti a gépet!!!) Annó a 6 évvel ezelőtti 1 magos aztali gépemen dolgoztam (office + web sok ablakkal), közben videót néztem, 10% alatti CPU terhelés mellett ...

Na, ITT kezd el egyre durvábban elválni egymástól a lehetőségek tengere és az ígéretek földje!
 
Válasz írásához előbb jelentkezz be!
2. szilaard
2012.09.14. 10:02
Ja, még valami - lehet, hogy nekem szűk az agyam, de az Nvidia CUDA programozási dokumentációk azzal kezdődnek, hogy számítási teljesítmény az van dögivel, az igazi gond: hogy etessük az 500 magot adattal! Vagyis memória sávszél "bottleneck" van a videokártyáknál. Akkor mi a fenének tuningoják a grafikus magokat a csillagos égbe 2 csatorna x 32 bit DDR3 RAM mellett??? Már régen 4 utas memvezérlőkkel kellene nyomulni - ha sok mag van (IB-E), akkor azért, ha integrált video van, akkor azért - nem gondolják IGAZÁN komolyan az integrált video témakörét a nagyok - szerintem!!! Egy 4 csatornás memvezérlős rendszerben a középkategóriás VGA kártyákat ki lehetne irtani a porondról!

Én - szívem szerint - egyféle, egységes socket rendszert csinálnék, és 3 féle "mag komponenset": 1. video (textúrázók, stb, ami kell) 2. gyors mag (a "Haswell-hez hasonló" 3. hatékony, de kód-kompatibilis mag (Atom procikban lévő)
Az CPU-k abban különböznének, hogy a háromféle komponenst milyen arányban tartalmaznák!

A szerverekbe raknék 64 atom magból álló procit. Workstationokban lenne 4 gyors mag, és 32 hatékony mag - ugyanez jó erős gamer gépekbe erős videokari mellé (a 32 hatékony a Phys-X-et tudná számolni). Belépő gamer gépekbe 2 gyors mag és 48 grafikus mag. Irodai munkára 6 gyors mag, és 16 grafikus ... stb.
Ugyanaz az alaplap, ugyanolyan memóriák, stb. Csak a procik lennének "modulárisan összerakva".
Sőt, egy ilyen rendszer arra is képes, hogy teljesítmény váltás esetén nem kell órajelet piszkálni, hanem kikapcsolnak egyes modulok - ha kevés a feladat, egy "Atom magon" fut az egész cucc, ha kicsit több vegyes feladat van, akkor 2 hatékony magon. Gyors magok futnának 4GHz-en, hatékony magok 2GHz-en, grafikus magok 1GHz-en. (Az új ARM "little big" architektúra is valami ilyesmit csinál - de az Intelnek is vannak "gyors" és "hatékony" magjai, ő is megtehetné ugyanezt!)

Nekem olyan érzésem van, hogy "toldoznak-foldoznak" dolgokat a CPU gyártók, egyszerűen új, értelmes koncepciót nem látok felbukkanni. Nekem laikusnak őrület, hogy egy compilerben 168 féle fordítási opció van, hogy milyen utasításkészletet használjon, mert minden évben megtoldja az Intel 3 szaros új CISC utasítással a készletet!!!
Amúgy az, hogy ragaszkodjunk az (Intel) kód-kompatibilitáshoz ... nagy marhaság. Lehetne kereszt-fordítókat csinálni, ami az EXE fileból csinálna EX2-t, ami az adott, új gépi nyelvre fordítja át a cuccot, mindezt INSTALLÁLÁSKOR! Tehát egy Intel proci és 32 bites Win XP alá írt program installálása nem 5 perc lenne, hanem 3 óra, de utána egy másik oprendszerben, másik, hatékony, modern CPU-n is futna mint a nyúl!

Na, abbahagyom az álmodozást, és megyek dógozni az i5-750 es procimhoz! :-)
 
Válasz írásához előbb jelentkezz be!
1. bodomehesz... szila...
2012.10.01. 14:41
helyes
 
Válasz írásához előbb jelentkezz be!